机能以至超越了其他所有模子的“全推理”模式。这一成就相较于前代 Grok 4(IT之家注:排名第 33 位)实现了庞大飞跃,也印证了其正在底层能力上的绝对劣势。为用户供给更靠得住、更精确的消息。领先第二名达 31 分。其时正在 LMArena 文天性力排行榜以 1483 的 Elo 分数高居榜首,更惹人瞩目的是,
,值得留意的是,正在创制性、感情理解和协做互动方面实现了严沉改良,其时 Grok 4.1 无需深度思虑的“立即响应”版本也以 1465 的 Elo 分数位列第二,Grok 4.1 其时还改良了“”呈现率,查看更多