资讯公告
Grok 3:下一代求真人工智能模型
发布时间:2025-02-19 发布者:域风网

Grok 3:下一代求真人工智能模型


xAI 周一发布了其 Grok 3 人工智能模型,以及图像分析和精炼问题解答等新功能。


该公司利用一个配备了约 20 万个 GPU 的巨大数据中心来开发 Grok 3。据xAI公司所有者埃隆-马斯克(Elon Musk)称,该项目使用的计算能力是其前身Grok 2的 “10倍”,数据集扩大了,据说包括法律案件档案信息。


马斯克声称,Grok 3 是一个 “最大限度地追求真理的人工智能,即使这种真理有时与政治正确相悖”。


Grok 3的推出包括针对不同需求设计的一系列型号。例如,Grok 3 mini 优先考虑的是更快的响应时间,而不是绝对的准确性。然而,尤其值得注意的是以推理为重点的 Grok 3 新型号。


这些变体被称为 Grok 3 Reasoning 和 Grok 3 mini Reasoning,旨在通过 “思考 ”问题来模拟类似人类的认知过程。与OpenAI的o3-mini和DeepSeek的R1等模型类似,这些推理系统试图对它们的反应进行事实检查,从而降低出错或失误的可能性。


Grok 3:基准结果


xAI 声称,Grok 3 在某些基准测试中超过了 OpenAI 的 GPT-4o,包括 AIME 和 GPQA,这两项测试评估了模型处理数学、物理、生物和化学复杂问题的能力。


Grok 3 的早期版本目前在 Chatbot Arena 上也处于领先地位,Chatbot Arena 是一个众包评估平台,用户可在该平台上对人工智能模型进行比拼,并对其输出结果进行排名。该模型是第一个突破 Arena 1400 分的模型。


根据 xAI 的数据,Grok 3 Reasoning 在各种著名基准测试中的表现均优于对手:


xAI 的 Grok 3 人工智能模型与谷歌、DeepSeek 和 OpenAI 的其他领先人工智能模型的推理基准测试结果对比。

这些推理模型已集成到 Grok 应用程序的功能中。用户可以选择 “思考 ”等命令,或激活计算密集型的 “大大脑 ”模式,以解决特别具有挑战性的问题。


xAI 将推理模型定位为 STEM(科学、技术、工程和数学)应用的理想工具,包括数学、科学和编码挑战。


防止人工智能蒸馏


有趣的是,并非 Grok 3 的所有内部流程都向用户公开。马斯克解释说,一些推理模型的 “思想 ”被有意遮蔽,以防止 “蒸馏”--一种有争议的做法,即相互竞争的人工智能开发者从专有模型中提取知识。


xAI 的新推理模型是 Grok 应用程序新功能 DeepSearch 的基础。该功能利用 Grok 模型扫描互联网和马斯克的社交平台 X,查找相关信息,然后合成详细的摘要,回答用户的询问。


访问Grok 3并承诺开源


最新 Grok 模型的访问权限目前与 X 的订阅层级挂钩。每月支付 50 美元(约合 41 英镑)的 Premium+ 用户将优先获得最新功能。


xAI 还将推出 SuperGrok 订阅计划,据说价格为每月 30 美元或每年 300 美元。SuperGrok 订阅者将受益于增强的推理能力、更多的 DeepSearch 查询和无限制的图像生成功能。


公司还预告了即将推出的功能。预计一周内,Grok 应用程序将推出语音模式,用户可以通过类似于 Gemini Live 的合成语音与人工智能互动。


马斯克还透露,计划在未来几周内通过企业就绪API发布Grok 3模型,其中包括DeepSearch功能。


尽管Grok 3还很新鲜,但xAI打算在未来几个月内将其前身开源。马斯克称,xAI将继续开源Grok的最后一个版本。


“马斯克解释说:"当Grok 3成熟稳定后,大概在几个月内,我们就会开源Grok 2。

购物车
业务咨询:
售后服务: