在人工智能技术飞速发展的当下,基准测试一直是评估不同AI模型性能的关键手段,然而,这一领域却因争议而呈现出波澜。最近,由埃隆·马斯克创办的xAI公司发布了其最新的AI模型Grok 3,引发了广泛关注和质疑,尤其是OpenAI的反驳让这一事件更加引人入胜。
10 小时on MSN
近日,AI领域掀起了一场关于基准测试结果真实性的风波。争议的焦点集中在埃隆·马斯克旗下的xAI公司最新发布的AI模型Grok 3上。一名OpenAI员工对xAI公司公布的Grok 3在AIME 2025基准测试中的表现提出了质疑,认为其测试结果具有误导性。
IT之家 2 月 23 日消息,本周,OpenAI 的一名员工公开指责埃隆・马斯克旗下的 xAI 公司,称其发布的最新 AI 模型 Grok 3 的基准测试结果具有误导性。对此,xAI 的联合创始人 伊戈尔 ・巴布什金(Igor ...
整理|冬梅1 马斯克确认将发布 Grok 3,已进入最后阶段 最近几个月,全球的聚光灯都在追着 DeepSeek 走,该模型被认为有可能使先进人工智能技术的使用更加民主化。但与此同时,其他 AI 玩家也没有闲着。OpenAI 紧急推出了 ...
【新智元导读】 猜想界的皇冠——黎曼猜想,离被证明的那一天不远了。Grok 3便是关键所在:暴力计算+验证器能让AI穷举所有解法,再加上AI辅助科学家打出的组合拳,下一个诺奖级突破近在咫尺。
马斯克口中全世界最聪明大模型Grok-3,终于震撼登场!20万块GPU训出的模型,实属全球首次。果然,Grok-3已火速屠榜多个排行榜,击败o3-mini(high)和DeepSeek-R1。
5 天
来自MSN马斯克xAI发布Grok-3,能否超越OpenAI引关注!在北京时间的某个晴朗午后,科技界迎来了一则震撼人心的消息:马斯克麾下的AI创新企业xAI,正式揭晓了其倾力打造的最新一代人工智能大语言模型——Grok-3。这一发布,标志着人工智能领域又迈出了历史性的一步。
4 天
来自MSN马斯克xAI发布Grok-3,能否超越OpenAI成新霸主?周二,科技界迎来重大突破,埃隆·马斯克旗下的AI创新企业xAI,正式揭晓了其最新研发的人工智能大语言模型——Grok-3。这一发布标志着人工智能技术的又一次飞跃。 作为xAI倾力打造的第三代AI产品,Grok-3在发布前便备受瞩目。马斯克在预告中豪言 ...
整理 | 苏宓出品 | CSDN(ID:CSDNnews)当前,“内卷”再次席卷各大科技公司。一方面,商业公司纷纷将最新最强的大模型接入应用场景,比如微信推出了 AI 搜索,还接入了 DeepSeek R1 模型,而百度搜索也接入了 DeepSeek ...
随后,OpenAI应用研究主管Boris Power更是丝毫不留情面,「看到Grok团队在评估中作弊和欺骗的动机,真令人失望。简而言之,o3-mini在每个评估中都优于Grok-3。Grok-3确实是一个不错的模型,但没有必要过度宣传」。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果