资讯

这一次开源不仅是口头承诺。文心 4.5系列总共包括10个变体,从轻量级的3亿参数模型,到最多可激活47个专家、总参数达到4240亿的MoE模型应有尽有。
MIT和马德里理工大学这一研究论文已被《空间研究进展》(Journal of Advances in Space Research)接收,即将发表。 这是一类基于广受欢迎的《Kerbal Space Program》电子游戏的试验场,让研究社区在一个 ...
有个差点就被骗到的Igor Zalutski小哥说,这个老哥看起来非常敏锐,而且不说废话,幸好周末做了背调,得知他不仅同时做很多工作、还谎报签证状态啥的。 Suhail ...
大模型竞技场秘密上线了一个叫steve的神秘模型,在对话中透露自己来自DeepSeek。 DeepSeek-R2,终于要来了? 大模型竞技场秘密上线了一个叫steve的神秘模型,在对话中透露自己来自DeepSeek。
事实上马斯克已经小范围这样试验过了,5月份,Grok在回答各种不相关的问题时都会随机提到“南非发生白人种族灭绝”的说法,并且承认自己被指示接受这个非真实发生的事件。 此次融资的参与者包括Valor Equity Partners 、Vy ...
随着ChatGPT的一路走红,研究人员反而陷入困扰,面对GPU短缺、数据库连接耗尽、服务商速率限制导致的系统宕机,他们创建了“fail whale”页面,通过生成一首由GPT-3完成的诗歌自我调侃,提醒用户:我们宕机了!
AI软件供应链正在迅速扩展,不仅包括开源开发工具,还涵盖了开发者共享定制模型、智能体、提示词及其他资源的协作平台。随着第三方AI组件和服务使用的增加,安全威胁也随之扩大——这种威胁在许多方面可能比传统软件供应链问题更为复杂、隐蔽且有害。
毕竟,以 Alpha 为结尾的命名方式不止一次传出是来自 OpenAI 的模型。比如此前 OpenRouter 上线的两款神秘模型 Optimus Alpha、Optimus Alpha 都被怀疑出自 OpenAI。因为它们的风格与 OpenAI ...
研究人员也总结了4项关键发现:偏见驱动的合理化与动机性推理、隐性错误纠正(Silent Error Correction)、不忠实的非逻辑捷径(Unfaithful Illogical Shortcuts)、填充词元 (Filler Tokens)。
研究人员解释说:“在我们的实验中,模型经过微调以输出不安全的代码,但不对用户公开这一点。” “由此产生的模型在一系列与编码无关的提示上表现出不一致的行为:它断言人类应该被 AI ...
据了解,这是首次理论证明强化学习在 LLM 中的有效性。广泛实验验证了这一理论,表明这种内源性奖励不仅优于现有的 LLM-as-a-judge 方法,而且可以超越那些通过昂贵的人类标注数据显式训练的奖励模型的表现。
我们在做的是非常通用的技术,它会被各种各样的人使用。和很多公司不同的是,别的公司通常从一个特定用户类型出发,用技术来解决这个群体的问题;而我们更多是从技术出发,观察谁能从中找到价值,然后再围绕这些用户进行迭代。