圣诞 元旦 8 折优惠 限时活动-有效期至2025/1/10 23:59,全场 8 折优惠券: 2025,购买订阅时,优惠券填写 2025 并验证,可获得八折 ...
圣诞 元旦 8 折优惠 限时活动-有效期至2025/1/10 23:59,全场 8 折优惠券: 2025,购买订阅时,优惠券填写 2025 并验证,可获得八折 ...
GRAIL Workshop 投稿量子位 | 公众号 QbitAI 计算机视觉与模式识别会议(CVPR)作为全球计算机视觉与人工智能领域最具影响力的顶级学术会议,将于2025年6月11日至15日在美国田纳西州召开。
机器之心报道机器之心编辑部清华、浙大、西南大学、西安交大、华中科技大学、台湾大学…… 多位 2024 IBM 博士生奖学金获得者毕业于国内高校。其中有你的校友吗?IBM 博士生奖学金(IBM PhD Fellowship Awards)刚刚公布了 ...
谷歌团队发布LLM硬核技术教科书,从「系统视图」揭秘LLM Scaling的神秘面纱。Jeff Dean强调书中藏着谷歌最强AI模型Gemini训练的更多信息。 由于深度学习的「黑箱」本性,从业者自我调侃道: ...
春节假期期间,除了万众瞩目的 DeepSeek 之外,还有一款模型的发布也不容忽视,它就是 Qwen2.5-Max。 该模型采用 MoE 架构,预训练数据量达 20 万亿 tokens,基座模型在 11 ...
MedS3 的核心在于其独特的自我进化框架。研究者首先利用蒙特卡洛树搜索(MCTS)技术,基于基础策略模型生成可验证的推理链。在推理链的每一步,都会基于这一步的正确性赋予一个展开值,通过这些经过验证的轨迹来训练策略模型和过程奖励模型(PRM)。
作者|子川来源|AI先锋官开源的风终于吹到了AI视频生成领域。近日,英伟达联合北京大学和 Hedra Inc三方联合开源了一款全新的AI视频生成模型 Magic 1-For-1,其主要特点就是“生成速度超快”。Magic 1-For-1 ...
世界模型(World ...
近日,通过结合“预测下一个 token”概念与连续概念,Meta 提出一款名为“连续概念混合(CoCoMix,Continuous Concept Mixing)”的预训练框架。(注:连续概念,指的是连续思维链技术,这是一种旨在提升模型推理能力的方法 ...
VideoRoPE团队 投稿量子位 | 公众号 QbitAI Llama都在用的RoPE(旋转位置嵌入)被扩展到视频领域,长视频理解和检索更强了。 复旦大学、上海AI实验室等提出VideoRoPE,并确定了将RoPE有效应用于视频所需的四个关键特性。 在长视频检索、视频理解和视频幻觉等各种下游任务中,VideoRoPE始终优于先前的RoPE变体。 用三维结构保留时空关系 RoPE是一种能够将相对位 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果