GitHub Io - 搜索 News

GitHub20 天

clash-verge/clash-verge.github.io

圣诞元旦 8 折优惠限时活动-有效期至2025/1/10 23:59，全场 8 折优惠券: 2025，购买订阅时,优惠券填写 2025 并验证,可获得八折 ...

GitHub5 天

free-v2ray/free-v2ray.github.io

圣诞元旦 8 折优惠限时活动-有效期至2025/1/10 23:59，全场 8 折优惠券: 2025，购买订阅时,优惠券填写 2025 并验证,可获得八折 ...

来自MSN4 天

报名 | CVPR'25首届具身智能「通用机器人操作研讨会和挑战赛」正式启动

GRAIL Workshop 投稿量子位 | 公众号 QbitAI 计算机视觉与模式识别会议（CVPR）作为全球计算机视觉与人工智能领域最具影响力的顶级学术会议，将于2025年6月11日至15日在美国田纳西州召开。

腾讯网4 天

2024 IBM博士生奖学金出炉：韩迟、卓越、张逸骅、冯尚彬等AI研究者入选

机器之心报道机器之心编辑部清华、浙大、西南大学、西安交大、华中科技大学、台湾大学…… 多位 2024 IBM 博士生奖学金获得者毕业于国内高校。其中有你的校友吗？IBM 博士生奖学金（IBM PhD Fellowship Awards）刚刚公布了 ...

2 小时

谷歌超硬核教科书来了，Jeff Dean带货揭Gemini训练秘籍：在TPU上scaling

谷歌团队发布LLM硬核技术教科书，从「系统视图」揭秘LLM Scaling的神秘面纱。Jeff Dean强调书中藏着谷歌最强AI模型Gemini训练的更多信息。由于深度学习的「黑箱」本性，从业者自我调侃道： ...

15 天

反超 DeepSeek-V3，新发布的 Qwen2.5-Max 到底有多牛？

春节假期期间，除了万众瞩目的 DeepSeek 之外，还有一款模型的发布也不容忽视，它就是 Qwen2.5-Max。该模型采用 MoE 架构，预训练数据量达 20 万亿 tokens，基座模型在 11 ...

13 小时

慢思考助力医学大语言模型突破数据瓶颈：上海交大联合上海AI Lab ...

MedS3 的核心在于其独特的自我进化框架。研究者首先利用蒙特卡洛树搜索（MCTS）技术，基于基础策略模型生成可验证的推理链。在推理链的每一步，都会基于这一步的正确性赋予一个展开值，通过这些经过验证的轨迹来训练策略模型和过程奖励模型（PRM）。

腾讯网2 天

英伟达视频模型Magic 1-For-1，1 分钟生成 1 分钟视频，且开源

作者｜子川来源｜AI先锋官开源的风终于吹到了AI视频生成领域。近日，英伟达联合北京大学和 Hedra Inc三方联合开源了一款全新的AI视频生成模型 Magic 1-For-1，其主要特点就是“生成速度超快”。Magic 1-For-1 ...

17 小时

机器人视觉控制新范式！ByteDance Research新算法实现通过性能SOTA

世界模型（World ...

4 天

模型预训练模式“变天”？Meta推出预训练框架，训练token减少21.5%

近日，通过结合“预测下一个 token”概念与连续概念，Meta 提出一款名为“连续概念混合（CoCoMix，Continuous Concept Mixing）”的预训练框架。（注：连续概念，指的是连续思维链技术，这是一种旨在提升模型推理能力的方法 ...

来自MSN2 天

Llama都在用的RoPE有了视频版，复旦上海AI Lab等提出长视频理解/检索 ...

VideoRoPE团队投稿量子位 | 公众号 QbitAI Llama都在用的RoPE（旋转位置嵌入）被扩展到视频领域，长视频理解和检索更强了。复旦大学、上海AI实验室等提出VideoRoPE，并确定了将RoPE有效应用于视频所需的四个关键特性。在长视频检索、视频理解和视频幻觉等各种下游任务中，VideoRoPE始终优于先前的RoPE变体。用三维结构保留时空关系 RoPE是一种能够将相对位 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果