2月26日,阿里云智能集团副总裁、数据库产品事业部负责人李飞飞在2025阿里云PolarDB开发者大会上谈到对DeepSeek近日开源周相关发布的看法,他认为,随着DeepSeek的火爆,一个背后趋势是,AI的下半场竞争又回到了传统的系统领域,是分布式系统工程的事情。李飞飞表示,任何系统再往前演进,都有这样的必然趋势。李飞飞还预测,未来,大模型预训练一定是中心化和寡头化的,全世界可能只有几家。尤其 ...
2月26日,在开源周第三天,DeepSeek宣布开放高效的FP8 GEMM库DeepGEMM。这三天的发布内容都与算法相关,偏向技术层面。大模型生态社区OpenCSG创始人陈冉举例说,以前DeepSeek直接提供一个产品并说明其性能,现在则深入探讨实现高性能的具体方法和框架。这些“脚手架”的开源有助于后续生态建设。 此次发布的关键词是GEMM(通用矩阵乘法),这是一种线性代数中的基本运算。FP8 ...
近日,群核科技递交了港股招股书,正式向「全球空间智能领域第一股」发起冲击。这家在「杭州六小龙」中最早成立的公司,有望率先撞线,第一个迎来敲钟时刻。 十多年前,群核科技的三位创始人找到了这项技术的第一个商业落地场景:家装,推出了线上空间设计平台「酷家乐 ...
IT之家 2 月 26 日消息,AM4 平台还有新品,AMD 日前在官网发布了 6 款新的锐龙 5000G 处理器系列 —— 锐龙 5005G,这些处理器是 APU,带有集成显卡。 锐龙 5005G 系列仍基于 Cezanne 芯片,采用 ZEN 3 ...
总体来看,DeepGEMM的成功推出无疑是AI计算领域的一次技术革新突破。其简洁的代码设计和强大的性能优势,提升了用户的计算效率,对于需求日益增长的行业内人士而言,显得尤为重要。我们建议专业读者关注这一领域的动态,并在评论区分享您的看法和经验,共同探讨这一技术的未来走向与可能的应用场景。允许我们在此呼吁:关于DeepGEMM和其后续产品的市场表现,不妨大胆预测,或许在不久的将来,它将会是行业内一个 ...
在科技快速进步的今天,2月26日,DeepSeek带来了令人关注的新举措:他们宣布开源了支持稠密和MoE(混合专家)模型的DeepGEMM计算库。这个新库的核心代码精简至300行,但其在性能上的表现却十分惊人,甚至在某些情况下超越了那些经过专家调优的计算库,可以说是将GPU的性能潜力榨取得淋漓尽致。
一直以来,绘制这些甲烷云层图都是一项缓慢而繁重的工作。AI 则改变了这一局面,一个来自 NASA、加州大学伯克利分校和法国宇宙科学观测所的团队已经取得了突破性进展。 通过使用 NVIDIA ...
02/26 10:24 关注新茶饮行业趋势,了解各品牌产品上新信息。  来自北京市 近日,有消息称,国产GPU独角兽壁仞科技考虑港股IPO,正与中金公司、中银国际和平安证券就潜在IPO交易合作,拟募资3亿美元(约合人民币22亿元),有可能在今年登陆香港资本市场。但也有消息称,壁仞科技IPO规模和时间等细节或发生变化,最终也可能搁置IPO。 针对该报道,壁仞科技对创投日报记者表示:不予置评。 此次赴 ...
IT之家 2 月 26 日消息,半导体 IP 企业 Imagination 当地时间昨日宣布推出其 D 系列 GPU IP 的最终版本 DXTP,宣称 DXTP 相较此前的 DXT 在常用图形工作负载中能效提升了 20% 。
AMD近期推出了一项限时促销活动,旨在吸引广大游戏爱好者。该活动宣布,凡是在指定时间段内购买AMD Ryzen 7000系列、Ryzen 9000系列CPU或Radeon RX 7000系列桌面显卡的用户,将有机会免费获得即将面世的热门游戏《怪物猎人:荒野》。
DeepGEMM是一个专为干净、高效的FP8通用矩阵乘法(GEMM)而设计的库,具有细粒度扩展功能,如DeepSeek-V3中所述。它支持普通和混合专家(MoE)分组GEMM。该库用CUDA编写,在安装过程中无需编译,而是使用轻量级即时(JIT)模块 ...
2月24日,DeepSeek发布首个开源项目FlashMLA,该项目适用于Hopper GPU的高效MLA解码内核。有观点认为,目前限制DeepSeek推理的主要瓶颈就是显存,FlashMLA则是“以算代存”。PPIO派欧云王闻宇指出,DeepSeek模型与其他主流模型相比参数量更大,决定了其需要更大容量显存以加载模型权重,显存容量是门槛,不是瓶颈。