cuda - 搜索 News

1 天

DeepSeek并没有完全跳出英伟达的CUDA框架，而是选择绕过了CUDA的高层API，直接操作PTX指令集，进行更细粒度的硬件优化。这种做法本质上是在原有框架内寻求突破，而非彻底脱离英伟达的生态系统。为什么选择PTX？这到底是突破，还是妥协？为什么 ...

13 小时

官方承认系统「作弊」，世界首个「AI CUDA工程师」翻车？o3-mini 11秒 ...

「将进化优化与LLM结合使用确实非常强大，但它也可能找到绕过验证沙盒的方法。幸运的是，我们的读者帮助测试了我们的CUDA内核，并发现系统找到了某种作弊方式。例如，系统在评估代码中发现了一个内存漏洞，在某些情况下，它能够绕过正确性检查。

4 天

全球首个AI CUDA工程师横空出世，PyTorch效率提升10-100倍！

最近，人工智能领域迎来了一项重大突破！日本AI初创公司SakanaAI团队成功开发出了全球首个AI CUDA工程师，这项技术不仅能将PyTorch的效率提升10-100倍，还展示了AI自我优化的巨大潜力。如果你也对AI技术感兴趣，这篇文章绝对不容错过 ...

腾讯网4 天

英伟达的CUDA，DeepSeek只“击穿”了50%

最近，关于DeepSeek是否能够绕开英伟达的CUDA框架的讨论，引发了广泛关注。这个问题的答案，不仅关乎DeepSeek的未来发展，更可能影响中国GPU产业能否在全球AI竞争中占有一席之地。英伟达的CUDA技术几乎垄断了全球的AI计算市场，国产GP ...

4 天

世界首个「AI CUDA工程师」诞生！AI自己写代码优化CUDA内核，性能狂飙 ...

Transformer论文八位作者之一Llion Jones创立的Sakana AI发布重磅成果——全球首个「AI CUDA工程师」！它能将PyTorch代码自动转换为高度优化的CUDA内核，速度比PyTorch原生实现快10-100倍。

腾讯网4 天

全球首个AI CUDA工程师来了！将PyTorch原生实现提速10-100倍

机器之心报道编辑：张倩用 AI 提高 AI 的效率，它们就能变得像人类大脑一样高效？我们的大脑只用了 20 瓦的能量就能完成复杂思考，而现代 AI 系统却需要成排的高功率 GPU 和惊人的电力消耗。这种差距如何缩小？日本 AI 初创公司 Sakana ...

2 天on MSN

RTX 50系列GPU放弃对32位CUDA支持，老显卡成PhysX游戏“救星”

IT之家 2 月 23 日消息，英伟达在其最新的 RTX 50 系列（Blackwell）显卡中停止了对 32 位 CUDA 应用的支持，多年来，对 PhysX 技术的支持也在逐渐减少。YouTube 博主 VerbalSilence 和一位 ...

腾讯网4 天

全球首个AI CUDA工程师来了！将PyTorch原生实现提速10-100倍

他们开发的「AI CUDA 工程师」是这一理念的具体实践。「AI CUDA 工程师」是第一个用于全自动 CUDA 内核发现和优化的综合智能体框架。这种方法不仅 ...

3 天

英伟达CUDA壁垒难破，DeepSeek绕道PTX能否突围？

DeepSeek并未完全绕开CUDA，而是选择绕过了其高层API，直接操作PTX指令集进行底层优化。这种做法虽然能在一定程度上提升计算效率，但本质上仍依赖英伟达的硬件架构和指令集。PTX的优势在于提供了对GPU硬件的底层控制，但这种优化需要开发者具备 ...

25 天

“DeepSeek 甚至绕过了英伟达 CUDA”，论文细节再引热议

来自 Mirae Asset Securities Research （韩国未来资产证券）的分析称，V3 的硬件效率之所以能比 Meta 等高出 10 倍，可以总结为“他们从头开始重建了一切”。在使用英伟达的 H800 GPU 训练 DeepSeek-V3 时，他们针对自己的需求把 132 个流式多处理器（SMs）中的 20 个修改成负责服务器间的通信，而不是计算任务。

知乎 on MSN10 天

DeepSeek绕开CUDA垄断，V3论文细节再挖出！英伟达护城河不存在了？

编辑：桃子好困【新智元导读】DeepSeek模型开发竟绕过了CUDA？最新爆料称，DeepSeek团队走了一条不寻常的路——针对英伟达GPU低级汇编语言PTX进行优化实现最大性能。业界人士纷纷表示，CUDA护城河不存在了？原本DeepSeek低成本训出的R1，就已经让整个硅谷和华尔街为之虎躯一震。

36氪26 天

“DeepSeek甚至绕过了CUDA”，工程师灵魂提问：英伟达护城河还在吗？

硬件媒体Tom‘s Hardware带来开年最新热议： DeepSeek甚至绕过了CUDA，使用更底层的编程语言做优化。这一次是DeepSeek-V3论文中的更多细节，被人挖掘出来。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果