cuda - 搜索 News

17 小时

近年来，人工智能（AI）领域的发展迅速，各种新技术层出不穷，其中自动化模型训练的工具尤其引人注目。最近，由SakanaAI推出的被称为「AI ...

15 小时

「将进化优化与LLM结合使用确实非常强大，但它也可能找到绕过验证沙盒的方法。幸运的是，我们的读者帮助测试了我们的CUDA内核，并发现系统找到了某种作弊方式。例如，系统在评估代码中发现了一个内存漏洞，在某些情况下，它能够绕过正确性检查。

1 天

DeepSeek并没有完全跳出英伟达的CUDA框架，而是选择绕过了CUDA的高层API，直接操作PTX指令集，进行更细粒度的硬件优化。这种做法本质上是在原有框架内寻求突破，而非彻底脱离英伟达的生态系统。为什么选择PTX？这到底是突破，还是妥协？为什么 ...

4 天

DeepSeek并未完全绕开CUDA，而是选择绕过了其高层API，直接操作PTX指令集进行底层优化。这种做法虽然能在一定程度上提升计算效率，但本质上仍依赖英伟达的硬件架构和指令集。PTX的优势在于提供了对GPU硬件的底层控制，但这种优化需要开发者具备 ...

机器之心报道编辑：张倩用 AI 提高 AI 的效率，它们就能变得像人类大脑一样高效？我们的大脑只用了 20 瓦的能量就能完成复杂思考，而现代 AI 系统却需要成排的高功率 GPU 和惊人的电力消耗。这种差距如何缩小？日本 AI 初创公司 Sakana ...

4 天

Transformer论文八位作者之一Llion Jones创立的Sakana AI发布重磅成果——全球首个「AI CUDA工程师」！它能将PyTorch代码自动转换为高度优化的CUDA内核，速度比PyTorch原生实现快10-100倍。

2 天

PhysX 技术在 64 位应用中仍然可以正常使用，例如在《蝙蝠侠：阿卡姆骑士》中，这表明英伟达并未完全放弃 PhysX 技术。但该公司确实已经停止了 RTX 50 系列显卡对 32 位 CUDA 的支持，未来可能还会进一步扩展这一决定。由于 ...

众所周知，为了限制中国AI发展，美国一直不准先进的AI芯片卖给中国。比如H100、A100就不准卖，导致英伟达阉割了H800、A800出来，后来美国禁令再次卡紧，连H800、A800也不准卖了。

每经AI快讯，华泰证券研究认为，DeepSeek在V3中使用了相比CUDA更底层的PTX 来优化硬件算法，PTX是CUDA编译的中间代码，在CUDA和最终机器码之间起到桥梁作用。而NSA则使用了OpenAl提出的Triton编程语言高效编写GPU代码 ...

他们开发的「AI CUDA 工程师」是这一理念的具体实践。「AI CUDA 工程师」是第一个用于全自动 CUDA 内核发现和优化的综合智能体框架。这种方法不仅 ...

来自MSN8 天

编辑：桃子好困【新智元导读】DeepSeek模型开发竟绕过了CUDA？最新爆料称，DeepSeek团队走了一条不寻常的路——针对英伟达GPU低级汇编语言PTX进行优化实现最大性能。业界人士纷纷表示，CUDA护城河不存在了？原本DeepSeek低成本训出的R1，就已经让整个硅谷和华尔街为之虎躯一震。

2 天

英伟达在其最新的RTX 50系列显卡中做出了一项重大调整，这一变化引起了游戏玩家和硬件爱好者的广泛关注。据最新消息，RTX ...

一些您可能无法访问的结果已被隐去。