gpu - 搜索 News

芯智讯 on MSN3 小时

随着国产AI大模型DeepSeek的持续火爆，DeepSeek官方服务器一直是超负荷，已经无法满足庞大的用户需求。特别是对于数据隐私安全及有着二次训练需求企业级用户，已经开始纷纷在本地部署满血版DeepSeek大模型。这也直接带动了市场 ...

6 小时

但真的是这样吗？随着国产deepseek的发展，目前英伟达以及美国AI界，最担心的事情发生了，那就是国产GPU芯片加上deepseek的一体机全面大爆发了，完全不依赖于英伟达的显卡，以及英伟达的cuda生态。

4 小时

尽管ROP缺失对用户体验的影响较小，仅表现为个位数的性能下降，但这一问题的潜在风险不容忽视。随着时间推移，硅片退化可能导致更多问题。对此，英伟达已承诺为受影响用户更换GPU，但由于供应链紧张，更换流程可能会耗时较长。

6 小时on MSN

IT之家 2 月 26 日消息，半导体 IP 企业 Imagination 当地时间昨日宣布推出其 D 系列 GPU IP 的最终版本 DXTP，宣称 DXTP 相较此前的 DXT 在常用图形工作负载中能效提升了 20%。 Imagination ...

4 小时

Imagination Technologies (“Imagination”)宣布推出其最新的GPU IP——Imagination ...

8 小时

DeepGEMM是一个专为干净、高效的FP8通用矩阵乘法（GEMM）而设计的库，具有细粒度扩展功能，如DeepSeek-V3中所述。它支持普通和混合专家（MoE）分组GEMM。该库用CUDA编写，在安装过程中无需编译，而是使用轻量级即时（JIT）模块 ...

如果说传统的 AI 训练中，GPU 跑了 10 个小时，4 个小时在等数据、等同步，实际工作时间只有 6 小时。那么 DeepEP，能够把等待时间压缩到 1 小时，GPU 干活 9 小时，相当于多了 3 小时算力，真正「榨干」每一块 GPU。

DeepSeek今天正式启动为期五天的开源成果发布计划，首个亮相的项目是FlashMLA。这一开源项目将先进的MLA算法与GPU优化技术相结合，为大模型推理提供了一套高性能、低延迟的解码方案。FlashMLA是一款专门为Hopper ...

1 天

据悉，Imagination对D系列GPU进行了多项改进，使其在处理计算任务方面表现更加卓越，包括扩展了支持的数字格式范围，并将工作组项目的设置速率提升了16倍。与DXT相比， ...

9 小时

【CNMO科技消息】近日，AMD宣布了一项限时优惠活动，凡购买指定的Ryzen 7000、Ryzen 9000系列CPU或Radeon RX ...

2 天on MSN

近日，知名的显卡检测工具GPU-Z迎来了其2.63版本的更新，此次更新由TechPowerUp团队精心打造，不仅新增了对最新显卡的支持，还修复了用户反馈的两大问题。值得注意的是，GPU-Z 2.63版本率先纳入了对RTX 5070 Ti和RX ...

据介绍，这是DeepSeek针对Hopper GPU优化的高效MLA解码内核，专为处理可变长度序列而设计，现在已经投入生产使用。“在H800上能实现3000 GB/s 的内存 ...

当前正在显示可能无法访问的结果。