英伟达Dynamo软件助力DeepSeek AI提速30倍,加速AI工厂落地
在3月18日的 GTC 大会上,英伟达首席执行官黄仁勋宣布了一项重大举措:通过全新推出的 Dynamo 软件,将 DeepSeek 的人工智能处理速度提升高达30倍。此举可视为英伟达对DeepSeek公司R1人工智能程序在市场上引发的反响的积极回应。 DeepSeek 的技术旨在大幅降低每次查询所需的计算量,一度引起投资者对英伟达未来前景的担忧。
英伟达的 Dynamo 软件能够将 AI 推理任务分配到多达1000个 GPU 上进行并行处理,从而极大地提升查询吞吐量。 黄仁勋强调,借助最新的 Blackwell 芯片,Dynamo 能够在相同的架构下提供高达30倍的处理能力。这种性能的提升使得 AI 数据中心能够在每秒内处理更多的 tokens,从而有效提高整体收入。
具体而言,Dynamo 软件能够以每百万个 tokens 1美元的价格,显著提升每秒的处理量。这意味着服务提供商可以选择同时处理更多客户的查询需求,或是为单个用户提供更强大的服务,进而收取更高的费用。英伟达将这种高性能的 AI 服务定义为 “AI 工厂”。
为了进一步优化 DeepSeek 的性能,英伟达还在 HuggingFace 上发布了经过调整的 DeepSeek R1 版本。 这一版本采用了更少的计算位数,即 “FP4”,从而在不显著降低模型准确性的前提下,大幅提升了性能表现。
英伟达发布Blackwell芯片和DGX Spark
除了 Dynamo 之外,英伟达还推出了新版本的 Blackwell 芯片 “Ultra”,进一步提升了内存容量和整体性能。 此外,英伟达还正式发布了专为 AI 开发者设计的小型个人计算机 DGX Spark,并对 DGX Station 桌面计算机的配置进行了升级。
在此次大会上,英伟达还展示了多项创新产品和合作项目,其中包括改进的网络交换机和适用于医疗机器人的软件模型,充分展现了英伟达在 AI 和计算领域持续创新的强大实力。
总结
英伟达通过推出Dynamo软件、优化DeepSeek R1版本以及发布新款硬件产品,展现了其在AI领域的强大实力和持续创新能力,旨在加速AI工厂的落地,并提升AI服务的效率和性能。
点击详情查看《DeepSeek:深度求索AI大模型》