
NVIDIA 收购了 SchedMD,后者是 Slurm 的开发商,Slurm 是一款流行的用于 HPC 和 AI 工作负载的开源调度器。NVIDIA 收购 SchedMD 的目的是为了支持研究人员、开发人员和企业的创新,并加强其开源软件生态系统。
该公司计划将 Slurm 保持为开源、与硬件无关的工具,以确保研究人员和人工智能开发人员能够广泛使用它。
开源工具的投资。该公司与 SchedMD 已密切合作超过十年,如今,通过此次收购,英伟达将继续投资 Slurm。
Slurm(全称为 Simple Linux Utility for Resource Management,简单 Linux 资源管理实用程序)长期以来一直是超级计算的重要组成部分。目前,全球 TOP500 超级计算机中超过一半都使用了 Slurm,它能够调度复杂的并行计算任务,并允许在数千个 CPU 和 GPU 之间分配资源。
通过集成 SchedMD,NVIDIA 获得了高性能计算 (HPC) 和人工智能 (AI) 软件栈中这一关键部分的控制权,将硬件加速(通过 NVIDIA 的 Blackwell GPU 和 InfiniBand 网络)与复杂的作业调度和资源编排连接起来。这种集成将提升从训练大型语言模型到运行关键科学模拟等各项任务的性能。
SchedMD首席执行官Danny Auble就此次收购发表讲话,他表示:“我们很高兴能与NVIDIA携手合作,此次收购是对Slurm在世界最苛刻的高性能计算和人工智能环境中发挥关键作用的最终认可。NVIDIA在加速计算领域的深厚专业知识和投入将促进Slurm的开发——Slurm将继续保持开源——以满足下一代人工智能和超级计算的需求。”
英伟达还断言:“Slurm 支持最新的英伟达硬件,也是生成式人工智能所需的关键基础设施的一部分,基础模型开发人员和人工智能构建者使用它来管理模型训练和推理需求。”
这家人工智能芯片制造商势必会将 SchedMD 的应用范围扩展到新的系统,使客户能够更高效地管理其整个基础架构中的工作负载。此外,此次集成还将使客户能够更好地协调不同硬件和软件类型的工作负载,同时受益于 Slurm 的持续创新。
该公司还计划继续为 SchedMD 的广泛客户群(涵盖云、人工智能、制造和研究机构)提供开源软件服务和培训,以支持 Slurm。
周一,英伟达发布了新一代开源人工智能模型,旨在比上一代产品更快、更高效、功能更强大,以应对中国类似产品的激增。该公司发布了最新的Nemotron 模型,适用于写作和软件开发等应用场景,首发产品为Nemotron 3 Nano。据这家芯片制造商称,新款Nano模型在降低成本的同时,提高了长时间、高负载工作的准确性。
与此同时, Meta正在考虑转向闭源模型,这可能使英伟达成为美国最知名的开源人工智能供应商之一。迄今为止,出于安全考虑,美国多个州和政府机构已禁止使用中国的人工智能系统。这些机构大多声称,中国模型正被用于该国的军事和情报行动中。
尽管如此,英伟达生成式人工智能dent 卡里·布里斯基强调,公司致力于为用户提供值得信赖的模型,并公开训练数据和工具,用于安全测试和定制。布里斯基指出:“这就是我们从软件工程角度致力于此的原因。”
该公司宣布推出开源人工智能模型后,股价甚至上涨了 1.35%。
如果您正在阅读本文,那么您已经领先一步了。请持续关注我们的新闻通讯。