
路透12月17日 - 据消息人士透露,Alphabet GOOGL.O旗下谷歌正在推进一项新计划,以提升其人工智能(AI)芯片在运行全球最常用的 AI 软件框架 PyTorch 时的性能,此举旨在削弱Nvidia(辉达/英伟达) NVDA.O在 AI计算市场的长期主导地位。
该举措是谷歌雄心勃勃的计划的一部分,该计划旨在推动其张量处理单元(TPU)成为Nvidia在市场上领先的图形处理器(GPU)的有力竞争对手。TPU 销售已成为谷歌云收入的关键增长引擎,谷歌希望向投资者证明其 AI 投资正在产生回报。
但仅靠硬件不足以推动采用。消息人士称,这项内部代号为“TorchTPU”的新计划旨在消除阻碍 TPU 芯片普及的关键障碍,使其与 PyTorch 完全兼容,并为已使用 PyTorch 构建系统的客户提供更友好的开发体验。一些消息人士表示,谷歌还考虑将部分软件开源,以加快客户采用速度。
消息人士称,与此前支持 PyTorch 在 TPU 上运行的尝试相比,谷歌在 TorchTPU 上投入了更多组织资源和战略重视,因为希望采用TPU芯片但认为软件栈是瓶颈的公司的需求不断增长。
PyTorch 是一个由 Meta Platforms META.O大力支持的开源项目,是开发 AI 模型的最常用工具之一。
Nvidia的工程师们多年来一直致力于确保使用 PyTorch 开发的软件在其芯片上运行得尽可能快且高效。相比之下,谷歌长期以来一直让其内部软件开发团队使用名为 Jax 的另一种开发框架,其 TPU 芯片则依赖名为 XLA 的工具来高效运行该代码。谷歌自身的大部分 AI 软件栈和性能优化都是围绕 Jax 构建的,这进一步拉大了谷歌芯片与客户需求之间的差距。
谷歌云发言人没有对该项目的具体细节发表评论,但向路透证实,此举将为客户提供更多选择。
该发言人表示:“我们看到市场对 TPU 和 GPU 基础设施的需求都在大幅加速增长。我们的重点是为开发者提供所需的灵活性和规模,无论他们选择哪种硬件进行构建。”(完)