路透台北3月10日 - 台湾鸿海2317.TW周一表示,该公司已推出其首个大语言模型,并计划利用该技术改进制造和供应链管理。
这家全球最大的电子产品代工制造商在一份声明中说,这个名为 "FoxBrain"的模型是用 120 个 Nvidia(辉达/英伟达) NVDA.O的H100图形处理器(GPU) 训练出来的,大约在四周内完成。
鸿海为苹果AAPL.O 组装 iPhone ,同时也生产 Nvidia 的人工智能服务器。该公司表示,该模型基于 Meta META.O的 Llama 3.1 架构。
它是台湾第一个具有推理能力的大语言模型,针对传统中文和台湾语言风格进行了优化。
鸿海表示,虽然与中国 DeepSeek 的蒸馏模型相比性能略有差距,但其整体性能已非常接近世界级标准。
FoxBrain 最初设计用于内部应用,涵盖数据分析、决策支持、文档协作、数学、推理、问题解决以及代码生成。
鸿海表示,它计划与技术伙伴合作,扩大该模型的应用范围,共享其开源信息,并推动人工智能在制造、供应链管理和智能决策中的应用。
鸿海表示,Nvidia 通过其位于台湾的超级计算机 "Taipei-1"提供支持,并在模型培训期间提供技术咨询。
"Taipei-1"是台湾最大的超级计算机,由Nvidia在高雄持有和运营。
鸿海将在 3 月中旬举行的 Nvidia GTC 开发者大会上公布该模型的更多细节。(完)