
乌克兰正在利用谷歌的技术构建自己的大型语言模型(LLM)。该大型语言模型将经过训练,以准确理解乌克兰的语境、方言和少数民族语言。
训练将首先在谷歌的基础设施上进行,然后再转移到本地服务器。官方预计系统上线初期会遭受网络攻击,并正在准备防御措施,以应对诸如快速注入等威胁。
乌克兰正在利用谷歌的开源Gemma框架开发大型语言模型。该国的目标是创建一个完全dent 人工智能系统,用于军事和民用领域。
乌克兰数字部和移动运营商Kyivstar周一宣布了该项目。该项目将利用谷歌的计算基础设施进行初始训练,之后将完全转移到本地基础设施,以确保乌克兰对其2300万公民每天可以访问的人工智能系统拥有完全的控制权。
据路透社报道,知情人士 Meta公司的Llama和法国的Mistral人工智能模型也曾是备选方案之一
该项目还拒绝了DeepSeek在内的中文语言模型
乌克兰军方已将人工智能工具应用于空中和卫星侦察、无人机作战和战场分析。
乌克兰数字化转型部副部长奥列克桑德·博尔尼亚科夫解释说,避免依赖像 OpenAI 的 ChatGPT 这样的系统是有意为之,因为乌克兰武装部队计划将人工智能集成到战场管理系统中,用于部队协调和敌情监控。
该项目的部分原因在于当前人工智能系统面临的沟通障碍。博尔尼亚科夫注意到,现有的人工智能系统难以处理他家乡敖德萨州博尔赫拉德的方言,那里使用的方言是乌克兰语、俄语和保加利亚语的混合语。
负责该项目的 Kyivstar 首席产品官米沙·内斯托尔 (Misha Nestor) 指出,法律文件中的翻译错误和人工智能生成的错误等问题十分突出。四个咨询委员会将分别负责新模型的技术、法律、文化、历史和语言方面,确保其能够处理乌克兰语、克里米亚鞑靼语等少数民族语言以及俄语。
数据收集工作正从包括法院登记处、教育出版机构、地区档案馆以及俄罗斯在持续战争期间行动记录在内的90多个政府机构进行。这一全面的数据集将使人工智能能够比通用全球模型更好地理解乌克兰的语境和术语。
数字转型部专家表示,Gemma 是目前规模和质量最高的开源模型之一,在性能和资源利用之间实现了稳定的平衡。该模型的多语言支持已包含乌克兰语,其扩展的分词器最多可处理 128,000 个词元,并支持文本和图像的多模态处理。
训练将在乌克兰境外由谷歌之后最终模型才会部署到本地数据中心。这是乌克兰应对俄罗斯持续袭击乌克兰基础设施威胁的解决方案。
博尔尼亚科夫表示,官员们预计该系统发布后会立即遭到攻击。团队正在开发针对各种网络威胁的防护措施,包括快速注入攻击,即在人工智能的任务中嵌入恶意指令。
由于俄罗斯持续袭击乌克兰能源基础设施,基辅之星已安装了超过3500台备用发电机以稳定运营。截至9月,这家电信公司拥有超过2250万移动用户和超过120万固定互联网用户。
立即注册 Bybit,即可免费获得 50 美元