tradingkey.logo

除了 Gemini 3,全球大模型也迎来集体升级

TradingKey2025年11月27日 10:22

TradingKey - 本月是ai竞争尤为残酷的一个月,谷歌的TPU新进展似乎让市场暂时忘记了AI泡沫。但是,AI大模型不止谷歌gemini3,全球的大模型在本月持续发布了新的版本。

底层架构端:Gemini 3 打破英伟达依赖

目前市场最受瞩目的新模型无疑是谷歌的 Gemini 3。它的最大突破在于硬件架构上完全摆脱对英伟达 GPU 的依赖,转而全面采用谷歌自研的 TPU(Tensor Processing Unit)。

Gemini 3 的升级模式也与以往完全不同。这一次,谷歌并非在现有基础设施上进行“微调”或“叠代”,而是彻底更换底层架构。

在模型训练流程上,Gemini 3 的路径也区别于传统大模型——如 GPT 系列与 Llama 等通常依赖单一超大 GPU 集群、海量文本预训练与有限人类指令微调的方式。谷歌此次引入了全新的 “Mixture-of-Experts(专家协作)”架构:每个任务会自动分配给最匹配的子网络(专家)处理,从而显著提高训练的针对性与计算效率。

从本质上看,Gemini 3 更像是一套结合“基础学习 + 专业分工 + 实战演练”的混合体系。凭借自研 TPU 硬件与分布式并行算法的结合,谷歌成功将AI模型推向了更贴近真实世界应用的“通用智能”阶段,超越了以往大模型严格依赖大算力堆叠的训练套路。

根据第三方机构 Artificial Analysis 的最新综合评分,Gemini 3 Pro 以显著优势排名第一,比 GPT‑5.1 高出 3 分。 这是谷歌自进入语言模型领域以来,首次以绝对优势登顶全球榜首,也意味着OpenAI长期的领先神话被正式打破。

ai-agent-tradingkey模型层面:Anthropic 推出 Claude Opus 4.5 强势突围

被视为 OpenAI 与 谷歌 最有力竞争对手的 Anthropic,近日发布了旗舰AI模型最新版本—— Claude Opus 4.5。

官方介绍称,新模型在执行日常任务上的表现 “显著更强”。尤其在“代理式编程(Agentic Coding)”领域,Claude Opus 4.5 达到行业领先水准。根据软件能力评测集 SWE‑Bench Verified 的结果,其得分优于 Gemini 3 Pro 与 GPT‑5.1。

ai-agent-tradingkey

与 OpenAI 不同的是,Anthropic 并未投入大量资源开发图像或视频生成等重算力领域,而是聚焦于编码能力优化与企业自动化部署,尤其强调在程序编译、集成和任务执行等方面的落地实用性,而非人机交互对话功能。目前,该公司已为超过 30 万家企业用户提供服务。

在AI编程生态中,Anthropic 已成为不可忽视的力量。上周,微软英伟达共同宣布对Anthropic投资数十亿美元,公司估值跃升至约 3,500 亿美元。合作协议中最受瞩目的部分,是微软 Azure AI Foundry 的客户可直接访问 Claude 系列模型——这使 Claude 成为全球唯一同时部署在三大云平台(Azure、AWS、Google Cloud) 的前沿大模型。

值得一提的是,Anthropic 也在显著扩大 TPU 的使用。根据报道,公司签署了一项价值数十亿美元的长期云合作协议,未来将使用高达“一百万颗 TPU”,总价值或达“数百亿美元”。这不仅反映出其与谷歌的算力合作关系,也说明外部前沿AI开发者已普遍认可谷歌TPU的性能与成本优势。

根据 Menlo Ventures 7月发布的报告,Anthropic 在企业级 AI 采用率中位居第一,占 32% 市场份额;OpenAI 以 25% 居次(较两年前几乎腰斩),谷歌 20%,Meta 9%。

应用端:OpenAI GPT‑5.1 强化生态布局

长期以来,OpenAI 一直稳居行业“最聪明模型”的头衔。其愿景是创造造福全人类的通用人工智能(AGI),并以“大而全”的战略路线巩固行业主导:产品组合更丰富、组织体系更庞大。

11 月 22 日,OpenAI 正式发布GPT‑5.1。资深AI使用者普遍认为,该版本较前代“明显更智能”。

为迎接假日购物季需求高峰,OpenAI 还于本周一推出免费AI购物搜索功能,试图让聊天模型融入消费者购物流程,从而打造新的商业化场景。

官方博客指出,该功能基于GPT‑5‑Thinking‑Mini 模型优化,通过问答方式收集用户偏好,再在网络中逐步推荐 10 至 15 件商品供筛选。

过去几周,OpenAI 密集更新产品:包括群组聊天功能、面向美国 K‑12 教师的免费版 ChatGPT,以及内置 ChatGPT 的浏览器版本。这显示公司正在积极拓展用户规模与使用场景,以应对增长压力并强化平台生态。

ai-agent-tradingkey

中国 LLM:阿里 Qwen 3 Max 同样出色

中国AI阵营同样迎来突破。11 月 24 日,阿里巴巴 布新一代人工智能交易模型 Qwen 3 Max(通义千问 3 Max)。

产品公开测试仅一周,下载量突破 1,000 万次,刷新全球AI应用历史记录。短短时间内,Qwen 3 Max 在增长速度上超越 ChatGPT、Sora 乃至今年早些时候引发轰动的 DeepSeek,成为史上增速最快的AI产品。

性能方面,Qwen 3 Max‑Preview 在多个权威评测集(MMLU、GSM8K、HumanEval、BIG‑Bench Hard 等)中均刷新通义系列最佳纪录,在部分项目上甚至超越 GPT‑5 与 Claude Opus 4。

ai-agent-tradingkey

受益于其AI云业务的大幅上涨,阿里巴巴虽然在其主营电商业务上表现不算特别出色,市场仍然对这几公司基于了很高的想象空间。

从投资与金融交易维度看,中国AI模型也展现强劲实力。 在 Hyperliquid 交易平台 组织的“Alpha Arena”实盘实验中,每个AI模型均获 1 万美元资金、在同等条件下自主交易加密货币永续合约。 结果显示:DeepSeek 以 57.5% 收益率拔得头筹,而Qwen 3 Max 以 25% 收益率位列第二,累计执行 36 笔交易,夏普比率 0.328,为所有参赛模型中表现最稳定者。

Qwen 3 Max 在策略层面专注于波动性控制与风险均衡,有效避免大型模型常见的“过度交易”与“风险飙升”问题,显示出卓越的稳定性与策略优化能力。

审核人TradingKey
免责声明: 本文内容仅代表作者个人观点,不代表Tradingkey官方立场,也不能作为投资建议。文章内容仅做参考,读者不应以本文作为任何投资依据。 Tradingkey对任何以本文为交易依据的结果不承担责任。 Tradingkey亦不能保证本文内容的准确性。在做出任何投资决定之前,您应该寻求独立财务顾问的建议,以确保您了解风险。

推荐文章

KeyAI