Anthropologie 宣佈 Opus 4.8 快速模式價格降低 3 倍,並表示 Mythos 即將發佈。
Anthropic公司週三宣佈推出Claude Opus 4.8版本,並將快速模式的價格降低了三分之二。該公司暗示,其tron型號Mythos將在幾周內面向所有用戶開放。.
Opus 4.8 的標準定價保持不變,每百萬代幣的投入爲 5 美元,產出爲 25 美元 根據 Anthropic 的博客,。
Opus 4.8 的性能低於 GPT-5.5,並且在大多數基準測試中都優於它。
快速模式現在每百萬代幣的輸入費用爲 10 美元,輸出費用爲 50 美元,速度提升 2.5 倍。在 Opus 4.7 中,相同級別的費用爲 30 美元/150 美元。標準費率下,Opus 4.8 每百萬代幣的輸出費用爲 25 美元。GPT-5.5 的費用爲 30 美元。.
| 基準 | 作品4.7 | 作品4.8 | GPT-5.5 | Gemini 3.1 Pro |
|---|---|---|---|---|
| SWE-bench Pro | 64.3% | 69.2% | 58.6% | 54.2% |
| SWE-bench 已驗證 | 87.6% | 88.6% | — | — |
| USAMO 2026 數學 | 69.3% | 96.7% | — | — |
| 終端工作臺 2.1 | 66.1% | 74.6% | — | — |
| GraphWalks F1(100萬個令牌) | 40.3% | 68.1% | — | — |
| 在線-Mind2Web | — | 84% | 低於 84% | — |
GPT-5.5 在終端和命令行界面 (CLI) 工作流程方面具有優勢。VentureBeat 報道稱,Opus 4.8 在至少 12 項基準測試中優於 GPT-5.5,這些測試涵蓋知識工作、智能體工具使用和長上下文任務。.
企業合作伙伴證實了生產環境中的這些優勢。Databricks 報告稱,其 Genie 數據代理的“代理推理能力實現了飛躍式提升”,並且“代幣成本比 Opus 4.7 降低了 61%”,這得益於其在處理 PDF 和圖表方面的多模態效率。.
Cognition 表示,4.8 版本修復了 4.7 版本中註釋冗長和工具調用方面的問題。Hebbia 則指出,該版本提高了對複雜財務文件的引用精確度。.
Opus 4.8 的錯位評分與 Mythos 相當。
Anthropic 的校準團隊使用 Opus 4.8 進行了約 2600 次模擬調查。他們發現,其校準誤差率約爲 1.9,而 Opus 4.7 的校準誤差率爲 2.5。該值幾乎與 Mythos Preview 的校準誤差率相同。.
該模型允許自身生成的代碼中存在缺陷而不加標記的可能性比 4.7 低四倍。它在不加批判地報告缺陷結果方面得分爲 0%,是第一個達到此標準的 Claude 模型。.
Anthropic 指出了一個問題。Anthropicdent了一個值得關注的領域。在約 5% 的訓練實例中,模型在未被告知自身正在接受評估的情況下,開始推斷評估標準。.
據 VentureBeat 報道,該公司表示,這並未導致更糟糕的可觀察行爲,但稱之爲“一種令人擔憂的趨勢,可能會使未來的培訓更加複雜”。.
Mythos Preview 目前仍僅限少數參與“玻璃之翼”項目(Project Glasswing)的機構用於網絡安全工作。據 Axios 報道,Anthropic 表示,一旦額外的網絡安全防護措施到位,預計將在未來幾周內向所有客戶提供 Mythos 系列產品。該公司還透露,即將推出價格更低的型號,這些型號將提供“與 Opus 類似的諸多功能”。
正如 Cryptopolitan 所指出的那樣 在去年 11 月 Opus 4.5 發佈時
同一周,DeepSeek 的差距進一步擴大。
兩天前,DeepSeek 將 V4-Pro 的輸出價格永久性下調至每百萬代幣 0.87 美元。Opus 4.8 標準輸出價格爲 25 美元,快速模式爲 50 美元。.
加密貨幣交易機器人和 DeFi 代理每次交易會處理數百萬個代幣。在如此大的交易量下,DeepSeek 0.87美元的費用是合理的。而Opus 25美元的費用則不合理。.
最頂尖的加密貨幣專家都在閱讀我們的簡報。想 加入他們?










