アンソピックがClaude Opus 4.8をリリース。OpenAIのGPT 5.5およびGoogleのGemini 3.1 Proを凌駕
Anthropicは最新AIモデル「Claude Opus 4.8」をリリースし、複数の合成ベンチマークでOpenAIの「ChatGPT-5.5」やGoogleの「Gemini 3.1 Pro」を上回った。Opus 4.8は、情報不足時の誤情報提示確率を低減し、不確実性をユーザーに通知する信頼性向上が図られている。動的なワークフロー機能により多数のサブエージェントを連携させ、タスク実行時の「エンゲージメントレベル」調整でコスト効率を管理できる。一般ユーザー向けの価格はOpus 4.7と同水準だが、Fastモードは値上げされた。

TradingKey ― Anthropicは5月28日、最新のフラッグシップAIモデル「Claude Opus 4.8」をリリースした。これは主力製品「Opus 4.7」のアップグレード版にあたる。
Anthropicの公式データによると、Opus 4.8はAIに特化した複数の合成ベンチマークにおいて、OpenAIの「ChatGPT-5.5」やグーグル(GOOGL)の「Gemini 3.1 Pro」を上回る性能を記録した。
Opus 4.8 コア技術アップグレードのハイライト
モデルの信頼性に関して、AnthropicはOpus 4.8以前のモデルがより「誠実」であると述べた。十分な裏付け情報がない場合に誤った情報を事実として提示する確率を大幅に低減させている。モデルが「自らの作業における不確実性」を検知すると、ユーザーに能動的に通知し、根拠のない主張を行う頻度を大幅に抑制する。
中核となるモデルのアップグレードに加え、Anthropicは製品スイート全体で新機能を導入した。これには動的なワークフロー機能が含まれており、数百もの小規模なサブエージェントを同時に動員して連携させ、最終的な成果を導き出すことが可能である。
コストと効率の管理に関して、新機能ではタスク実行時にClaudeの「エンゲージメントレベル」を調整できるようになった。これにより、特定の機能に費やす時間や資金を削減することが可能となる。
例えば、ブラウザやClaude Coworkにおいて、深い思考を要する操作にはAIの関与を高め、迅速な完了が求められるタスクには関与を下げるなど、柔軟な調整が行える。この低いエンゲージメントレベルは、AIチャットや会話内容の確認中にユーザーが消費するトークン数の直接的な削減につながる。
利用可能性と市場価格について、一般ユーザー向けの価格設定はOpus 4.7と同様、入力トークン100万個につき5ドル、出力トークン100万個につき25ドルに据え置かれた。さらに、Fastモードの価格は入力100万トークンあたり10ドル、出力100万トークンあたり50ドルとなっている。
このコンテンツはAIを使用して翻訳され、明確さを確認しました。情報提供のみを目的としています。














コメント (0)
$ボタンをクリックし、シンボルを入力して、株式、ETF、またはその他のティッカーシンボルをリンクします。