Claude 4のExtended Thinkingモードは推論トークンを256Kに拡張し、SWE-bench Verifiedで72.3%を達成した。しかし、実際の企業展開は困難を抱える。Opus 4のAPI価格は100万トークンあたり75ドルで、Sonnet 4の3倍だ。多段階ツール呼び出しを必要とするエージェントワークフローではコストが暴走する。さらに、Anthropicは長期コンテキストにおける「ミドルロスト」問題を未解決のままだ。
Sonnet 4はコストパフォーマンスの観点で真のパラダイムシフトを実現した。100万トークン25ドルの価格設定に、ツール使用精度がClaude 3.5の89%から94%に向上した。複雑なマルチエージェントシステムの商業的実現可能性を初めて現実のものにした。Anthropicが同時発表したComputer Use API v2はアプリケーション横断的な自動化を可能とし、SalesforceとWorkdayのパイロットで人工作業時間を47%削減した。
基準の再定義は単一モデルではなく、エコシステムのロックイン効果にかかっている。AnthropicのMCPプロトコルはオープンだが、Artifacts機能やProjectsワークスペースはClaude 4と深く結合しており、事実上のプラットフォーム依存を形成している。Opus 4を採用した企業が他モデルに移行する際のコストは、API適応だけでなく、大量の構造化プロンプトエンジニアリング資産の廃棄も含まれる。市場構造として、Claude 4の発売はヘッドの集中を加速させる。