Claude Sonnet 5とは
Claude Sonnet 5 の位置づけ
Claude Sonnet 5 とは、Anthropic が2026年6月30日に公開した、Claude の Sonnet シリーズの最新モデルです。Sonnet はもともと、性能と料金のバランスがよい中位モデルという位置づけでした。今回の Sonnet 5 は、その枠を超えて最上位の Opus 4.8 に迫る性能を持ちながら、料金は抑えられているのが最大の特徴です。まずは、その中身と特徴を順に見ていきます。
最もエージェント的なSonnet
Claude Sonnet 5 は、自分で計画を立て、ブラウザやターミナルなどの道具を使いながら自律的に作業を進める「エージェント」としての能力を高めたモデルです。 ここでいうエージェントとは、指示を一度受けるだけで、途中の手順を自分で判断しながら最後までやり切る使い方を指します。公式は、Sonnet 5 をこれまでで最もエージェント的な Sonnet だと表現しています。
Claude Sonnet 5 is built to be the most agentic Sonnet model yet. / It can make plans, use tools like browsers and terminals, and run autonomously at a level that, just a few months ago, required larger and more expensive models. — Claude Sonnet 5 発表ページ(導入部)より
少し前までは、こうした自律的な作業には、もっと大きく高価なモデルが必要でした。Sonnet 5 は、その水準の働きを中位モデルの価格帯で実現した点に意味があります。
Opus 4.8に迫る性能を低価格で
Sonnet 5 のもう一つの特徴が、最上位モデルとの距離の近さです。公式は、Sonnet 5 の性能が Opus 4.8 に近い水準まで縮まっており、しかも料金は安いと説明しています。
Sonnet 5 narrows the gap: its performance is close to that of Opus 4.8, but at lower prices. — Claude Sonnet 5 発表ページ(導入部)より
つまり、これまで最上位モデルでなければ難しかった作業の多くが、より手頃な Sonnet 5 でこなせるようになった、というのが今回の要点です。具体的な差は、次章のベンチマークで数字とともに確認します。
100万トークンに対応
Sonnet 5 は、一度に扱える文章量も大きく、API や主要なクラウド基盤では100万トークンに対応します。トークンとは文章を細かく区切った単位で、100万トークンはおおよそ本1〜2冊分の分量にあたります。
Claude Opus 4.8, Claude Opus 4.7, Claude Opus 4.6, Claude Sonnet 5, and Claude Sonnet 4.6 have a 1M-token context window on the Claude API, Amazon Bedrock, Google Cloud, and Microsoft Foundry. / Claude Sonnet 5, Claude Sonnet 4.6, Claude Sonnet 4.5, and Claude Haiku 4.5 have context awareness: these models track their remaining context window (their "token budget") throughout a conversation. — Context windows「Context window sizes by model」「Context awareness」より
長いやり取りのなかで残りの容量(トークンの残量)を自分で把握しながら進める仕組みも備えており、長い資料をまとめて読み込ませたり、長時間の作業を任せたりする用途に向いています。
Sonnet 5の性能とベンチマーク
主要ベンチマークの比較(単位:%・数値が高いほど高性能)
SWE-bench Pro(エージェント的コーディング)
Terminal-Bench 2.1(コマンドライン作業)
OSWorld-Verified(PC操作)
公式は、コーディングや推論、PC操作など複数の分野でベンチマーク結果を示しています。各ベンチマークとも、上から Sonnet 5・旧世代の Sonnet 4.6・最上位 Opus 4.8(参考値)の順に並べています。いずれも Sonnet 4.6 から明確に伸び、Opus 4.8 のすぐ近くまで来ていることが見て取れます。
エージェント的コーディングの性能
Sonnet 5 は、実際のソフトウェア開発を模したベンチマークで、旧世代から大きくスコアを伸ばしました。 難しいコード修正を評価する SWE-bench Pro では 63.2% で、Sonnet 4.6 の 58.1% を上回ります。計画・反復・ツール連携を要するコマンドライン作業を測る Terminal-Bench 2.1 では 80.4% と、Sonnet 4.6 の 67.0% から大きく前進しました。
It can make plans, use tools like browsers and terminals, and run autonomously at a level that, just a few months ago, required larger and more expensive models. — Claude Sonnet 5 発表ページより(各スコアは同ページの公式ベンチマーク表〈Sonnet 5/Sonnet 4.6/Opus 4.8 の3列〉の数値)
推論・PC操作・知識労働のスコア
コーディング以外でも進歩しています。分野横断の難問を集めた Humanity's Last Exam、PC画面を操作する OSWorld-Verified、実務的な知識労働を測る GDPval-AA v2 でも、Sonnet 4.6 を上回りました。下の表に、公式が示した主なスコアをまとめます。
| ベンチマーク | Claude Sonnet 5 | Sonnet 4.6 | Opus 4.8(参考) |
|---|---|---|---|
| SWE-bench Pro(コーディング) | 63.2% | 58.1% | 69.2% |
| Terminal-Bench 2.1(コマンドライン) | 80.4% | 67.0% | 82.7% |
| Humanity's Last Exam(ツールなし) | 43.2% | 34.6% | 49.8% |
| Humanity's Last Exam(ツールあり) | 57.4% | 46.8% | 57.9% |
| OSWorld-Verified(PC操作) | 81.2% | 78.5% | 83.4% |
| GDPval-AA v2(知識労働・スコア) | 1618 | 1395 | 1615 |
知識労働を測る GDPval-AA v2 は割合ではなくスコアで示され、Sonnet 5 は 1618 と、Opus 4.8 の 1615 をわずかに上回りました。分野によっては、Sonnet 5 が最上位モデルと肩を並べる、あるいは追い抜く場面も出てきています。
Sonnet 4.6からの伸びとOpusとの差
数字を並べると、傾向がはっきりします。旧世代の Sonnet 4.6 と比べると、Sonnet 5 はどの項目でも数ポイントから十数ポイント伸びています。一方で、最上位 Opus 4.8 との差は、多くの項目で数ポイント以内にとどまります。旧 Sonnet から確実に底上げされ、最上位のすぐ手前まで来た、というのが Sonnet 5 の実力です。この差をどう捉えるかが、後半のモデル選びの判断材料になります。
Sonnet 5の料金と使えるプラン
Claude Sonnet 5 の提供状況
料金は、使い方を2つに分けて考えると整理しやすくなります。月額プランで使うチャットと、使った分だけ支払う API です。順に見ていきます。
チャットで使える範囲と既定モデル
まず、多くの方が使うチャットです。Claude Sonnet 5 は、無料プラン(Free)と有料の Pro プランの既定モデルになりました。つまり、特別な設定をしなくても、標準で Sonnet 5 と会話できます。Max・Team・Enterprise の各プランでも利用でき、月額プランの範囲内であれば、チャットの利用にモデルごとの追加料金はかかりません。
Claude Sonnet 5 is available across all plans: it is the default model for Free and Pro plans, and is available to Max, Team, and Enterprise users. — Claude Sonnet 5 発表ページ(Availability and pricing)より
Sonnet 5 が無料・Proの標準になったことで、多くの利用者が、これまでより高い性能のモデルを自然に使う形になりました。Claude 全体の使い方やプランの考え方は、Claude(クロード)とは|料金・モデルの選び方の解説記事もあわせてご覧ください。
APIの料金と導入価格
自分のアプリやプログラムに組み込んで使う API は、使った量(トークン)に応じた従量制です。Sonnet 5 には導入価格が設定されており、2026年8月31日までは100万トークンあたり入力$2・出力$10、その後は入力$3・出力$15になります。
It's also available in Claude Code and on the Claude Platform, where it launches with introductory pricing of $2 per million input tokens and $10 per million output tokens through August 31, 2026, after which it will be priced at $3 per million input tokens and $15 per million output tokens. — Claude Sonnet 5 発表ページ(Availability and pricing)より
| 期間 | 入力(100万トークン) | 出力(100万トークン) |
|---|---|---|
| 導入価格(〜2026年8月31日) | $2 | $10 |
| 通常価格(2026年9月1日〜) | $3 | $15 |
当面は導入価格で、性能に対して割安に使える期間だといえます。 Opus シリーズとの料金の比べ方は、Claude Opus 4.8・4.7・4.6 の料金比較の解説記事で詳しく整理しています。
Claude Code・APIでの提供状況
開発者向けには、AIコーディング環境の Claude Code と Claude API から利用できます。API で指定するモデルID(モデルの識別名)は claude-sonnet-5 です。さらに、Amazon Bedrock・Google Cloud・Microsoft Foundry といった主要なクラウド基盤からも使えます。
Developers can use `claude-sonnet-5` via the Claude API. — Claude Sonnet 5 発表ページより
Sonnet 5とOpusの選び方
Sonnet 5 と Opus 4.8 の使い分け
Sonnet 5 の登場で、最上位の Opus 4.8 との使い分けが分かりやすくなりました。ベンチマークの差は小さく、料金は Sonnet 5 のほうが安いため、判断の軸は「どこまでの精度が必要か」に絞られます。
Sonnet 5が向いている場面
ふだんの作業のほとんどは、Sonnet 5 で十分にこなせます。文章の作成や要約、調べもの、プログラミングの支援、長い資料の読み込みなど、性能とコストのバランスが効く用途に広く向きます。とくに、同じような処理を数多く回す作業や、料金を抑えたい場面では、Opus 4.8 に近い性能を安く使える Sonnet 5 が第一候補になります。
Opus 4.8を選ぶべき場面
一方で、最後のわずかな精度が結果を大きく左右する作業では、なお Opus 4.8 に分があります。たとえば SWE-bench Pro では Opus 4.8 が 69.2% で、Sonnet 5 の 63.2% を上回ります。最難関のコード修正や、品質を何よりも優先したい分析では、Opus 4.8 を選ぶ価値があります。 Opus 4.8 そのものの特徴は、Claude Opus 4.8 リリースの解説記事で解説しています。
迷ったときのモデル選びの結論
整理すると、まず標準の Sonnet 5 で試し、精度がどうしても足りない難所だけ Opus 4.8 に切り替えるのが、性能と料金の両面で無理のない選び方です。無料・Proの既定が Sonnet 5 になったため、多くの利用者は特に設定を変えなくても、この恩恵を受けられます。他社の最新モデルと比べたい場合は、GPT-5.6 Sol・Terra・Lunaの解説記事もあわせてご覧ください。
Claude の公式発表は英語の長文であることが多く、要点を素早くつかみたい場面もあります。Webページをそのままマークダウン形式に整えておくと、見出しや表の構造が保たれ、AIに読ませて整理させる精度も上がりやすくなります。



