sakutto
生成AI· Opus 4.8

Claude Opus 4.8・4.7・4.6 の料金比較|コストの違いとモデルの選び方

出典: Anthropic 公式ドキュメント(Pricing)
ClaudeAnthropic料金・コストLLM

Claude Opus 4.8・4.7・4.6 の料金の基本

Claude を提供する Anthropic は、Opus シリーズとして 4.8・4.7・4.6 の3モデルを並行して提供しています。料金は、使い方を2つに分けて考えると整理しやすくなります。

チャットとAPI、2つの料金の考え方

Claude の使い方には、月額プランで使うチャットと、使った分だけ支払う API の2通りがあり、料金の考え方がそれぞれ異なります。チャットの月額料金はどのモデルでも同じで、単価そのものがモデルで変わるのは API のときです。 ただしチャットでも、利用上限の消費はモデルによって差が出ます。

チャット(月額プラン)claude.ai や Claude アプリを毎月決まった料金で使う方法。月額料金はどのモデルでも同じですが、利用上限の消費はモデルで変わります。
API(従量課金)自分のアプリやプログラムに組み込み、使った量に応じて支払う方法。モデルによって料金が変わります。
料金を左右する要素チャットでは契約プラン、API ではトークン数(文章の数え方と考える量)が中心になります。

3モデルの違いとモデルの選び方

3モデルの違いは、数字が大きいほど新しいという点に集約されます。新しいモデルほど性能が高い傾向があります。

モデル位置づけ向いている場面
Opus 4.8最も新しい最上位モデルこれから使い始める場合の標準。複雑な相談や高速モードに強い
Opus 4.74.8 の一世代前安定して動作する。長時間の自動作業にも対応
Opus 4.6旧世代現在も利用可能。長い文章をAPIで大量に入力する用途では割安になりやすい

チャットで使うなら、月額料金が同じである以上、最も新しく高性能な 4.8 を選ぶのが基本の判断になります。 API で使う場合は用途によって最適なモデルが変わるため、後半で順に整理します。Claude そのものの使い方は、Claude(claude.ai)の使い方ガイドでも解説しています。

チャットで使うときの料金と利用上限

多くの方が使うのはチャット(月額プラン)です。ここでは「料金」と「利用上限」を分けて押さえます。

月額料金はどのモデルでも同じ

チャットの月額プランは、決まった料金で上限まで使えるしくみです。どのモデルを選んでも、プランの月額料金そのものは変わりません(4.8 を選んでも 4.6 を選んでも請求額は同じです)。 これが「チャットなら3モデルとも同じ」と言われる部分です。

念のため、API で使うときの基本単価が3モデルで横並びであることも、公式の料金表で確かめておきます。

公式情報を見る →
| Claude Opus 4.8 | $5 / MTok | $6.25 / MTok | $10 / MTok | $0.50 / MTok | $25 / MTok | | Claude Opus 4.7 | $5 / MTok | $6.25 / MTok | $10 / MTok | $0.50 / MTok | $25 / MTok | | Claude Opus 4.6 | $5 / MTok | $6.25 / MTok | $10 / MTok | $0.50 / MTok | $25 / MTok | — Pricing「Model pricing」表より(列: Base Input / 5m Cache Writes / 1h Cache Writes / Cache Hits & Refreshes / Output Tokens)

ただし 4.7/4.8 は利用上限に早く届きやすい

料金が同じでも「同じ使い方でどれだけ使えるか」には差が出ます。Pro や Max などの月額プランには利用上限(一定時間あたり・週あたりの使用量の上限)があり、公式によれば、この消費量は「どのモデルとチャットしているか」や「選んだ工数(effort)」によって変わります。

公式情報を見る →
Your usage is affected by several factors, including the length and complexity of your conversations, the features you use, which Claude model you're chatting with, and the effort level you've selected. — 利用上限に影響する要因の説明より

そして Opus 4.7/4.8 は新しいトークナイザを使っており、同じ文章でも 4.6 よりトークン数が多く数えられます(公式の目安で、同じ入力が約1.0〜1.35倍)。

公式情報を見る →
First, Opus 4.7 uses an updated tokenizer that improves how the model processes text. The tradeoff is that the same input can map to more tokens—roughly 1.0–1.35× depending on the content type. — Opus 4.7 のトークナイザに関する説明より

このため、月額料金は同じでも、4.7/4.8 では 4.6 と同じ内容でも利用上限に早く到達しやすく、同じ料金で実際にこなせる量はやや目減りしやすいといえます。 実際に監修者がチャットで使った体感でも、新しいモデルでは同じような作業で上限に届くのが以前より早くなったと感じています。なお、プランごとの上限は改定されることがあるため、最新は公式の料金・プランページで確認してください。

料金を抑えるならプランを見直す

チャットで料金を抑えたい場合に効くのは、モデルではなく契約プランの選択です。Claude には無料プラン、日常利用向けの Pro、利用量の多い人向けの Max などがあり、上限の大きいプランほど多く使えます。高いプランでなければ高性能なモデルを使えないわけではないため、まず手頃なプランで試し、上限に届くようなら一段上へ移る進め方が現実的です。 プランの金額や内容は改定されることがあるため、申し込み前に公式の料金ページで最新を確認してください。

API(従量課金)の料金が変わる理由と抑え方

ここからはアプリやプログラムから使う API の話です。チャットだけの方は読み飛ばして問題ありません。

API料金の決まり方(単価 × トークン数)

API の料金は「単価 × 使ったトークン数」で決まります。トークンとは文章を細かく区切った課金の単位で、単価は3モデルとも同じです。そのため、API で料金を左右するのは、使ったトークン数ということになります。 一度に渡せる文章量(100万トークン)と一度に返せる最大量(12.8万トークン)も3モデルで共通で、長い文章を渡すこと自体で割増になることはありません。

公式情報を見る →
Claude Fable 5, ... Claude Opus 4.8, Opus 4.7, Opus 4.6, and Sonnet 4.6 include the full 1M token context window at standard pricing. (A 900k-token request is billed at the same per-token rate as a 9k-token request.) — Pricing「Long context pricing」節より

入力側:4.7 以降はトークンが増える

同じ作業でもモデルによってトークン数が変わる理由の1つが入力側です。Opus 4.7 以降は新しいトークナイザ(文章をトークンに分ける方式)を採用しており、同じ文章でも 4.6 と比べてトークン数が最大35%ほど増えることがあります。

公式情報を見る →
Opus 4.7 and later use a new tokenizer compared to previous models, contributing to their improved performance on a wide range of tasks. This new tokenizer may use up to 35% more tokens for the same fixed text. — Pricing ページの Note より

単価が同じでも、数えられるトークンが増えれば入力の料金は上がります。このため、長い文章を API で大量に入力する用途では、旧世代の数え方を使う 4.6 のほうが入力料金は割安になりやすいといえます。

出力側:考える量=工数(effort)で変わる

もう1つの理由が出力側で、モデルがどれだけ考えて書くかによってトークン量が変わります。この「どれくらいじっくり考えるか」を決める設定は、デスクトップアプリでは「工数」、API やドキュメントでは effort(エフォート)と呼ばれます。Opus 4.8 では既定が「高(high)」になっており、軽い用件でも出力が厚くなりがちです。

公式情報を見る →
On Claude Opus 4.8, the `effort` parameter defaults to `high` on all surfaces, including the Claude API and Claude Code. Set `effort` explicitly to use a different level. — Models overview の Note より

工数を用件に合わせて下げると、品質を保ちながら出力の料金を抑えやすくなります。

料金を抑えるコツ:工数・キャッシュ・バッチ・高速モード

API の料金は、いくつかの方法で下げられます。効果の大きい順に整理します。

  • 工数(effort)を下げる:出力側の料金を最も調整しやすい設定です。用件が軽いときは「中」「低」に下げると、トークン消費を抑えられます。長時間の自動作業向けの「特大(xhigh)」は Opus 4.8 と 4.7 で使え、4.6 では使えません。
  • プロンプトキャッシュ:長い前置きや資料を毎回送り直す代わりにキャッシュから読み出すと、入力料金を抑えられます。キャッシュからの読み出しは、標準の入力単価の約10%で済みます。
  • バッチAPI:すぐの返答が不要な大量処理では、入力・出力ともに50%割引になります(高速モードとは併用できません)。
  • 高速モードは 4.8 が割安:通常モードの単価は3モデルとも同じですが、高速モード(速い代わりに割高な出力モード)だけは単価が異なります。
公式情報を見る →
`xhigh` ... Available on Claude Fable 5, Claude Mythos 5, Claude Opus 4.8, and Claude Opus 4.7. — Effort levels 表の xhigh 行より
公式情報を見る →
| 5-minute cache write | 1.25x base input price | Cache valid for 5 minutes | | 1-hour cache write | 2x base input price | Cache valid for 1 hour | | Cache read (hit) | 0.1x base input price | Same duration as the preceding write | — Prompt caching の倍率表より
公式情報を見る →
The Batch API allows asynchronous processing of large volumes of requests with a 50% discount on both input and output tokens. — Pricing「Batch processing」節より

高速モードの単価は、モデルで次のように差があります。

モデル入力($/MTok)出力($/MTok)
Opus 4.6 / 4.7$30$150
Opus 4.8$10$50
公式情報を見る →
| Claude Opus 4.6 / Claude Opus 4.7 | $30 / MTok | $150 / MTok | | Claude Opus 4.8 | $10 / MTok | $50 / MTok | — Fast mode pricing 表より

高速モードでは Opus 4.8 が 4.6/4.7 の約3分の1の単価です。料金を下げたいときは、モデルを変える前に、まず工数を下げられないかを検討するのが近道になります。

Claude Opus を上手に使うために

最後に、料金を抑えつつ精度を上げる実践と、モデル選びの結論をまとめます。

長文ドキュメントを渡すときのコツ

Claude に長い資料を読み込ませて要約や下調べをさせるときは、資料をあらかじめ Markdown(マークダウン)形式に整えておくと精度が上がります。見出しの階層や表の構造が保たれ、内容を正確に把握しやすくなるためです。読み取りのムダなトークンも減るため、結果として同じ作業の料金を下げることにもつながります。

Webページをそのまま貼り付けると、装飾やレイアウト情報が混ざって読み取りの妨げになることがあります。元データをマークダウンに変換してから渡すのが、安定した結果を得る近道です。

無料ツールURLマークダウン変換URL(ウェブページ)を入力するだけでマークダウン(Markdown)に変換。見出し・表・リスト・リンクを保持したままmd化でき、LLMやRAGの前処理、調査資料の整形にも最適な無料オンラインツール。今すぐ使ってみる →

入力したテキストやファイルはお使いの環境内で処理され、sakuttoのサーバーに送信されません。社外秘の資料を扱うときも安心して整形できます。

モデル選びの結論と注意点

整理すると、チャットでは最も新しい 4.8 を選べば月額料金で不利にならず、料金を抑えたいときに見るべきは契約プランです。 API では用途で最適なモデルが変わり、長い文章を大量に入力するなら 4.6、高速モードを使うなら 4.8 が割安になりやすい、という住み分けになります。最新モデルの詳細は、Claude Opus 4.8 のリリース解説もあわせてご確認ください。

料金に関する公式ソース

本記事の内容は、以下の一次情報(Anthropic 公式ドキュメント)をもとに整理しています。料金や仕様は変わることがあるため、最新の正確な情報は必ず公式ソースをご確認ください。

Anthropic 公式ドキュメント — Pricing公式情報を見る →
Anthropic 公式ドキュメント — Models overview公式情報を見る →
Anthropic 公式ドキュメント — Effort公式情報を見る →

よくある質問

Q. チャットで Claude Opus 4.8・4.7・4.6 を使うと、料金は変わりますか?
プランの月額料金そのものは、どのモデルを選んでも変わりません。ただし注意が必要なのは利用上限のほうです。Pro や Max などの月額プランには使用量の上限があり、その消費は『どのモデルとチャットしているか』で変わります。Opus 4.7/4.8 は新しいトークナイザのため、同じ内容でも 4.6 よりトークンを多く使い、結果として利用上限に早く到達しやすくなります。料金の単価そのものがモデルで変わるのは、API(従量課金)で使うときです。
Q. Claude Opus 4.8・4.7・4.6 はどれを選べばよいですか?
チャットで使う場合は、最も新しい 4.8 が標準的な選択です。3モデルの料金は同じで、4.8 が最も高性能なためです。API で使う場合は用途によって変わり、長い文章を大量に入力するなら 4.6 が割安になりやすく、高速モードを使うなら 4.8 が割安です。
Q. 古い 4.6 のほうが安いというのは本当ですか?
チャットの月額プランでは、4.6 も 4.8 も月額料金は同じです(ただし利用上限の消費はモデルで変わり、4.7/4.8 は同じ内容でも上限に早く届きやすくなります)。API の単価で 4.6 が割安になりやすいのは、長い文章を大量に入力する場合です。Opus 4.7 以降はトークナイザ(文章の数え方)が変わり、同じ文章でも 4.6 より最大35%ほど多くカウントされることがあるためです。

関連ツール

関連ツールカテゴリ

記事