GPT-5.6 Solとは(3モデルの違い)
GPT-5.6 ファミリー3モデルの位置づけ
GPT-5.6 Sol とは、OpenAI が2026年6月26日に限定プレビューとして公開した、同社で最も高性能なモデルです。あわせて Terra と Luna も発表され、性能と価格の異なる3モデルが用途別にそろいました。まずは Sol の位置づけと、Terra・Luna との違い、そして料金を順に確認します。
GPT-5.6 Solとは(フラッグシップの位置づけ)
GPT-5.6 Sol は、コーディング・生物・サイバーセキュリティといった難しい領域での自律的な作業に強い、OpenAI 現行で最強のモデルです。 最先端の推論と、長い手順を要するエージェント的なタスクのために作られており、複雑なコーディングやセキュリティ調査のような「いちばん難しい問題」を主戦場とします。
"GPT-5.6 Sol is our strongest model yet." / "Sol, our flagship model" — GPT-5.6 プレビュー発表より
Terra・Lunaとの違い(料金と速度の使い分け)
3モデルは「性能」と「コスト・速度」のバランスで役割が分かれます。Terra は、ひとつ前の世代である GPT-5.5 と同等の性能を保ちながら、価格を約2倍安く抑えたバランス型です。大量の処理を回す業務に向きます。一方の Luna は、ファミリーで最速かつ最も安いモデルで、軽い定型作業を低コストでさばく用途に合います。つまり、難問は Sol、量産は Terra、軽作業は Luna という住み分けが基本になります。
"Terra, a balanced model for everyday work; and Luna, a fast and affordable model. Terra has competitive performance to GPT-5.5 while being 2x cheaper and Luna brings strong capability at our lowest cost." — GPT-5.6 プレビュー発表より
3モデルの料金比較(100万トークンあたり)
料金は使った量(トークン)に応じた従量制で、入力と出力で単価が分かれます。下表は公式が示した100万トークンあたりの単価です。Sol から Luna へ向かうほど安くなり、Luna は Sol の5分の1の単価です。
| モデル | 入力(/100万トークン) | 出力(/100万トークン) | 主な用途 |
|---|---|---|---|
| Sol | $5 | $30 | 難しいコーディング・セキュリティ・長丁場のエージェント |
| Terra | $2.50 | $15 | GPT-5.5 並みの性能で大量処理 |
| Luna | $1 | $6 | 速く安く軽い定型タスク |
"GPT-5.6 is priced per 1M tokens across three model sizes: Sol is $5 input / $30 output; Terra is $2.50 input / $15 output; and Luna is $1 input / $6 output." — GPT-5.6 プレビュー(Availability and pricing)より
主要モデルの全体像をつかみたい場合は、ChatGPT(GPT-5)の解説記事 や Claudeとは(Anthropicの生成AI)の解説記事 もあわせてご覧ください。
GPT-5.6の新機能と性能
2つの新しい考え方モード
GPT-5.6 で目を引くのが、考え方を制御する2つの新モードです。同じモデルでも、深く考えさせるか・手分けして速く進めるかを選べます。それぞれの中身と、公式のベンチマーク結果を見ていきます。
max reasoning effortとは(深く考える設定)
max reasoning effort は、モデルの「考える深さ」を最大まで引き上げ、難しい問題に多くの時間をかけて推論させる設定です。 1本の思考の連なり(chain of reasoning)をより深めることで、Sol に難題をじっくり解かせます。速さより正確さが要る、複雑な分析や設計の場面で効きます。
"With GPT-5.6, we're introducing a new max reasoning effort to give Sol the most time to reason deeply." — GPT-5.6 プレビュー発表より
ultra modeとは(サブエージェント並列)
ultra mode は、考えを「深める」のではなく「手分けする」アプローチです。1つのモデルが単独で作業するのではなく、複数のサブエージェント(補助的なAIの働き手)に複雑な仕事を分担させ、まとめて高速に進めます。コーディングやリサーチ、セキュリティレビュー、ツールを多用する作業で特に効果が大きいとされています。日々の開発で AI に複数の作業を並行させる運用をしている立場からすると、単独のモデルに長く考えさせるより手分けさせたほうが速く終わる場面は多く、サブエージェントで分担させる ultra mode の狙いは納得しやすいものです。
"we're introducing a new ultra mode that goes beyond the capabilities of a single agent by leveraging subagents to accelerate complex work." — GPT-5.6 プレビュー発表より
ベンチマーク性能(Terminal-Bench・GeneBench)
公式が示した3分野のベンチマーク結果
公式は、コーディング・生物・サイバーの3分野でベンチマーク結果を示しています。Sol は、計画・反復・ツール連携を要するコマンドライン作業を測る Terminal-Bench 2.1 で、最高水準(SOTA)を記録しました。 難しいコーディング作業での強さを裏づける結果です。
"GPT-5.6 Sol sets a new state of the art on Terminal-Bench 2.1, which tests command-line workflows requiring planning, iteration, and tool coordination." — GPT-5.6 プレビュー発表より
コーディング以外でも進歩しています。長丁場のゲノム解析を評価する GeneBench v1 では、GPT-5.5 より高いスコアを、より少ないトークンで達成しました。サイバーセキュリティの ExploitBench でも、出力トークンを約3分の1に抑えながら遜色ない結果を出しています。少ないトークンで同等以上、という効率の良さも今回の特徴です。
"On GeneBench v1, which evaluates long-horizon genomics and quantitative-biology analyses, it achieves stronger results than GPT-5.5 while using fewer tokens." — GeneBench/ "On ExploitBench, GPT-5.6 Sol is competitive with Mythos Preview using only ~1/3 of the output tokens." — ExploitBench(GPT-5.6 プレビュー発表より)
GPT-5.6 Solは今使えるか(提供状況)
GPT-5.6 の現在の提供状況
性能が高い一方で、GPT-5.6 はまだ誰でも使えるわけではありません。現在の提供範囲と、その背景にある米政府の要請、そして一般提供の見通しを確認します。
現在の提供範囲(API・Codex・限定プレビュー)
いまの GPT-5.6 は、API と Codex を通じて、信頼できる一部のパートナー・組織だけが使える限定プレビューです。 プレビュー期間中の提供経路は API と Codex に絞られており、ふだんの ChatGPT からはまだ使えません。対象は少数のパートナー・組織にとどまります。
"During the preview, GPT-5.6 models will initially be available through the API and Codex to a select group of trusted partners and organizations." — GPT-5.6 プレビュー発表より
米政府要請による限定提供
この限定提供には、米政府の要請という背景があります。OpenAI は、政府に共有された信頼できる少数のパートナー向けに、まず限定プレビューから始めると説明しています。能力の高いモデルを慎重に世に出すための段階的なアプローチです。ただし OpenAI は、こうした政府を介したアクセスの形が長期の標準になるべきではない、とも明言しています。
"We don't believe this kind of government access process should become the long-term default." — GPT-5.6 プレビュー発表より
なぜ政府が関与するほど慎重なのか、その背景をさらに詳しく知りたい場合は、サイバー防御に特化した OpenAI Daybreak の解説記事 もあわせてご覧ください。
一般提供(GA)の見通しと安全性
OpenAI は、GPT-5.6 Sol・Terra・Luna を数週間内に一般提供(GA)する予定だとしています。 さらなるテストを経て、ChatGPT・Codex・API での広い提供へ移る計画です。あわせて、リスクの高い活動や機微なサイバー要求、繰り返される悪用への保護を含む、これまでで最も堅牢な安全対策(safety stack)を備えたと説明しています。
"We believe in broad access, and we plan to make GPT-5.6 Sol, Terra, and Luna generally available in the coming weeks." — GPT-5.6 プレビュー発表より
サイバー能力の評価については、OpenAI は Sol が自社の安全枠組み(Preparedness Framework)で最高位の「Cyber Critical」しきい値には達していないとしています。実際、Chromium や Firefox を用いた評価で、脆弱性の手がかりや部品は見つけられたものの、テスト条件下では完全に機能する一連のエクスプロイトを自律的に作り上げるには至りませんでした。能力の引き上げと安全側の備えをセットで進める姿勢が、段階的な提供方針に表れています。
"GPT-5.6 Sol does not cross the Cyber Critical threshold under our Preparedness Framework. In evaluations involving Chromium and Firefox, it identified bugs and exploitation primitives—the building blocks of an exploit—but did not autonomously produce a functional full-chain exploit under the conditions tested." — GPT-5.6 プレビュー(Stronger cyber capabilities)より
GPT-5.6 Solのまとめ
GPT-5.6 は、最強の Sol・割安な Terra・最速最安の Luna という3モデルで、難問から量産・軽作業までを用途別にカバーする構成です。新しい ultra mode と max reasoning effort により、深く考えるか手分けして速く進めるかを選べるようになり、Terminal-Bench 2.1 をはじめとするベンチマークでも高い水準を示しました。いま触れられるのは API・Codex 経由の限定プレビューに絞られていますが、数週間内の一般提供が見込まれており、登場を待つ価値のあるアップデートです。
公式の発表は英語の長文であることが多く、要点を素早く把握したい場面もあります。Webページをそのままマークダウン形式に整えておくと、見出しや表の構造が保たれ、AIに読ませて整理させる精度も上がりやすくなります。


