LongCat-2.0とは(1.6兆のMoE)
LongCat-2.0 の主なスペック
LongCat-2.0とは、フードデリバリー最大手として知られる中国のMeituanが2026年6月30日にオープンソース公開したAIモデルです。総パラメータは1.6兆に達しますが、MoE(混合エキスパート)という方式を採り、実際に動くのは一部だけに絞っています。中国のAI投資の大きな流れは、あわせて中国のAI5カ年計画とは の解説記事もご覧ください。
1.6兆パラメータのMoEと100万トークン文脈
LongCat-2.0の骨格は、巨大でありながら効率を重視した設計です。総パラメータは1.6兆ですが、1トークンごとに33B〜56B(平均約48B)だけを動的に使い、100万トークンの長い文脈にネイティブで対応します。
"1.6T total parameters with dynamic activation of 33B–56B per token" / "natively supports 1 million token context" — LongCat 公式サイトより
MoEは、必要な「専門家」だけを呼び出して計算量を抑える仕組みです。全体は巨大でも、1回の処理で動くのはその一部なので、性能と実行コストのバランスを取りやすくなります。
エージェント的なコーディングに特化
LongCat-2.0は汎用チャットではなく、コードを書き進める用途に軸足を置いています。公式はこのモデルを「エージェント的なコーディング向けの1.6兆オープンソースMoE」と位置づけており、複数手順のコーディング作業を任せる使い方を想定しています。設計思想やベンチマークの読み方は、少ないパラメータで長い作業を回すScaling the Horizon(35Bエージェント)とは の解説記事と対比すると理解が深まります。
国産チップだけで訓練した「業界初」の主張
訓練・推論に使った計算基盤
LongCat-2.0が最も注目された理由は、性能そのものより「どのハードで作ったか」にあります。米国の輸出規制で高性能GPUの入手が制限されるなか、その依存を避けたと主張しているためです。
5万枚の国産クラスタで訓練と推論を完結
公式は、計算基盤について踏み込んだ主張をしています。1兆パラメータ級のモデルとして初めて、5万枚規模の国産計算クラスタだけで訓練と推論の両方を完結させた、というものです。
"it is the industry's first trillion-parameter model to complete full training and inference on a 50,000-card domestic compute cluster" — LongCat 公式サイト(LongCat-2 モデルページ)より
公式の表現は「国産の計算クラスタ」で、NVIDIAの名前を明示しているわけではありません。ただ、海外メディアはこれをNVIDIA製GPUに依存しない構成として報じており、規制環境下での「脱・海外GPU」の実例として受け止められています。
学習トークン数は公式「30兆超」(報道と食い違い)
数値には注意点があります。学習データ量は、公式サイトでは「30兆トークン超」と記載されています。 一方でHugging Faceのモデル説明や一部の海外報道は「35兆トークン超」としており、出どころによって数字が食い違います。本記事は一次情報である公式サイトの「30兆トークン超」を採り、報道値との差異を明記します。
"Pretrained from scratch on 30T+ tokens spanning Chinese, English, multilingual, and code data" — LongCat 公式サイト(LongCat-2 モデルページ)より
LongCat-2.0のコーディング性能と意義
SWE-bench Pro スコア比較(高いほど高性能)
数値はLongCat公式サイト掲載値。0〜100スケール。出典: LongCat公式サイト。
主張されている性能を、公式が公開したベンチマークで確認します。コーディング領域では、既存の有力モデルを上回る数字が並びます。
SWE-bench Proで主要モデルを上回る
公式サイトのベンチマークで、LongCat-2.0はコーディング性能の高さを示しています。現実的なソフトウェア開発を測るSWE-bench Proで59.5を記録し、Gemini 3.1 Pro(54.2)、GPT-5.5(58.6)、同ページに載るClaude Opus 4.6(57.3)を上回るとしています。
"SWE-bench Pro 59.5 (leads Gemini 3.1 Pro 54.2, GPT-5.5 58.6, Claude Opus 4.6 57.3)" / "SWE-bench Multilingual 77.3 (on par with Claude Opus 4.6 77.8)" — LongCat 公式サイト(ベンチマーク表)より
多言語のSWE-bench Multilingualは77.3で、Claude Opus 4.6(77.8)とほぼ互角です。なお、公式ページが比較対象としているのはClaude Opus 4.6で、より新しいClaude Opusの4.7・4.8ではない点は押さえておきたいところです。
意義と注意点(推論系は評価が割れる)
LongCat-2.0の意義は、コーディング性能そのものよりも「国産チップだけで最前線級のコーディングモデルを作れた」ことにあります。輸出規制で高性能GPUの調達が難しい環境でも、独自路線で追随できると示した点は、主権AI(Apertus)とは の解説記事で扱った「自国で完結するAI」の流れとも重なります。
一方で、注意点もあります。指示追従や数学・科学系など推論を測るベンチマークでは見劣りするとの海外報道もありますが、これらのスコアは公式ページには掲載されていません。 コーディング以外の総合力は、公開情報だけでは断定しにくいのが実情です。用途がコーディング中心なら有力な選択肢ですが、汎用の推論力まで求めるなら、実際のタスクで他モデルと比べて確かめるのが確実です。
長文の仕様書やドキュメントをこうしたモデルに読ませる際は、あらかじめMarkdown形式に整えておくと、構造が保たれて精度が上がりやすくなります。



