sakutto
生成AI· LongCat-2.0

LongCat-2.0とは?NVIDIA不使用で訓練した1.6兆パラメータAI

MeituanLongCatオープンソースAI中国AI
LongCat-2.0とは?NVIDIA不使用で訓練した1.6兆パラメータAI

LongCat-2.0とは(1.6兆のMoE)

LongCat-2.0 の主なスペック

開発元
Meituan(中国)/オープンソース公開
総パラメータ
1.6兆(1.6T)のMoE
稼働パラメータ
1トークンあたり33B〜56B(平均約48B)を動的に使用
文脈長
ネイティブで100万トークン
得意分野
エージェント的なコーディング

LongCat-2.0とは、フードデリバリー最大手として知られる中国のMeituanが2026年6月30日にオープンソース公開したAIモデルです。総パラメータは1.6兆に達しますが、MoE(混合エキスパート)という方式を採り、実際に動くのは一部だけに絞っています。中国のAI投資の大きな流れは、あわせて中国のAI5カ年計画とは の解説記事もご覧ください。

1.6兆パラメータのMoEと100万トークン文脈

LongCat-2.0の骨格は、巨大でありながら効率を重視した設計です。総パラメータは1.6兆ですが、1トークンごとに33B〜56B(平均約48B)だけを動的に使い、100万トークンの長い文脈にネイティブで対応します。

公式情報を見る →
"1.6T total parameters with dynamic activation of 33B–56B per token" / "natively supports 1 million token context" — LongCat 公式サイトより

MoEは、必要な「専門家」だけを呼び出して計算量を抑える仕組みです。全体は巨大でも、1回の処理で動くのはその一部なので、性能と実行コストのバランスを取りやすくなります。

エージェント的なコーディングに特化

LongCat-2.0は汎用チャットではなく、コードを書き進める用途に軸足を置いています。公式はこのモデルを「エージェント的なコーディング向けの1.6兆オープンソースMoE」と位置づけており、複数手順のコーディング作業を任せる使い方を想定しています。設計思想やベンチマークの読み方は、少ないパラメータで長い作業を回すScaling the Horizon(35Bエージェント)とは の解説記事と対比すると理解が深まります。

国産チップだけで訓練した「業界初」の主張

訓練・推論に使った計算基盤

クラスタ規模
5万枚規模の国産(中国製)計算クラスタ
主張
1兆パラメータ級で初めて、訓練と推論の両方を国産クラスタだけで完結
学習データ
公式サイト表記は「30兆トークン超」
報道の補足
NVIDIA製GPUに頼らない構成として注目(海外メディア)

LongCat-2.0が最も注目された理由は、性能そのものより「どのハードで作ったか」にあります。米国の輸出規制で高性能GPUの入手が制限されるなか、その依存を避けたと主張しているためです。

5万枚の国産クラスタで訓練と推論を完結

公式は、計算基盤について踏み込んだ主張をしています。1兆パラメータ級のモデルとして初めて、5万枚規模の国産計算クラスタだけで訓練と推論の両方を完結させた、というものです。

公式情報を見る →
"it is the industry's first trillion-parameter model to complete full training and inference on a 50,000-card domestic compute cluster" — LongCat 公式サイト(LongCat-2 モデルページ)より

公式の表現は「国産の計算クラスタ」で、NVIDIAの名前を明示しているわけではありません。ただ、海外メディアはこれをNVIDIA製GPUに依存しない構成として報じており、規制環境下での「脱・海外GPU」の実例として受け止められています。

学習トークン数は公式「30兆超」(報道と食い違い)

数値には注意点があります。学習データ量は、公式サイトでは「30兆トークン超」と記載されています。 一方でHugging Faceのモデル説明や一部の海外報道は「35兆トークン超」としており、出どころによって数字が食い違います。本記事は一次情報である公式サイトの「30兆トークン超」を採り、報道値との差異を明記します。

公式情報を見る →
"Pretrained from scratch on 30T+ tokens spanning Chinese, English, multilingual, and code data" — LongCat 公式サイト(LongCat-2 モデルページ)より

LongCat-2.0のコーディング性能と意義

SWE-bench Pro スコア比較(高いほど高性能)

数値はLongCat公式サイト掲載値。0〜100スケール。出典: LongCat公式サイト。

LongCat-2.059.5
GPT-5.558.6
Claude Opus 4.657.3
Gemini 3.1 Pro54.2

主張されている性能を、公式が公開したベンチマークで確認します。コーディング領域では、既存の有力モデルを上回る数字が並びます。

SWE-bench Proで主要モデルを上回る

公式サイトのベンチマークで、LongCat-2.0はコーディング性能の高さを示しています。現実的なソフトウェア開発を測るSWE-bench Proで59.5を記録し、Gemini 3.1 Pro(54.2)、GPT-5.5(58.6)、同ページに載るClaude Opus 4.6(57.3)を上回るとしています。

公式情報を見る →
"SWE-bench Pro 59.5 (leads Gemini 3.1 Pro 54.2, GPT-5.5 58.6, Claude Opus 4.6 57.3)" / "SWE-bench Multilingual 77.3 (on par with Claude Opus 4.6 77.8)" — LongCat 公式サイト(ベンチマーク表)より

多言語のSWE-bench Multilingualは77.3で、Claude Opus 4.6(77.8)とほぼ互角です。なお、公式ページが比較対象としているのはClaude Opus 4.6で、より新しいClaude Opusの4.7・4.8ではない点は押さえておきたいところです。

意義と注意点(推論系は評価が割れる)

LongCat-2.0の意義は、コーディング性能そのものよりも「国産チップだけで最前線級のコーディングモデルを作れた」ことにあります。輸出規制で高性能GPUの調達が難しい環境でも、独自路線で追随できると示した点は、主権AI(Apertus)とは の解説記事で扱った「自国で完結するAI」の流れとも重なります。

一方で、注意点もあります。指示追従や数学・科学系など推論を測るベンチマークでは見劣りするとの海外報道もありますが、これらのスコアは公式ページには掲載されていません。 コーディング以外の総合力は、公開情報だけでは断定しにくいのが実情です。用途がコーディング中心なら有力な選択肢ですが、汎用の推論力まで求めるなら、実際のタスクで他モデルと比べて確かめるのが確実です。

長文の仕様書やドキュメントをこうしたモデルに読ませる際は、あらかじめMarkdown形式に整えておくと、構造が保たれて精度が上がりやすくなります。

無料ツールURLマークダウン変換URL(ウェブページ)を入力するだけでマークダウン(Markdown)に変換。見出し・表・リスト・リンクを保持したままmd化でき、LLMやRAGの前処理、調査資料の整形にも最適な無料オンラインツール。今すぐ使ってみる →

よくある質問

Q. LongCat-2.0とは何ですか?
中国のMeituanが2026年6月30日にオープンソース公開した、1.6兆パラメータのMoE(混合エキスパート)モデルです。1トークンごとに一部の専門家だけを動かす方式で、エージェント的なコーディングに特化しています。
LongCat 公式サイト
1.6T total parameters with dynamic activation of 33B–56B per token LongCat 公式サイト
Q. LongCat-2.0は本当にNVIDIAを使わずに訓練したのですか?
公式は、1兆パラメータ級モデルとして『初めて、5万枚規模の国産計算クラスタだけで訓練と推論の両方を完結させた』と主張しています。海外メディアはこれを、NVIDIA製GPUに頼らない構成だと報じています。
LongCat 公式サイト
it is the industry's first trillion-parameter model to complete full training and inference on a 50,000-card domestic compute cluster LongCat 公式サイト
Q. LongCat-2.0のコーディング性能はどのくらいですか?
公式サイトのSWE-bench Proでは59.5で、Gemini 3.1 Pro(54.2)、GPT-5.5(58.6)、同ページ掲載のClaude Opus 4.6(57.3)を上回るとしています。多言語版のSWE-bench Multilingualは77.3で、Claude Opus 4.6(77.8)とほぼ互角です。
LongCat 公式サイト
SWE-bench Pro 59.5 (leads Gemini 3.1 Pro 54.2, GPT-5.5 58.6, Claude Opus 4.6 57.3) LongCat 公式サイト

関連ツール

関連ツールカテゴリ

記事