Apertusの基本情報と開発体制
スイス発のオープンソースLLMとして開発され、2025年9月に v1.0、2026年6月に v1.1 Mini がリリースされました。開発の背景からモデルの全体像までを見ていきます。
Apertus 開発タイムライン
「完全オープン」の定義と開発機関
Apertus(アペルトゥス/ラテン語で「開かれた」の意)は、スイス連邦工科大学ローザンヌ校(EPFL)、チューリッヒ工科大学(ETH Zurich)、スイス国立スーパーコンピューティングセンター(CSCS)の3機関が共同で開発した大規模言語モデルです。戦略パートナーとしてスイス最大の通信事業者 Swisscom が参画しています。
ここで注目すべきは、Apertus がモデルの重みだけでなく、学習データの構成・前処理パイプライン・学習手順のすべてを公開している点です。 Meta の Llama や Mistral AI のモデルは重みをオープンにしていますが、学習データの詳細は非公開のままです。公式サイトが「Open weights, open data, open science」と掲げている通り、この透明性の差が EU AI Act 対応にも直結します。
Open weights, open data, open science — サイトトップに掲げられたプロジェクトの基本方針
モデルサイズと技術アーキテクチャ
Apertus のモデルは大きく2世代に分かれます。v1.0 の 8B(80億パラメータ)と 70B(700億パラメータ)が基幹モデルです。v1.1 Mini は 8B を教師とした蒸留(knowledge distillation)で軽量モデル群を生み出したシリーズで、公式サイトでは「16の小型言語モデル」として紹介されています(蒸留と量子化技術のデモンストレーションを兼ねた位置づけ)。
v1.1-4B-Instruct の技術仕様を見ると、Dense Transformer Decoder にグループクエリアテンション(GQA)を組み合わせた構造です。24層・モデル次元3,072・MLP次元16,384、アテンションヘッド24(クエリ)/8(キー・バリュー)という構成で、活性化関数には xIELU を採用しています。パラメータ数は計算用3.8B・ストレージ用4.6B です。
| 項目 | 8B / 70B(v1.0) | 4B(v1.1 Mini) |
|---|---|---|
| アーキテクチャ | Dense Transformer + GQA | Dense Transformer + GQA |
| コンテキスト長 | 公式サイト参照 | 4,096トークン |
| 学習トークン数 | 15兆 | 1.7兆(蒸留) |
| ライセンス | Apache 2.0 | Apache 2.0 |
| 学習基盤 | Alps スーパーコンピューター | 64基 GH200 GPU |
Dense transformer decoder, grouped-query attention, 24 layers, model dim 3072, MLP dim 16384, attention heads 24/8 (Q/KV), xIELU activation, 3.8B compute params / 4.6B storage params — Model Architecture セクションより
1,000言語以上に対応する多言語設計
Apertus で最も目を引く設計判断は、1,000以上の言語を学習データに含めている点です。 Hugging Face のモデルカードではより詳細に「1,811言語」と記載されています。ヨーロッパの主要言語に加え、低資源言語まで含む規模です。
学習には15兆トークンが使われています。計算基盤はスイスのルガーノにある Alps スーパーコンピューターです。v1.1 Mini の 4B モデルは、モデルカードによると64基の GH200 GPU で約 2.0×10²² FLOPs の計算量を投入して蒸留されています。
languages: 1811 ... num_tokens: 15000000000000 ... Hardware: 64 GH200 GPUs. Total FLOPs: ~2.0E22 — モデルカードの Training セクションより
この多言語性はカバレッジの広さだけが狙いではありません。スイスはドイツ語・フランス語・イタリア語・ロマンシュ語の4公用語を持つ国です。行政文書を複数言語で処理する実需から設計されたモデルであり、多言語対応がアーキテクチャの土台に組み込まれています。
Apertusが注目される理由と競合との違い
Apertus が既存のオープンソース LLM と一線を画すのは、性能のベンチマークではなく「信頼性と透明性の設計原則」を差別化の軸に据えている点です。
オープンソースLLM 透明性の比較
公開範囲の概念図(公式情報をもとに作成)
EU AI Act準拠とデータ主権
Apertus の設計原則のなかで最も明確に打ち出されているのが、EU AI Act(欧州AI規制法)への準拠です。公式サイトでは「Built to meet EU AI Act requirements」として、3つの施策が掲げられています。オプトアウトの尊重、個人識別情報(PII)の除去、そしてメモリゼーション(学習データの丸暗記)の防止です。
EU AI Act が2026年に段階施行される中で、「どのデータで何を学習したか」を説明できないモデルは、欧州市場で法的リスクを抱えることになります。 Apertus はこの要件を設計段階から満たしており、欧州の行政機関や規制産業にとっては導入障壁が低いモデルといえます。
Built to meet EU AI Act requirements: the model respects opt-outs, removes PII, prevents memorization — EU AI Act 対応に関する公式声明
米国の AI モデル輸出規制の動きも、ソブリンAIへの注目を後押ししています。米国発のモデルへの依存リスクが目に見える形になったことで、欧州独自のAI基盤を持つ意義が政策の場で議論されるようになりました。
主要オープンソースLLMとの違い
Apertus を既存のオープンソースLLMと並べると、位置づけの違いが浮き彫りになります。
| 比較軸 | Apertus | Llama 3(Meta) | Mistral Large |
|---|---|---|---|
| 学習データ公開 | 構成・前処理を全公開 | 非公開 | 非公開 |
| ライセンス | Apache 2.0 | Llama Community License | Apache 2.0 |
| 多言語対応 | 1,000言語以上 | 英語中心に最適化 | ヨーロッパ言語が中心 |
| EU AI Act対応 | 公式に明示 | 未表明 | 未表明 |
| 商用利用 | 無制限 | 一定規模以上で要契約 | 無制限 |
| データ所在地保証 | スイス+ユーザー管理 | なし | EU内ホスティング可 |
性能面(ベンチマークスコア)では Llama 3 の 70B や Mistral Large が上回ります。しかし「学習データの由来を監査できるか」「特定国の輸出規制の影響を受けるか」「データを国外に出さずに運用できるか」という軸では、Apertus に明確な優位性があります。
ClaudeやChatGPTのようなフロンティアモデルが得意とする汎用的な高精度タスクと、Apertus が持つデータ主権・透明性・多言語対応は、競合関係というより役割の住み分けです。
行政での実用事例
Apertus はすでに本番環境での運用が始まっています。公式サイトのニュース一覧には、2026年3月にスイスのティチーノ州が行政文書の多言語翻訳に Apertus を採用したことが報告されています。イタリア語圏のティチーノ州では、連邦レベルのドイツ語・フランス語文書を住民向けに翻訳する必要があり、データを国外に出さずに処理できる点が採用理由です。
Apertus for Ticino (Mar 17) - Fine-tuned model powers in-house AI translation — ニュースヘッドラインより
行政のように「データを特定の法域から出せない」制約がある現場では、ソブリンAIは選択肢ではなく前提条件になりつつあります。 Apertus のモデルは Hugging Face の swiss-ai Organization から無料でダウンロードできるため、技術力のある自治体や研究機関は自前で検証・導入を進められる状態にあります。
Apertusの導入方法と現時点の制約
Apertus を実際に試す方法と、導入前に把握しておくべき性能上の制約を見ていきます。
Apertus を試す3つの経路
モデルをダウンロードし、自社サーバーや手元のPCで推論する。環境構築の技術知識が必要。
API経由で利用。データがスイス国内に留まる保証付き。企業・行政向け。
スイスAIイニシアチブが提供する公共推論サービス。研究機関向け。
Hugging Faceからの導入手順
個人や開発チームが手軽に試すなら、Hugging Face からモデルをダウンロードするのが最短経路です。swiss-ai の Organization ページから、用途に応じたサイズと形式(Base / Instruct)を選びます。
手元のPCで動かすなら、v1.1 Mini の 4B モデルが現実的です。16GB 程度の VRAM があれば量子化版を推論できます。Ollama や llama.cpp 向けの GGUF 形式も配布されているため、ローカルLLMの経験があれば、既存の推論環境にそのまま組み込めます。
8B や 70B を本格運用する場合は、クラウドの GPU インスタンスかオンプレミスの推論サーバーが要ります。翻訳や長文の文書要約に向いた構成です。
ベンチマーク性能と用途の見極め
v1.1-4B-Instruct の公式ベンチマーク結果(Hugging Face モデルカード記載)を見ると、多言語評価の平均スコアは0.473です。
| ベンチマーク | スコア | 測定内容 |
|---|---|---|
| MMLU | 0.504 | 知識・推論の総合力 |
| TruthfulQA | 0.506 | 事実に基づく回答の正確性 |
| ARC | 0.332 | 科学的推論 |
| Instruction Following | 0.550 | 指示への追従精度 |
| LogiQA | 0.296 | 論理的推論 |
Multilingual benchmark results — MMLU: 0.504, TruthfulQA: 0.506, ARC: 0.332, IF: 0.550, LogiQA: 0.296, Average: 0.473 — Evaluation Results セクションより
4B パラメータ規模のモデルとしては標準的な水準です。同規模の Gemini 軽量版や Phi-3 Mini と比較できる位置づけですが、フロンティアモデルとの差は明確にあります。
フロンティアモデルとの使い分け
Apertus を導入するかどうかの判断軸は「性能が足りるか」ではなく「この用途にデータ主権が必要か」です。 性能だけで比べると、ほぼすべてのタスクでフロンティアモデルが上回ります。しかし次のいずれかに当てはまる場合、Apertus が合理的な選択になります。
- データを特定の法域(スイス・EU圏内)から出せない規制要件がある
- 学習データの由来を監査・説明する義務がある(EU AI Act の高リスク分類)
- 米国発モデルへの依存リスクを分散したい
- 多言語(とくにヨーロッパの少数言語)の処理精度が求められる
- ライセンス料なしで商用利用したい(API課金を避けたい)
逆に、英語中心の高精度な推論・コード生成・長文の創作といったタスクでは、ClaudeやGrokのようなフロンティアモデルに任せるほうが実用的です。一つのモデルですべてを賄おうとするのではなく、タスクの性質とデータの制約に応じて使い分ける設計が、実務上は最も効率的です。
Apertusを理解して自社に合った使い方を判断しよう
Apertus は「性能で世界一を目指す」モデルではなく、「透明性とデータ主権を担保しながら実用水準を提供する」モデルです。フロンティアモデルとの性能差は明確ですが、EU AI Act 対応・データ所在地の保証・完全な学習データ透明性という独自の価値を持っています。
自社の用途が「データを国外に出せない」「学習データの由来を説明できる必要がある」「多言語の行政文書を処理する」のいずれかに該当するなら、まず Hugging Face の swiss-ai Organization から 4B モデルをダウンロードして手元で動作を確認するのが第一歩です。
Webページや資料をマークダウンに変換してからモデルに渡すと、見出し階層や表構造が保たれて読み取り精度が上がります。
Apertusの公式ソース
本記事の内容は、以下の一次情報をもとにまとめています。最新の正確な情報は必ず一次ソースをご確認ください。