世界を動かす技術を、日本語で。

Apertus – 主権AIのためのオープンファウンデーションモデル

2026年6月22日原文(apertvs.ai)

概要

  • Swiss AI Initiative による共同開発プロジェクト
  • 完全オープン なAIモデル「Apertus」の特徴
  • EU AI Act に準拠した設計
  • 高性能・多言語対応 の大規模モデル
  • 最新情報は ニュースレター で配信

Apertus: 完全オープンAIモデルの概要

  • Swiss AI Initiative が主導し、 EPFLETH ZurichCSCS が共同開発
  • Swisscom が戦略的パートナーとして参加
  • 学習データコード重み手法アラインメント原則 を全て公開
  • 全ての要素が 文書化再現可能 な形で提供
  • ApertusはAI分野における Open Source のような存在

EU AI Act準拠と倫理的配慮

  • EU AI Act の要件に 大規模対応 したモデル設計
  • オプトアウト (データ利用拒否)に対応
  • 個人情報(PII) の削除機能
  • 記憶防止 機構による情報漏洩リスクの低減
  • グローバルな オープン基盤 としての信頼性

パフォーマンスと多言語対応

  • 8B および 70Bパラメータ 規模で 最先端オープンモデル と競合
  • 1000以上の言語 で初日から多言語対応
  • 研究者・開発者が グローバル規模 で活用可能な設計

最新情報の入手方法

  • Apertusリリース 情報や 研究成果コミュニティニュース を配信
  • ニュースレター 登録による定期的なアップデート提供

Hackerたちの意見

前のスレッド: https://news.ycombinator.com/item?id=45108401

このモデルの前のバージョンはかなりひどかったけど、著作権法に従っているって主張してた。でも、私のテストによると、それも真実じゃない。だから、私の見解ではこれは完全に無駄だね。

次のことが真実である限り、このリリースは「閉じられた場所」で訓練されたほとんどの他のモデルよりも、科学全体への貢献が大きいと思う: > 完全にオープンなモデル: オープンウェイト + オープンデータ + すべてのデータとトレーニングレシピを含む完全なトレーニング詳細

それは、Common Crawlから派生したfinewebを使っていて、これは無許可でウェブページをスクレイピングしたものなんだ。

彼らの指示モデルは、去年のLlama3.1をファインチューニングしたものみたい。新しいモデルの進展はあるの?私の最後の希望は、中国のオープンモデルから来るソブリンAIだよ。

ソブリンAIは、ただ一つのモデルを使うことじゃないんだ。正しい仕事に対して正しいモデルを使って、答えを提示する前に一緒に解決策を話し合うことが重要なんだよ。こういうモデルを混ぜたいなら、https://github.com/deepbluedynamics/nemesis8をチェックしてみて。

他の完全オープンなLLMには、Allen AIのOLMo 3.1とMBZUAIのK2 Think V2が含まれていて、どちらも完全なトレーニングパイプラインとデータセットを公開しているよ。NvidiaのNemotronもオープントレーニングソースモデルだけど、一部のデータセットはプロプライエタリのまま。lambdaのコメントを引用すると: > Nemotronモデルは一般的にOlmoやK2 Think V2よりも強力で(Artificial Analysisのベンチマークによる)、データセットにはかなりの重複がある(多くのデータセットは同じソースから異なるフィルタリングで作られていて、OlmoとK2 Think V2はどちらもいくつかのNemotronデータセットを使用している)。 > でも、そうだね、Nemotronは現代的でかなり能力のあるLLMで、122bモデルはほとんどのベンチマークでDeepseek R1(671bモデル)よりも優れてるし、最近リリースされた550b Ultraもあるよ。 https://news.ycombinator.com/item?id=48492439

もう一度Nemotronを試してみようかな。昨日、OpenRouterで最新のやつを使ったけど、ひどかった - StepFunよりも悪かった。

Allen AIはもっと評価されるべきだよ。彼らはGenAIを本来あるべき形で進めてる。実際、フロンティア企業が彼らのアプローチを取っていたら、もっと遅く始まったかもしれないけど、2035年にはもっと進んでいたと思う。今はAIが失敗するのを望んでいる社会の大多数がいるけどね。

多くの言語に焦点を当てていると主張するモデルなのに、「Xを言語Yでどう言うの?」とか「動詞Xを言語Yでどう活用するの?」みたいな簡単な質問にはかなり信頼性がない。存在しない単語を妄想してばかりで、訂正されると新しい嘘を妄想するだけなんだよね。

おそらく、各単語のセットがどの言語を参照しているかは分からないんじゃないかな。言語でラベル付けされたトレーニングデータがたくさん含まれているとは思えないし。「Xを言語Yでどう言うか」というのは、Xを言語Yで言うのとは別のタスクだよね。

アイデア自体はいいと思うし、アメリカ以外の人たちがテクノロジーの主権について考える必要性が高まってるよね。アメリカはデータを保管するには安全じゃない場所になっちゃったから。でも、Apertusから受ける印象は、まるで委員会のスピードで動いてる感じ。競争力のあるモデルを提供してくれるとは思えないな。少なくとも、今のモデルと比べて競争力があるとは思えない。1年前のモデルと比べて競争力があるかもしれないけど(でも、まだそれすらできてないよね?)。

Hacker Newsで議論の続きを見る