概要
- EuroLLM は、ヨーロッパ発の大規模言語モデル
- EU公式24言語 すべてに対応した多言語サポート
- オープンソース で公開、研究者・組織・市民が自由に利用可能
- 高性能 な言語タスク処理能力と拡張性
- 主要大学・企業による 共同開発 プロジェクト
EuroLLMの特徴
- ヨーロッパ発 の大規模言語モデル開発プロジェクト
- 24のEU公式言語 すべてをカバーする多言語対応
- 35言語・4兆トークン以上 の大規模データで事前学習
- 9Bパラメータ のフラッグシップモデルEuroLLM-9B
- EuroLLM 9B Base はタスクごとのファインチューニングが可能
- EuroLLM 9B Instruct は指示追従・チャットタスク用に最適化
- マルチモーダル 対応予定:画像・音声も理解可能に進化予定
- Hugging Face 上でモデル提供、誰でも試用・利用可能
- オープンソース :研究者・企業・市民が自由に利用・拡張
- 高性能 :質問応答、要約、翻訳など多様な言語タスクで優れた性能
開発チームと関係機関
- Unbabel、 Instituto Superior Técnico、 University of Edinburgh、 Université Paris-Saclay など欧州主要大学・企業が連携
- Horizon Europe、 European Research Council、 EuroHPC の支援を受けて開発
- MareNostrum 5スーパーコンピュータ でトレーニング実施
- 欧州デジタル主権 の強化とAIイノベーション推進をミッションとする
主な研究者
- André Martins (Unbabel VP of AI Research/Instituto Superior Técnico准教授):機械学習・自然言語処理の専門家、ELLIS Societyフェロー
- Alexandra Birch (Aveni.ai共同創業者/University of Edinburgh准教授):多言語NLP・翻訳・倫理・説明可能性研究
- Nuno Guerreiro (Unbabel Senior Research Scientist):機械翻訳評価・エラー検出・LLM開発
- Pierre Colombo (Université Paris-Saclay准教授/Equall.AI CSO):AI安全性・LLM応用、AAAI 2022最優秀学生論文賞受賞
EuroLLMの公開・利用
- Hugging Face でモデル配布、誰でもダウンロード・ファインチューニング可能
- オープンソース ライセンスで研究開発・商用利用も柔軟
- EuroLLM 1.7B 技術レポートやリリース記事も公開
- EuroHPC のHPCリソース、 Horizon Europe RIAプロジェクトUTTER の助成による開発推進
EuroLLMの今後
- 画像・音声対応 のマルチモーダル機能追加を計画
- 欧州発イノベーションの推進力 として、誰もが利用・発展できる基盤の提供
- AI主権・多言語社会 にふさわしいAI技術の進化・普及を目指す