概要
AppleはApple Intelligence向けに、デバイス上とサーバー上で動作する2種類の多言語・マルチモーダル基盤言語モデルを発表。 3BパラメータのオンデバイスモデルはApple silicon向けに最適化。 サーバーモデルはPT-MoEトランスフォーマーを採用し、高品質と効率を両立。 両モデルとも大規模な多言語・マルチモーダルデータで学習し、責任あるAI運用を重視。 Swift中心の新フレームワークで、開発者は少ないコードで機能統合が可能。
Apple Intelligenceを支える基盤言語モデルの概要
- Apple Intelligence のために設計された2種類の 多言語・マルチモーダル基盤言語モデル
- (1) 約30億パラメータ のオンデバイスモデル
- Apple silicon 向けに最適化
- KV-cache共有 や 2ビット量子化対応学習 などのアーキテクチャ的工夫
- (2) サーバーモデル
- Parallel-Track Mixture-of-Experts (PT-MoE) トランスフォーマー を採用
- トラック並列処理、 疎なMixture-of-Experts計算、 グローバル・ローカル注意の交互適用
- Apple Private Cloud Compute プラットフォームでの高品質・低コスト実現
学習データとファインチューニング
- 責任あるWebクローリング、 ライセンス済みコーパス、 高品質な合成データ からなる 大規模多言語・マルチモーダルデータセット で学習
- 教師ありファインチューニング と 強化学習 を新しい 非同期プラットフォーム で実施
- 追加言語対応 や 画像理解、 ツール呼び出し実行 もサポート
性能評価と開発者向け機能
- 公開ベンチマーク や 人手評価 で、同規模のオープンベースラインを上回る性能
- Swift中心のFoundation Modelsフレームワーク を新たに提供
- ガイド付き生成、 制約付きツール呼び出し、 LoRAアダプターファインチューニング に対応
- 少ないコード行数 での機能統合を実現
プライバシー・責任あるAI運用
- コンテンツフィルタリング や ロケール別評価 など、責任あるAI運用のための 多層的セーフガード
- Private Cloud Compute による ユーザープライバシー保護
- Appleの Responsible AI アプローチに基づく運用方針
Apple Intelligenceのユーザー体験と今後
- iOS 18、 iPadOS 18、 macOS Sequoia に深く統合
- テキスト作成・修正、 通知の要約・優先付け、 会話用画像生成、 アプリ内アクションの自動化 など、日常的なタスクに最適化
- ユーザーの現在の活動 に合わせて柔軟に適応する設計
- 2024年WWDC での発表と今後のアップデートへの期待