iPhone向けのGemma 4

2026年4月6日原文(apps.apple.com)

概要

AI Edge Gallery はiPhoneで動作するオープンソースLLM実行アプリ
Gemma 4 対応で最新AIを完全オフラインで利用可能
プライバシー重視、全ての推論が端末内で完結
多機能 ：エージェントスキル、マルチモーダル、音声文字起こし等
開発者・AI愛好家向け のコミュニティ主導プロジェクト

AI Edge Gallery：iPhone向け次世代AI実行環境

世界最先端のオープンソース大規模言語モデル（LLM） をiPhoneで直接実行
完全オフライン・高速・プライバシー重視 のAI体験
Gemma 4ファミリー 対応で最新AI技術の体験が可能

主な機能

エージェントスキル（Agent Skills）
- 会話型LLMを 能動的アシスタント へ進化
- Wikipedia連携、インタラクティブ地図、ビジュアル要約カードなど
- URLからモジュール型スキル をロード可能
- GitHub Discussionsで コミュニティ制作スキル を参照・利用
AIチャット＋シンキングモード（Thinking Mode）
- マルチターン会話 を自然に実現
- シンキングモードで モデルの推論プロセスを可視化
- 複雑な問題解決の思考過程を ステップごとに表示
- 現時点では Gemma 4ファミリー 等一部モデルで対応
Ask Image（画像質問）
- カメラや写真ギャラリーから 物体認識・ビジュアル説明 ・画像パズル解決
Audio Scribe（音声文字起こし）
- リアルタイム音声認識・翻訳 を端末内AIで実現
- 高効率・高精度なテキスト変換
Prompt Lab
- プロンプトテスト専用空間
- 温度・top-k等パラメータを詳細に調整
- 単発プロンプトの挙動を 細かく検証
Mobile Actions
- オフラインで 端末操作や自動化タスク を実行
- FunctionGemma 270m ファインチューモデル利用
Tiny Garden
- 自然言語で仮想ガーデンを育てるミニゲーム
- FunctionGemma 270mのファインチューンを活用した実験的機能
モデル管理＆ベンチマーク
- 多様なオープンソースモデル を簡単ダウンロード・管理
- カスタムモデルの追加 も可能
- ベンチマークテスト で端末ごとの性能を把握
100%端末内プライバシー
- 全推論が端末内で完結
- インターネット接続不要で 完全プライベート

コミュニティとサポート

オープンソースプロジェクト として開発者・AI愛好家に最適
GitHubでソースコード公開 （https://github.com/google-ai-edge/gallery）
コミュニティによる機能追加・スキル共有 が活発
サポート・フィードバック ：google-ai-edge-gallery-android-feedback@google.com

アプリ情報・利用条件

無料・iPhone専用 （iOS 17.0以降必須）
Mac（Apple Silicon, macOS 14.0以降） や Apple Vision（visionOS 1.0以降） にも対応
アプリサイズ ：35.4MB
提供元 ：Google LLC（EU法準拠、詳細な連絡先情報あり）
対象年齢 ：13歳以上（軽度の暴言・ユーモア、ホラー要素あり）

Hackerたちの意見

すごいモデルだね。今、Macで動かしてるけど、iPhoneでもローカルに使えるの？試してみないと！待って、エージェントスキルとかモバイルアクションも全部電話内でできるの？マジで？（後でチェックしなきゃ！誰かアドバイスある？）普段は「アブリテレート」みたいなことはしないんだけど、https://github.com/p-e-w/heretic を見つけて、数日前にこのモデルで試してみたくなっちゃった（実際、使いやすいようにリポジトリも作ったよ）https://github.com/pmarreck/gemma4-heretical で… わあ、うまくいった！それに、内蔵のナニーがないのも楽しい！MLXバージョンも作れるみたいで、Macではちょっと速く動くけど、残念ながらOllamaでは動かないんだ。（LM Studioかも。）M4 Macbook Pro（128GB）でめっちゃ快適に動いてるし、64GBでも大丈夫そう…小さいメモリだと、量子化を下げる必要があるかも。個人的に、デアラインされたローカルモデルが好きなんだ。誰かの遊び場で遊ぶときに、自分の考えを監視されるのは嫌だし、自分のローカルのオープンソースでもジャッジされたくないからね。それに、倫理的に正当化できるけどルールに引っかかる会話（「センシティブ」とか「倫理的にギリギリだけど生産的」とか「聖なる牛を侵害する」とかにざっくりカテゴライズできる）もできるようになって、今までにはなかったレベルだよ。注意：これをOpenClawに接続しようとしたけど、問題があった。明らかな質問に答えると、そういうのは悪い行為者を助長するよね（他のツールも同じだけど）。でも、実際にはもっと多くの良い行為者がいるし、悪い行為者は良い行為者が自分に課すルールなんて聞かないから。

└

Macでomlx[1]を使ってmlxモデルを動かしてるけど、すごくうまくいってるよ。[1] https://github.com/jundot/omlx

└

エージェントスキルプラットフォームでまだ何も作ってないけど、個人的には結構クールだと思う。Androidでは、サンドボックスがindex.htmlをWebViewに読み込んで、ウィンドウプロパティを通じて標準化された文字列I/Oをハーネスに送ってる。レンダリングされたHTMLページを返すこともできるよ。確かにハックっぽいけど、将来的にエッジコンピュートエージェントのサンドボックスがどうなるかの兆しを感じる。

└

それに、倫理的に正当化できるけどルールに引っかかる会話（「センシティブ」とか「倫理的にギリギリだけど生産的」とか「聖なる牛を侵害する」とかにざっくりカテゴライズできる）もできるようになって、今までにはなかったレベルだよ。アブリテレートスクリプトをチェックしたけど、まだ何をするのか、結果がどうなるのか理解できてない。これが可能にする会話は何なの？

└

Macで試してみたけど、コーディングに関してはQwenと比べてあまり感心しなかったな。もっと得意なこともあるのかな？

└

「倫理的に正当化できるけどルールに引っかかる会話のセットがあって、これを使うことで今までにないレベルで可能になった。ローカルLLMで実行する予定の例をいくつか教えてくれない？興味津々なんだ。」

これすごい！1) iPhoneでモデルを動かせて、いい結果が出てる。クラウドのGeminiほどではないけど、いい感じ。2) LLMがフラッシュライトをオンにしたり、地図を開いたりできる「モバイルアクション」ツールコールが大好き。Siriショートカットのサポートが追加されたら楽しいのに。Appleが約束したパーソナルオートメーションが欲しいけど、結局実現されなかった。3) ローカルモデルが普通になるのが楽しみ。教師向けに小さなアプリを作ってるけど、厳しいプライバシー法があって、可能な限りクライアントサイドで動くコードを書くのが好きなんだ。アプリやウェブサイトを開発する時、デバイス内モデルへの簡単なAPIアクセスが無料で欲しい。今のところiOSやChromeである程度は存在してるけど、特に良いわけではないと思う。

└

自分にとって、幻覚やガスライティングは数年前に逆戻りした感じ。ストロベリーの「r」の質問にも失敗するし、懐かしいな。これがローカルで動くのはすごいと思う。これからも数年前の同等モデルがローカルで動かせることを願ってる。

ページの英語版: https://apps.apple.com/us/app/google-ai-edge-gallery/id67496... Androidでも利用可能: https://play.google.com/store/apps/details?id=com.google.ai.... これはGoogleのEdgeプロジェクトのデモアプリだよ: https://ai.google.dev/edge

この新しいモデルは本当に印象的だね。大幅なスピードアップも期待できるし、AI Edge GalleryはGPUで動いてるけど、最近のハイエンドプロセッサのNPUsはもっと速くなるはず。例えばA16チップ（Macbook NeoやiPhone 16シリーズ）は、Neural Engineが35 TOPSで、GPUは7 TFLOPSだよ。同じような話がQualcommにもある。

└

そんな低消費電力のチップでそれはすごいね。Mシリーズのバージョンが待ちきれない。デスクトップやスマホに非常に速いTPUが来るのは確実だと思う。

OPです。未来のAIの現実的な使い方は、ほぼ無料でローカルデバイス上で使うか、クラウドで今よりもずっと高くなるかのどちらかだと思っています。後者は、人間がやるには高すぎるか、遅すぎるタスクにしか使われないでしょう。このGemma 4モデルには、iPhoneやmacOSとの統合で「Her」（映画の）スタイルの未来のSiriや他のAIに希望が持てます。

Hacker Newsで議論の続きを見る

ハクソク