世界を動かす技術を、日本語で。

iPhone向けのGemma 4

概要

  • AI Edge Gallery はiPhoneで動作するオープンソースLLM実行アプリ
  • Gemma 4 対応で最新AIを完全オフラインで利用可能
  • プライバシー重視、全ての推論が端末内で完結
  • 多機能 :エージェントスキル、マルチモーダル、音声文字起こし等
  • 開発者・AI愛好家向け のコミュニティ主導プロジェクト

AI Edge Gallery:iPhone向け次世代AI実行環境

  • 世界最先端のオープンソース大規模言語モデル(LLM) をiPhoneで直接実行
  • 完全オフライン・高速・プライバシー重視 のAI体験
  • Gemma 4ファミリー 対応で最新AI技術の体験が可能

主な機能

  • エージェントスキル(Agent Skills)

    • 会話型LLMを 能動的アシスタント へ進化
    • Wikipedia連携、インタラクティブ地図、ビジュアル要約カードなど
    • URLからモジュール型スキル をロード可能
    • GitHub Discussionsで コミュニティ制作スキル を参照・利用
  • AIチャット+シンキングモード(Thinking Mode)

    • マルチターン会話 を自然に実現
    • シンキングモードで モデルの推論プロセスを可視化
    • 複雑な問題解決の思考過程を ステップごとに表示
    • 現時点では Gemma 4ファミリー 等一部モデルで対応
  • Ask Image(画像質問)

    • カメラや写真ギャラリーから 物体認識・ビジュアル説明 ・画像パズル解決
  • Audio Scribe(音声文字起こし)

    • リアルタイム音声認識・翻訳 を端末内AIで実現
    • 高効率・高精度なテキスト変換
  • Prompt Lab

    • プロンプトテスト専用空間
    • 温度・top-k等パラメータを詳細に調整
    • 単発プロンプトの挙動を 細かく検証
  • Mobile Actions

    • オフラインで 端末操作や自動化タスク を実行
    • FunctionGemma 270m ファインチューモデル利用
  • Tiny Garden

    • 自然言語で仮想ガーデンを育てるミニゲーム
    • FunctionGemma 270mのファインチューンを活用した実験的機能
  • モデル管理&ベンチマーク

    • 多様なオープンソースモデル を簡単ダウンロード・管理
    • カスタムモデルの追加 も可能
    • ベンチマークテスト で端末ごとの性能を把握
  • 100%端末内プライバシー

    • 全推論が端末内で完結
    • インターネット接続不要で 完全プライベート

コミュニティとサポート

  • オープンソースプロジェクト として開発者・AI愛好家に最適
  • GitHubでソースコード公開 (https://github.com/google-ai-edge/gallery)
  • コミュニティによる機能追加・スキル共有 が活発
  • サポート・フィードバック :google-ai-edge-gallery-android-feedback@google.com

アプリ情報・利用条件

  • 無料・iPhone専用 (iOS 17.0以降必須)
  • Mac(Apple Silicon, macOS 14.0以降)Apple Vision(visionOS 1.0以降) にも対応
  • アプリサイズ :35.4MB
  • 提供元 :Google LLC(EU法準拠、詳細な連絡先情報あり)
  • 対象年齢 :13歳以上(軽度の暴言・ユーモア、ホラー要素あり)

最新アップデート内容(v1.0.2)

  • Gemma 4正式対応 :完全オフラインで最新高性能モデルを体験
  • エージェントスキル強化 :Wikipedia検索・地図表示等のモジュール追加
  • AIチャットのThinking Mode実装 :推論過程の可視化(Gemma 4等対応モデル限定)
  • バグ修正・安定性向上

AI Edge Gallery は、端末内で最新AI技術を安全・高速に体験したいユーザーや、独自のAIアシスタントを開発したいエンジニアに最適な次世代プラットフォーム。

Hackerたちの意見

すごいモデルだね。今、Macで動かしてるけど、iPhoneでもローカルに使えるの?試してみないと!待って、エージェントスキルとかモバイルアクションも全部電話内でできるの?マジで?(後でチェックしなきゃ!誰かアドバイスある?)普段は「アブリテレート」みたいなことはしないんだけど、https://github.com/p-e-w/heretic を見つけて、数日前にこのモデルで試してみたくなっちゃった(実際、使いやすいようにリポジトリも作ったよ)https://github.com/pmarreck/gemma4-heretical で… わあ、うまくいった!それに、内蔵のナニーがないのも楽しい!MLXバージョンも作れるみたいで、Macではちょっと速く動くけど、残念ながらOllamaでは動かないんだ。(LM Studioかも。)M4 Macbook Pro(128GB)でめっちゃ快適に動いてるし、64GBでも大丈夫そう…小さいメモリだと、量子化を下げる必要があるかも。個人的に、デアラインされたローカルモデルが好きなんだ。誰かの遊び場で遊ぶときに、自分の考えを監視されるのは嫌だし、自分のローカルのオープンソースでもジャッジされたくないからね。それに、倫理的に正当化できるけどルールに引っかかる会話(「センシティブ」とか「倫理的にギリギリだけど生産的」とか「聖なる牛を侵害する」とかにざっくりカテゴライズできる)もできるようになって、今までにはなかったレベルだよ。注意:これをOpenClawに接続しようとしたけど、問題があった。明らかな質問に答えると、そういうのは悪い行為者を助長するよね(他のツールも同じだけど)。でも、実際にはもっと多くの良い行為者がいるし、悪い行為者は良い行為者が自分に課すルールなんて聞かないから。

Macでomlx[1]を使ってmlxモデルを動かしてるけど、すごくうまくいってるよ。[1] https://github.com/jundot/omlx

エージェントスキルプラットフォームでまだ何も作ってないけど、個人的には結構クールだと思う。Androidでは、サンドボックスがindex.htmlをWebViewに読み込んで、ウィンドウプロパティを通じて標準化された文字列I/Oをハーネスに送ってる。レンダリングされたHTMLページを返すこともできるよ。確かにハックっぽいけど、将来的にエッジコンピュートエージェントのサンドボックスがどうなるかの兆しを感じる。

それに、倫理的に正当化できるけどルールに引っかかる会話(「センシティブ」とか「倫理的にギリギリだけど生産的」とか「聖なる牛を侵害する」とかにざっくりカテゴライズできる)もできるようになって、今までにはなかったレベルだよ。アブリテレートスクリプトをチェックしたけど、まだ何をするのか、結果がどうなるのか理解できてない。これが可能にする会話は何なの?

Macで試してみたけど、コーディングに関してはQwenと比べてあまり感心しなかったな。もっと得意なこともあるのかな?

「倫理的に正当化できるけどルールに引っかかる会話のセットがあって、これを使うことで今までにないレベルで可能になった。ローカルLLMで実行する予定の例をいくつか教えてくれない?興味津々なんだ。」

これすごい!1) iPhoneでモデルを動かせて、いい結果が出てる。クラウドのGeminiほどではないけど、いい感じ。2) LLMがフラッシュライトをオンにしたり、地図を開いたりできる「モバイルアクション」ツールコールが大好き。Siriショートカットのサポートが追加されたら楽しいのに。Appleが約束したパーソナルオートメーションが欲しいけど、結局実現されなかった。3) ローカルモデルが普通になるのが楽しみ。教師向けに小さなアプリを作ってるけど、厳しいプライバシー法があって、可能な限りクライアントサイドで動くコードを書くのが好きなんだ。アプリやウェブサイトを開発する時、デバイス内モデルへの簡単なAPIアクセスが無料で欲しい。今のところiOSやChromeである程度は存在してるけど、特に良いわけではないと思う。

自分にとって、幻覚やガスライティングは数年前に逆戻りした感じ。ストロベリーの「r」の質問にも失敗するし、懐かしいな。これがローカルで動くのはすごいと思う。これからも数年前の同等モデルがローカルで動かせることを願ってる。

ページの英語版: https://apps.apple.com/us/app/google-ai-edge-gallery/id67496... Androidでも利用可能: https://play.google.com/store/apps/details?id=com.google.ai.... これはGoogleのEdgeプロジェクトのデモアプリだよ: https://ai.google.dev/edge

この新しいモデルは本当に印象的だね。大幅なスピードアップも期待できるし、AI Edge GalleryはGPUで動いてるけど、最近のハイエンドプロセッサのNPUsはもっと速くなるはず。例えばA16チップ(Macbook NeoやiPhone 16シリーズ)は、Neural Engineが35 TOPSで、GPUは7 TFLOPSだよ。同じような話がQualcommにもある。

そんな低消費電力のチップでそれはすごいね。Mシリーズのバージョンが待ちきれない。デスクトップやスマホに非常に速いTPUが来るのは確実だと思う。

OPです。未来のAIの現実的な使い方は、ほぼ無料でローカルデバイス上で使うか、クラウドで今よりもずっと高くなるかのどちらかだと思っています。後者は、人間がやるには高すぎるか、遅すぎるタスクにしか使われないでしょう。このGemma 4モデルには、iPhoneやmacOSとの統合で「Her」(映画の)スタイルの未来のSiriや他のAIに希望が持てます。

本当に「Her」を見て、これが実現すべき未来だと思ったの?マジで???

これは君の夢への第一歩じゃないよ。

それともクラウドで、今よりずっと高くなるか。なんで?大手が推論で利益を上げてるのは広く知られてるよね。彼らがまだ損失を出してるのは、トレーニングがすごく高いからだけど、モデルがクラウドで動いてようがデバイスで動いてようが、それはやらなきゃいけないことなんだ。考えてみれば、モデルを動かすための専用クラウドハードウェアを持つ方が、常に安くてエネルギー効率が良いよ。たとえ可能でも、スマホで動かすのはバッテリーを食いつぶすだけだよ。

ベンダーが所有してコントロールしてる電話で動いてるローカルモデルって、正直あんまりワクワクしないかな。物理的には「ローカル」だけど、精神的にはそうじゃないよね。

消費者デバイスで無料モデルが動かせるなら、クラウドプロバイダーが同じことをできない理由って何だと思う?もっと良くて、支払う価値のある付加価値がついてるのに。

僕のiPhone 13では、ほとんどのモデルが動かないんだ。ちゃんとしたローカルLLMがあれば、通常より早くアップグレードする理由の一つになるかもしれない。

MarkdownやLaTeXには対応してないし、生成中はスクロールが使い物にならない。E4Bは熱放射の影響を考える際に対流や伝導を正しく考慮できなかった(31bはかなり良かった)。セッション内で3つ質問した後(考えながら)、E4Bはおかしくなって、定められたトークン制限に達する前にナンセンスな断片を出し始めた(実際にチェックしてないのかもしれないけど)。

このアプリはクールで、いくつかのユースケースを示してるけど、E2Bモデルの能力をまだ十分に伝えてないと思う。M3 ProでGemma E2Bを使って、リアルタイムAI(音声/映像入力、音声出力)を作ったんだ。数時間前に/r/LocalLLaMAに投稿したら、少し注目を集めてるよ[0]。ここがリポジトリ[1]。iPhoneじゃなくてMacbookで動かしてるけど、ここでのベンチマーク[2]を基にすれば、iPhone 17 Proでも同じことができるはず。

Parlor、めっちゃクールだね!特に無料で提供してるのがいい。ローカルLLMの素晴らしい使い方だと思う。

いいね!iPhone 16 ProでGemma-4-E2B-itモデルを使って30TPSで試してみたよ。推論中にかなり熱くなったけど、パフォーマンスはすごく印象的だった。自分のアプリでも試してみるのが待ちきれない!

Gemma 4、最高だね!https://aibenchy.com/compare/google-gemma-4-31b-it-medium/go... ローカルで動くなら、26B A4Bのやつだと思うけど?