概要
- Mac mini(Apple Silicon)でOllamaとGemma 4(8Bモデル)を快適に運用する手順の要約
- HomebrewでOllamaをインストールし、Gemma 4をダウンロード・自動起動・プリロード・常駐化
- メモリ要件や自動起動、モデルのプリロード・キープアライブの設定方法
- API利用や便利なコマンド、アンインストール手順も網羅
- Ollama v0.19以降の新機能やGemma 4利用時の注意点も解説
Mac mini(Apple Silicon)でのOllama + Gemma 4 12Bセットアップ(2026年4月版)
-
対象環境
- Apple Silicon搭載Mac mini(M1/M2/M3/M4/M5対応)
- Gemma 4(8Bモデル)には 最低16GB のユニファイドメモリ推奨
- Homebrew インストール済みのmacOS
-
Ollamaのインストール
- Homebrew caskで Ollamaアプリ をインストール
brew install --cask ollama-app
/Applications/にOllama.app、/opt/homebrew/bin/ollamaにCLI配置
- Homebrew caskで Ollamaアプリ をインストール
-
Ollamaの起動と動作確認
open -a Ollamaでアプリ起動、メニューバーにアイコン表示- サーバー起動後、
ollama listで動作確認
-
Gemma 4のダウンロード
ollama pull gemma4で約9.6GBダウンロード- モデルサイズやバージョンは
ollama listで確認可能 - 26Bモデル は24GBメモリでも動作困難、 8B(Q4_K_M量子化) が推奨
-
モデルのテスト・GPU利用確認
ollama run gemma4:latest "Hello, what model are you?"で動作テストollama psでCPU/GPUの利用割合を確認(例:CPU14%/GPU86%)
-
自動起動・プリロード・常駐化の設定
- Ollamaアプリの自動起動
- メニューバーから「Launch at Login」またはSystem Settings > Login Itemsで設定
- Gemma 4の自動プリロード
~/Library/LaunchAgents/com.ollama.preload-gemma4.plistを作成- 5分ごとに空プロンプト送信でメモリ常駐化
launchctl load ~/Library/LaunchAgents/com.ollama.preload-gemma4.plistで有効化
- モデルの常駐(Keep Alive)設定
launchctl setenv OLLAMA_KEEP_ALIVE "-1"でモデルを無期限常駐- 永続化は
~/.zshrcへexport OLLAMA_KEEP_ALIVE="-1"追加推奨
- Ollamaアプリの自動起動
-
動作確認コマンド
ollama list:サーバー稼働確認ollama ps:モデルのメモリ常駐確認launchctl list | grep ollama:LaunchAgent登録確認
-
API利用
- ローカルAPI:
http://localhost:11434でOpenAI互換エンドポイント提供 - 例:
curl http://localhost:11434/v1/chat/completions \ -H "Content-Type: application/json" \ -d '{ "model": "gemma4:latest", "messages": [{"role": "user", "content": "Hello"}] }'
- ローカルAPI:
-
便利なコマンド一覧
ollama list:ダウンロード済みモデル一覧ollama ps:稼働中モデル・メモリ状況表示ollama run gemma4:latest:対話実行ollama stop gemma4:latest:モデルのメモリ解放ollama pull gemma4:latest:モデル更新ollama rm gemma4:latest:モデル削除
-
アンインストール・自動起動解除
launchctl unload ~/Library/LaunchAgents/com.ollama.preload-gemma4.plistrm ~/Library/LaunchAgents/com.ollama.preload-gemma4.plistbrew uninstall --cask ollama-app
Ollama v0.19以降の新機能(2026年3月31日以降)
-
Apple Silicon向けMLXバックエンド
- Apple Siliconでは MLXフレームワーク を自動利用し推論高速化
- M5/M5 Pro/M5 Max ではGPU Neural Acceleratorsも活用
- M4以前もMLXによる高速化恩恵あり
-
NVFP4(NVIDIA)対応
- NVIDIAの NVFP4形式 でモデル精度維持・メモリ帯域/ストレージ削減
- NVFP4最適化モデルにも対応し、推論結果の一貫性向上
-
キャッシュ機能強化
- コーディング・エージェント用途での キャッシュ再利用 によるメモリ効率化
- スナップショット保存による 高速応答
- スマートなキャッシュ破棄で 共通プロンプトの長期維持
メモリ要件・運用上の注意
- Gemma 4(8B) は約9.6GBメモリ消費
- 24GB Mac miniでは約14GBの余裕、同時リクエストにも対応
- Gemma 4(26B) は約17GB消費、システムの安定性低下・スワップ多発
- 8Bモデル が実用的
参考情報・公式アナウンス
- Ollama MLX Blog Post — Ollama Newsletter, March 31, 2026
- Ollama v0.20.0 Release
- Gemma 4 Announcement — Google DeepMind