Show HN: Cactus – スマートフォン向けOllama

2025年7月11日原文(github.com)

概要

Cactus は、スマートフォン上で LLM/VLM/TTSモデル をローカル実行できるクロスプラットフォームフレームワーク
Flutter ・ React-Native で利用可能、幅広い GGUFモデル （Qwen, Gemma, Llama等）に対応
2ビット量子化 から FP32 まで幅広い精度サポート、デバイス負荷を軽減
MCPツールコール や クラウドフォールバック など実用的な機能を搭載
完全 オープンソース、多様なデバイスでAIアプリ開発が可能

Cactus: スマホで動くクロスプラットフォームAIフレームワーク

Cactus は、スマートフォンやエッジデバイスで LLM/VLM/TTS などの生成AIモデルを ローカル実行 できるフレームワーク
Flutter ・ React-Native ・ Kotlin Multi-platform で利用可能、クロスプラットフォーム開発に最適
Huggingface で公開されている GGUF形式モデル （Qwen, Gemma, Llama, DeepSeek, Phi, Mistral, SmolLM, SmolVLM, InternVLM, Jan Nanoなど）をサポート
2ビット量子化 ～ FP32 精度まで対応、端末のリソース消費を最適化
MCPツールコール でリマインダー設定、ギャラリー検索、メッセージ返信などのAIエージェント機能を実現
クラウドモデルへのフォールバック 機能搭載。ローカルで処理できない場合や端末障害時は大規模クラウドモデルに自動切替
Jinja2対応チャットテンプレート ・ トークンストリーミング サポート
完全 オープンソース、GitHubリポジトリ（https://github.com/cactus-compute/cactus）で公開

主な特徴とメリット

スマホ・タブレット・スマートTV・スマートウォッチ など多様なデバイスで動作
プライバシー保護 ：ローカル推論によりユーザーデータを外部送信せずにAI機能を実現
リアルタイム推論 ：クラウド依存なし、低遅延でAI処理が可能
パーソナライズRAGパイプライン などユーザーごとに最適化されたAI体験を提供
Apple Foundation Frameworks や Google AI Edge のようなプラットフォーム専用フレームワークと異なり、クロスプラットフォームで幅広いモデルをサポート

インストール・導入方法

Flutter

プロジェクトのターミナルで下記コマンド実行 flutter pub add cactus

例：テキスト補完

import 'package:cactus/cactus.dart';
final lm = await CactusLM.init(
  modelUrl: 'huggingface/gguf/link',
  contextSize: 2048,
);
final messages = [ChatMessage(role: 'user', content: 'Hello!')];
final response = await lm.completion(messages, maxTokens: 100, temperature: 0.7);

埋め込み・VLM・クラウドフォールバック等も同様にAPI呼び出し可能
詳細は Flutter公式ドキュメント 参照

React-Native

下記コマンドでインストール npm install cactus-react-native && npx pod-install

例：テキスト補完

import { CactusLM } from 'cactus-react-native';
const { lm, error } = await CactusLM.init({ model: '/path/to/model.gguf', n_ctx: 2048, });
const messages = [{ role: 'user', content: 'Hello!' }];
const params = { n_predict: 100, temperature: 0.7 };
const response = await lm.completion(messages, params);

埋め込み・VLM・クラウドフォールバック等も同様にAPI呼び出し可能
詳細は React公式ドキュメント 参照

C/C++ バックエンド

リポジトリをクローン git clone https://github.com/cactus-compute/cactus.git
スクリプト実行権限付与 chmod +x scripts/*.sh
各プラットフォーム向けビルドスクリプトを実行し、サンプルアプリで動作確認
Android/iOSシミュレータでアプリを起動し、実際にモデルを動かして開発可能

モデル推論速度ベンチマーク

例：Gemma3 1B Q4 / Qwen3 4B Q4 の推論速度（toks/sec）
- iPhone 16 Pro Max: 54 / 18
- iPhone 15 Pro: 45 / 15
- Samsung Galaxy S24 Ultra: 42 / 14
- OnePlus 13 5G: 43 / 14
- Redmi K70 Ultra: 24 / 8
最新端末で高速な推論性能を実現

コントリビュート方法

バグ修正 ：修正後にブランチを作成（git checkout -b <branch-name>）、PRを提出
新機能追加 ：まずIssueを立てて他の開発者と議論
Discordコミュニティ で情報交換・サポート

まとめ

Cactus は、スマートフォンやエッジデバイスで本格的なAIアプリを クロスプラットフォーム に開発できる先進的なフレームワーク
モデル選択の自由度、 デバイス負荷軽減、 実用的なAIツールコール、 クラウドとの連携 など、現場で役立つ機能を多数搭載
オープンソース で活発に開発が進行中、今後も多くのAIアプリ・エージェント開発を後押し

公式リポジトリ ：https://github.com/cactus-compute/cactus 推奨モデル一覧 ：HuggingFaceページにて公開

ハクソク

Show HN: Cactus – スマートフォン向けOllama

概要

Cactus: スマホで動くクロスプラットフォームAIフレームワーク

主な特徴とメリット

インストール・導入方法

Flutter

React-Native

C/C++ バックエンド

モデル推論速度ベンチマーク

コントリビュート方法

まとめ

Hackerたちの意見