世界を動かす技術を、日本語で。

Ollamaの新しいアプリ

概要

  • Ollama の新アプリが macOSWindows で利用可能
  • モデルとの チャット がより簡単に
  • ファイル のドラッグ&ドロップ対応
  • マルチモーダル 機能の強化
  • CLI バージョンも GitHub で提供

Ollama新アプリの特徴

  • macOSWindows 向けの新アプリ提供開始
    • モデルとの チャット 機能を搭載
    • ファイルのドラッグ&ドロップ でテキストやPDFを簡単に送信可能
  • 大容量ドキュメント 対応
    • 設定から コンテキスト長 を増やすことで大きなファイルも処理可能
    • 注意点: メモリ使用量 が増加
  • マルチモーダルサポート
    • 新しいエンジンにより 画像 も送信可能
    • 例: Google DeepMindGemma 3 モデルなど対応モデルで利用
  • コードファイル の解析
    • モデルによる コード理解ドキュメント作成 支援
  • 導入方法
    • Ollama公式サイト からmacOS・Windows版をダウンロード
    • CLI専用版GitHubリリースページ で配布

CLIバージョンとダウンロード方法

  • 純粋なCLI版 Ollama
    • GUI不要なユーザー向け
    • Ollama GitHubリリースページ で配布
  • インストール手順
    • 対応OSに合わせて アプリ または CLI版 を選択
    • ダウンロード後、 簡単なセットアップ で利用開始

利用シーンとメリット

  • 研究ビジネス での大規模ドキュメント処理
  • エンジニア によるコードファイル解析やドキュメント化
  • 画像データ とテキストの統合処理が必要な場面
  • 直感的なUI で誰でも簡単にモデル活用が可能

Hackerたちの意見

「Ollamaの新しいアプリがmacOSとWindows向けにリリースされたけど、Linuxは今のところなしだね。」

「LLMがLinux版を作れるはずじゃないの?」

「ダウンロードボタンをクリックすれば、Linuxが選択肢として出てくるよ。」

「なんでLinuxじゃないの?UIはChromeベースのやつっぽいし、たぶんElectronだから、Linuxに移植するのは簡単なはず。ソースへのリンクもある?」

「Electronのクロスプラットフォームの約束はあるけど、『このボタンを押してElectronアプリをLinuxに出せば大丈夫』ってのは今の現状じゃないよ。glibcのバージョンの問題みたいなちょっとしたことが多いけど、GPUサポートはずっと問題がある。」

「Linux版が最初だったのかな?(または発表の仕方が変だったのかも)ダウンロードページにはちゃんとあるよね。」

「Electron…これがどうやってネイティブとしてマーケティングされるのか気になるな。」

Ollamaの新しいアプリをmacOSとWindowsで今日ダウンロードしよう。 > Ollamaの純粋なCLIバージョンは、OllamaのGitHubリリースページからスタンドアロンでダウンロードできるよ。クローズドソースっぽいね。それに、確認したところ、アプリはTauriアプリみたいで、Chromiumの代わりにシステムのWebViewを使ってるみたい。

パワーユーザーや開発者は、もうCLIからLinuxでこれを使えると思うよ。この新しいアプリはWindowsとMacOS用で、一般ユーザー向けに作られてるってことだね。

「Open WebUIを使ってみたけど、めっちゃ驚いた!ChatGPTよりもいいインターフェースだよ! https://github.com/open-webui/open-webui これと比べるとどうなんだろう?機能がたくさんあって、動きもいいし。」

https://lmstudio.ai/

Open WebUIのライセンスはまだOSI互換なの?redditでこの件についてちょっとした騒動を見たけど、今の状況はよくわからない。https://docs.openwebui.com/license/

それを言いたかったんだ。Mac用に、任意のテキストをハイライトして、そのテキストをLLMへのクエリに使うためのホットキーを設定できるツールを作ったんだ。どんなテキストでも使えるから便利だよ。ブラウザ、IDE、メールなどで使えるし。

https://msty.app/

CherryStudioはこのケースにぴったりのパワーツールだよ。https://github.com/CherryHQ/cherry-studio -- MCP、検索、ペルソナ、推論サポートもある。私はllama.cppとllama-swapと一緒にたくさん使ってる。

これを作ってるんだ: https://dinoki.ai/ 完全にローカルで動いて、プライバシー重視のネイティブアプリ(macOS用はSwift、Windows用はWPF)。

ユーザビリティの観点から言うと、OpenWebUIが求めてるものだよ。いろんなモデルのチャットに対応してるし。

これは、Cactus ChatっていうiPhone用のオープンソースのモバイルアプリで、ちょっとキビキビ動く(もしかしたら品質を犠牲にしてるかも)アプリだよ: https://apps.apple.com/us/app/cactus-chat/id6744444212

https://chorus.sh/についての考え。

自分で作ってみなよ!学ぶにはすごくいい方法だし、最新の開発にも興味を持ち続けられるよ。それに、クールなUXの実験を試してみて、何がうまくいくかを見ることができるし。2023年に自分のインターフェースを作って、そこから少しずつ追加してるんだ。先月はMLXを使ってローカルモデルを追加したよ。もっと多くの開発者が自分のインターフェースを作らないのが不思議だな。簡単に作れるし、たくさん学べるのに。

ここ2ヶ月くらいAnythingLLMを使ってて、すごく気に入ってる。モデルと特定のプロンプトを組み合わせた「ワークスペース」を整理できるし、Ollamaや主要なLLMプロバイダーにも対応してる。ラズベリーパイのDockerコンテナで動かしてて、Tailscaleを使ってどこからでもアクセスできるようにしてる。モバイルでも見た目がいいから、かなりスムーズだよ。それとRaycastのClaude拡張を使ってランダムな質問にも答えてもらってて、ほぼ自分がやりたいことは全部できてる。

https://boltai.com/

その中のほとんどを試したけど、結局dify.aiに戻っちゃうんだ。オープンソースで、リモートエンドポイントに接続できて、同時に最大4つのモデルをテストできる。複数のモデルを使って異なる目標を達成するワークフローも作れるよ。

何でも聞いて。Electron。Pythonバックエンド。Ollamaや他のバックエンドと話せるよ。デザインとパッケージングの手助けが必要。https://github.com/adsharma/ask-me-anything

ホームページを見た感じ、ターゲットオーディエンスが開発者から一般ユーザーに大きくシフトしたみたいだね。https://ollama.com/ 以前は開発者向けのOllamaのCLIバージョンが中心だったけど、今はそれすら触れられてない。ブログの最後にはこう書いてある:

「Ollamaの純粋なCLIバージョンは、OllamaのGitHubリリースページからスタンドアロンでダウンロードできます。」 それに対して何も言うつもりはないけど、ただの観察だね。以前、いくつかのローカルLLMアプリを試してみたけど、私にとってのベストはLM Studio [1] とMsty [2]だった。これは絶対チェックするつもり。ChatGPTデスクトップアプリが持っている機能で、ローカルLLMアプリにもいいアイデアだと思うのは、いつでも新しいチャットを開くためのショートカット(Alt + Space)があること。UIが簡素化されていて、素早い質問に便利なんだ。

LM StudioがリモートのOpenAI APIサーバーやクラウドプロバイダーと通信する方法はある?

Ollamaのメンテナーの一人ですけど、これをピボットだとは思ってないよ。私たちも開発者だから、自分たちで使ってるし。実際、これまでにもいろんな人が作ったプロトタイプがたくさんあったんだ。私たちがハマったから、自分たちのために作ったんだよ。Ollamaは開発者のために作られていて、機能をどんどん改善していくことに力を入れてるんだ。

Mstyのことは聞いたことがあって、ちょっと試したこともあるんだ。再度ウェブサイトを見てみたら、機能が豊富そうだね。LM Studioのことは知らなかったけど、商用利用が無料っていうのはいいね(Mattはそうじゃないし)。この二つをどう比較する?俺の主な使い方は、モデルと会話するアプリを開発するんじゃなくて、チャットインターフェースのツールとして使うことなんだ。

これは実際、開発者にとってもポジティブだよ。Ollamaをインストールしてるユーザーが増えれば、彼らのためにデスクトップAIアプリをリリースできるし、自分のアプリに追加モデルをバンドルする必要もなくなる。追加コストがないから、そういうユーザーに無料や安いサブスクリプションを提供しやすくなる。最新のQwen30Bモデルは本当に強力だし、Ollamaがインストールされてるかチェックして、もしなければサブインストールとしてダウンロードするインストールテンプレートがあればさらに良いね。ユーザーのコンピュータのスペックも確認して、十分なRAMと速いCPU/GPUがあるかもチェックするAPIもあればいいな。

CLIサービスをしばらく使った後、WindowsでOllamaのUIを試してみたよ。- シンプルさが気に入った。これなら、技術に詳しくない友達や家族をローカルLLMに簡単にセットアップできるね、クリック数回で済むし。 - マルチモーダルとMarkdownのサポートも期待通りに動いてる。 - モデルのドロップダウンには、自分のローカルモデルとレジストリにある人気のモデルが表示される。プロンプトや高度なパラメータを調整する必要がない基本的な使い方なら、Open WebUIよりもこれを使うかもしれない。もしかしたら、後でそれらが公開されるかもね。でも今のところ、シンプルさが強みだと思う。

このアプリがリモートのOllamaインスタンスに接続する方法を提供してないのがちょっと驚きだな。私が持ってる最も強力なコンピュータが、必ずしもGUIを動かしてるコンピュータとは限らないから。

アプリにはOllamaをネットワークに公開する機能があるから、もしかしたら来るかもね。

[遅延]

もしこのLLMをガッツリ使ってる人で、コーディング経験があるなら、自分専用のチャットUIを作っちゃうのをおすすめするよ。OpenAIに対応したエンドポイントを使って推論して、フロントエンドのコンポーネントフレームワークを使えば(最近は標準のチャットコンポーネントが追加されてるものも多い)、あとはほぼ簡単だよ。俺はジェミニの助けを借りて1週間で作ったけど、今は毎日使ってる。これって商用利用できるかって?全然無理だけど、自分が欲しいように動いてくれるし、「これができたらいいのに…」って思ったら、すぐに追加できるからね。

今年読んだ中で一番「自分でLinuxを作っちゃえ」ってコメントだね。ツールをダウンロードして数秒で生産的になれるって感じかな。

俺もそうしてるよ。大事なのはモデルだよね。あとはほとんど trivial だし。ここにオープンソースのスクリプトについてShow HNを投稿したことがあるよ(https://github.com/n-k/tinycoder)(https://news.ycombinator.com/item?id=44674856)。ChatGPTとかのちょっとした助けで作れたし、今は毎日使ってる。近いうちにDDGとGitHub検索も追加するかも。

AIやLLMを探求してるんだ。Pythonを使って自分のAIチャットボットを作ったり、VercelのAI SDKやOpenAI互換のAPIエンドポイントを使ったりしてる。そして最終的にはそれを基に製品を作る予定。1. VT.ai(https://github.com/vinhnx/VT.ai) 2. VT Chat(https://vtchat.io.vn):自分の製品だよ。

OpenAIのAPIに対応したSwiftアプリを作ってるんだ。プロバイダー間でモデルを簡単に切り替えられるし、OS統合用のホットキーでテキストや画像をキャプチャできるようにしてる。試した他のLLMフロントエンドに比べてかなりミニマルだけど、俺には合ってるんだ。[1]: https://www.wvlen.llc/apps/tomo

俺がバカなのかもしれないけど、これがブラウザでAIサービスをいくつもタブで開いてるのと何が違うのか全然わからないんだけど?

Ollamaは全部ローカルで動くから、企業に覗かれる心配がないんだ。