世界を動かす技術を、日本語で。

LMスタジオ 0.4

概要

  • LM Studio 0.4.0 の主な新機能と改善点を解説
  • llmster によるGUI不要なデプロイ、サーバー運用の容易化
  • 並列リクエスト や連続バッチ処理による高スループット対応
  • 新REST API エンドポイントや刷新されたUI体験
  • 詳細なリリースノート と各ビルドの主な修正点を網羅

LM Studio 0.4.0の新機能と概要

  • LM Studio 0.4.0 は、次世代の大規模言語モデル運用基盤としてリリース
  • 並列リクエスト連続バッチ処理 で高スループットな推論サービスを実現
  • GUI不要 なデプロイが可能なllmsterを新たに提供
  • 状態保持型REST API エンドポイント(/v1/chat)の追加
  • ユーザーインターフェース を全面刷新し、操作性と開発者体験を向上

llmsterによるサーバーネイティブ運用

  • llmster はLM Studioのコア機能を独立デーモンとして提供
  • GUI非依存 でLinux、クラウド、GPUサーバー、Google Colabなど多様な環境へ展開可能
  • ローカルPC でもターミナルベースで利用可能
  • インストール方法
    • Linux/Mac:
      • curl -fsSL https://lmstudio.ai/install.sh | bash
    • Windows:
      • irm https://lmstudio.ai/install.ps1 | iex
  • 主なコマンド
    • デーモン起動: lms daemon up
    • モデル取得: lms get <model>
    • サーバー起動: lms server start
    • 対話セッション: lms chat
    • ランタイム更新: lms runtime update llama.cpp(macOSはlms runtime update mlx

並列リクエストと連続バッチ処理

  • llama.cppエンジン がバージョン2.0.0へ進化
  • 同一モデルへの並列推論リクエスト が可能
  • Split View で複数チャットを同時に操作
  • Max Concurrent Predictions
    • モデルごとに同時処理数を設定
    • 超過分はキューイング
  • Unified KV Cache
    • リクエストごとのリソース割り当て最適化
    • デフォルトで有効
  • MLXエンジン への対応は今後予定

UI刷新と新機能

  • チャットエクスポート
    • PDF・Markdown・テキスト形式で出力可能
  • Split View
    • チャットウィンドウを左右分割し、複数セッションを同時表示
  • Developer Mode
    • 高度な設定やオプションを一括表示
    • Settings > Developerから有効化
  • アプリ内ドキュメント
    • REST APIやCLIコマンド、詳細設定を網羅

新CLI体験「lms chat」

  • lms chat コマンドでターミナルからインタラクティブチャット
  • モデルのダウンロードや各種操作が可能
  • lms chat --helpで詳細オプション確認

新REST APIエンドポイント: /v1/chat

  • /v1/chat は状態保持型RESTエンドポイント
  • response_id による会話継続が可能
  • トークン数や速度など詳細な統計情報 をレスポンスで取得
  • ローカルMCP の利用も許可キーで制御
  • 許可キー はSettings > Serverで発行・管理

主なバグ修正・改善点(ビルド別抜粋)

  • Build 17
    • MCPの必要時のみロード
    • アップデート後の設定リセットバグ修正
  • Build 16
    • Discover/My Modelsボタンの新アイコン
    • モデルピッカーやダウンロード関連のバグ修正
  • Build 15
    • 並列リクエスト&連続バッチング機能追加
    • Split View、Developer Modeの統合
    • モデル検索やチャットタブ制御の改善
  • Build 13-12
    • ナビゲーション配置設定やMy Modelsカラム選択機能
    • モデルピッカーやチャットUIの細かな修正
  • Build 11
    • UI全面刷新
    • CLI新機能(lms chat、slashコマンドなど)
    • REST APIエンドポイントの追加・変更
    • PDF出力や複数チャット削除の信頼性向上

まとめ

  • LM Studio 0.4.0 は、サーバー運用や開発者体験を劇的に向上させる大規模アップデート
  • llmster によるクラウド・CI・ローカルでの柔軟なデプロイ
  • 並列リクエスト新REST API で業務用途にも強力対応
  • UI刷新 と多彩な新機能で、初心者から開発者まで幅広く活用可能
  • ユーザーからのフィードバック を歓迎し、今後も継続的な改善を予定

Hackerたちの意見

LMStudioがコマンドラインインターフェースを導入したことで、全てが一周した感じだね。

ちなみに、LMStudioは前からCLIがあったけど、デスクトップアプリを開いてないと使えなかったんだ。これで、デスクトップアプリを開いてなくても、ちゃんとヘッドレスでLMStudioを動かせるようになったよ。lms chatは前からあったし、lms daemon up / "llmster"が新しいコマンドだね。

lmsterが楽しみで、早く試してみたい!これがまさにollamaに求めていたものなんだ。ollamaは元々のコア原則からかなり逸脱しちゃったし、モデルサポートの更新も遅いし壊れがちだよね。「ベンダー同期」ってのを数週間待ってるんだけど、結局ggmlの更新なんだよね。

ollamaの元々のコア原則って何だったっけ?昔oobaboogaを使ってたけど、ollamaは必要ないと思ったんだよね。

LM Studioは素晴らしいけど、まだオープンソースじゃないんだよね。正直、OllamaよりもLM Studioに似た何かが作られることを願ってる(少なくとも新しいCLI部分はそう見えるし)。オープンソースの代替品が欲しいな。自分はそこそこ技術的だと思うけど、Ollamaのシンプルさが好きなんだ。でも、Ollamaに関する不満もわかるし、もっと良い代替品が出てくれることを願ってる。vllmやllama.cppの上に直接レイヤーを作るだけでもいいかもね。

いや、ユーザーインターフェースが本当にひどくなったよ。「ダーク」モードが今は全然ダークじゃなくて、ただのグレーだし、プロ用のツールっていうより、子供のおもちゃみたいになってきてる。

今のところ、VS Codeみたいに見えるね(多少の違いはあるけど)。多くのプロが両方を使うことになると思うよ。「おもちゃみたいに見える」ってのは、使い方にはあまり関係ないしね。

そうそう、テーマの選択肢が足りないし、自分でカスタマイズするのもできなかった。

LM Studioはollamaとどう違うの?どっちを使うべきか迷ってるんだけど。私の印象では、LM Studioは基本的にollamaタイプのソリューションだけど、IDEが含まれてるって感じかな。これって正しい理解?AIの世界は変化が早すぎて、全然追いつけないよ :(

モデルの設定や管理が簡単にできるGUIがあって、.gguf形式でモデルを保存/読み込みできるのがいいね。Ollamaは複数のファイルにモデルを保存するから、.ggufをOllamaで読み込むことはできるけど、変な形式でコピーが作られちゃうんだよね。だから、ドライブに重複を置くか、元の.gguを削除するしかない。

OllamaはCLI/APIが「第一」だけど、LM StudioはちゃんとしたGUIがあってチャット機能もある。少なくとも技術に詳しくないユーザーにはOllamaよりずっと使いやすいよ(とはいえ、機能がどんどん統合されてきて、LM StudioがCLI/API機能を追加したり、OllamaがUIを強化したりしてるけどね)。

LM Studioはローカルモデルを簡単に始められるところが素晴らしい。UXも良くて、細かい設定をいじる必要もないけど、やりたいなら選択肢もある。

ようやく見た目がそんなにダサくないUIが出てきた。今は、LM Studioとllamabarn/Ollamaの間で同じLLMモデルを共有できるように設定できるかどうかだけが気になってる(重複したモデルにストレージを無駄にしたくないから)。

Ollamaはモデルの重みをDockerのレジストリやレイヤーを模倣するという素晴らしい選択をしたから、Ollamaでダウンロードしたモデルは他のツールで簡単に再利用できないんだ。LM Studioでダウンロードしたモデルは、単にディレクトリと重みをそのまま使うだけだから、llama.cppや好きなツールを指し示せば動くんだよね。

最近は、llama.cppサーバー以外を使う必要を感じないな。結構いいウェブUIとモデル切り替え用のルーターモードがあるから。

MacでのMLXサポートが、私にとっての一番の理由だったよ。

私は主にLM Studioを使ってモデルをブラウジングしたりダウンロードしたり、さっと試してみるけど、実際に統合するのはいつもllama.cppかvLLMなんだ。彼らの新しいCLIも試してみたいけど、llama.cppにどんな追加のメリットがあるのか気になるね。

複数のエージェントを動かす時、同時実行性は重要な使い方だよね。vLLMは、GB10やGPUからパフォーマンスを引き出してくれるから、他では得られない効果があるんだ。

LM Studioをしばらく使ってるけど、これはいいアップデートだね。自分が必要としてることには、ローカルモデルを動かすのが十分すぎるくらい。もちろん、十分なRAMがある前提だけど。

私の不満は、LM StudioがMacに管理者権限でインストールしようとすること。理由は全くわからないし、向こうも説明してくれない。

これって、もしかしてこの問題と同じ? https://github.com/lmstudio-ai/lmstudio-bug-tracker/issues/4... 私はLinuxとWindowsでしかLM Desktopを使ったことがないけど、管理者権限を求められたことは一度もないよ。

これを借りて質問なんだけど、もしMacに256GBのSSDしかない場合、プログラミングに最適なローカルモデル(とそれを使うツール)は何? Codexにはすごく慣れてるけど、ローカルではあんなに賢くはならないのはわかってる。スペースをあまり取らない、Codexみたいなコーディングモデルってある?