世界を動かす技術を、日本語で。

Kimi K2.5 技術報告 [pdf]

概要

  • MoonshotAIKimi-K2.5 に関する公開通知について解説
  • 通知設定 の変更には サインイン が必要
  • Fork数Star数 などのリポジトリ情報を整理
  • 通知管理コミュニティ参加 に関するポイントを紹介
  • 主に GitHub 上での操作方法を中心に説明

MoonshotAI / Kimi-K2.5 公開通知について

  • MoonshotAI / Kimi-K2.5 リポジトリの通知機能

  • 通知設定の変更 には、 GitHubアカウントへのサインイン が必須

  • 通知設定 の種類:全て、参加中、無効など

  • リポジトリをFork することで、独自のコピーを作成可能

  • Star を付けることで、お気に入りリポジトリとして登録

    • Fork数:3
    • Star数:129
  • 通知管理 による新規リリースやIssueの把握

  • コミュニティ参加 やコントリビューション促進

GitHub上での通知設定・コミュニティ活動

  • 通知設定 はリポジトリページ右上のベルアイコンから操作

  • サインイン 済みユーザーのみ設定変更が可能

  • Fork ボタンをクリックでリポジトリを自分のアカウントに複製

  • Star ボタンでリポジトリをお気に入りリストに追加

  • IssuePull request の更新情報も通知対象

    • コントリビューション議論参加 の促進
    • 最新情報の受け取り によるプロジェクト理解の深化
  • MoonshotAI / Kimi-K2.5 の開発動向をリアルタイムで把握可能

Hackerたちの意見

ここ数日、このモデル(コーディングエージェントとして)を使ってみたけど、オープンソースのモデルが大手ラボと本気で競えるって感じたのは初めてだよ。今のところ、投げたほとんどのことに対応できてる。Opusと同じくらい良いって言うのはちょっとためらうけどね。

どうやって動かしてるか教えてくれない?

ちょっと気になったんだけど、どんなスペック持ってるの?(GPU / RAM)要件見たけど、予算オーバーで小さいQwenコーダーに「縛られてる」感じ。

私も同じ経験をしてる。ここ数日、OpusとKimiを行ったり来たりしてるけど、少なくとも私のCRUDウェブアプリに関しては、どちらも同じレベルだと思う。

エージェントスワームの機能がすごく好きなんだけど、その機能はOpenCodeでも使えるの?それともKimi CLI専用のものなのかな?エージェントはその機能を認識してる必要があるの?

OpenCodeで動くみたいだけど、正確に何が起きてるのかは分からないな。OpenCodeが異なるサブエージェント間でビューを切り替えるUIを見せてくれたときはすごく感動したよ。OpenCodeがその機能を認識してるのか、モデルがサブエージェントを生成したり並行ツールコールを実行する方法をうまく伝えてるのかは分からないけど。

誰か試したことある?コストに見合う価値があるって決めた人いる?トークンの使い方がさらに無駄遣いだって聞いたけど。

OpenAIのモデルがmoonshotaiのモデルよりも約400倍の価値があるってのは興味深いね。意外とモデルが近いのにね。

まぁ、悪魔の弁護をするなら、片方は世界中のシリコンウェハーをほぼ独占している有名な企業で、もう片方は暗号詐欺みたいな名前だよね。それに、中国の企業の評価をするのは、実質的に国有だからナンセンスだと思う。

OpenAIは、週に約10億人のアクティブユーザーがいる有名な企業だよね。モデルがどれだけ近いかに関わらず、Kimiよりも遥かに高く評価される現実はないと思う。

彼らが明確に魔法のようなステップアップをして、ユーザーをキャッチするインフラを持っていない限り。

最近、opencodeのMiniMax M-2.1にかなり満足してるんだけど、Kimi 2.5は実際のシナリオでどう比較されるの?

私の経験では、ずっと良いよ。M2.1は俳句とソネットの間って感じ。K2.5はOpusに近いと思う。いくつかのコードを削除してテストに基づいて再実装させるテストをした結果だね。それに、デザインや仕様書を書くのもすごく良い感じ。今日もOpenCodeでK2.5を無料でテストできるよ。

これらのモデルは、テキストからの情報検索や推論が得意なのかな?今、gemini3flashとgpt5miniのMoEを使って新聞記事を読んでるんだけど、オープンモデルを使うのが難しかったのはpydanticのサポートがなかったからだよ。

それはツールの呼び出し能力と大体関連してるね。Kimi K2.5は、前のオープンソースモデルよりもその点でかなり良いよ。君の使い方にはK2.5を試してみる価値があるかも。前の世代のオープンソースモデルが失敗したところで成功するかもしれないし。

このモデルには本当に感心してるし、Kimi CLIもすごいよ。今は「Moderato」プラン(最初の7日間は無料、その後19ドル)で使ってる。Claude CodeとOpusに対する真の競争相手だね。

これを動かすにはM3U 512GBのMac Studioが2台必要なの?

このKimi K2は今のところ最高だね。Geminiもいいけど、GoogleはスタンフォードやMITの学問的バイアスに囚われてて、発想が固定されちゃってる。中国はAIで確実に先を行ってるね。アメリカの誰かがもっと違った考え方をしてくれたらいいのに。

でもGoogleはスタンフォードやMITの学問的バイアスに囚われてて、発想が固定されちゃってる どういう意味か詳しく教えてくれる?よくわからないんだけど。

残念ながらK2.5はK2の個性をかなり失っちゃったみたい。今はもっとChatGPTやGemini、C-3POっぽい話し方になってる。別に悪くはないと思うけど、ユニークさがあったからそれがなくなるのはちょっと悲しいな。例を挙げると、https://www.kimi.com/share/19c115d6-6402-87d5-8000-000062fec... (K2.5) と https://www.kimi.com/share/19c11615-8a92-89cb-8000-000063ee6... (K2)

同意する。K2は率直で、ストレートで、結構...合理的だったよね?K2.5はもっとスロープな感じが強い。

この特定の質問から判断するのは難しいけど、K2.5の出力は少なくともわずかに良くなってると思う。ただ、本当の問題は最初の「それはとても興味深い」という皮肉っぽい言い回しかな。それでも、イギリスのユーザーなら問題ないかもしれないね。

Kimi K2Tは良かった。このモデルは素晴らしいよ。テストしてきた時間(基本的に発売されてからずっと)を考えると、指示に従うのがすごく得意で、タスクをこなすのも上手いし、文脈に毒されることもない。ClaudeやGPTは使ってないから、比較はできないけど、オープンな競合と比べると確実に頭一つ抜けてるね。