世界を動かす技術を、日本語で。

リオデジャネイロの「ホームグロウン」LLMは既存モデルの統合のようです

2026年6月15日原文(github.com)

概要

  • prefeitura-rio/Rio-3.5-Open-397B は独自開発モデルとされているが、実際は異なる
  • NexQwen3.5-397B-A17B の重みを単純合成したもの
  • 独自学習の証拠は見当たらない
  • システムプロンプト削除時、自己認識は Nex が79%、 Rio は0%
  • すべての重みテンソルは0.6/0.4の合成比率で一致

prefeitura-rio/Rio-3.5-Open-397Bの実態

  • IplanRIO が独自訓練した397Bモデルと称する prefeitura-rio/Rio-3.5-Open-397B
  • 実際は Nex (Nex-AGI)と Qwen3.5-397B-A17B の重みを 約0.6:0.4 で要素ごとに合成
  • 独自トレーニングの形跡が一切確認できない状況

証拠と検証手法

  • Rio のハードコードされた「You are Rio」システムプロンプトを除去
    • この状態でモデル自身が「 Nex, from Nex-AGI」と認識する割合が 79%
    • Rio」と認識することは 0%
  • 組織独自のバックストーリーも Nex のものをそのまま引用
  • 全60層・全ネットワーク構成要素の重みテンソルが、標準偏差数千分の一致度で 0.6 Nex / 0.4 Qwen の混合
  • 他のファインチューニングモデルではこのような単純な合成では説明不可能

まとめと判断材料

  • prefeitura-rio/Rio-3.5-Open-397B は、独自モデルではなく NexQwen の重み合成モデル
  • 独自トレーニングやオリジナル性の主張には根拠が見当たらない
  • 上記の証拠をもとに、事実関係の判断材料として提示

Hackerたちの意見

リオデジャネイロ市(IT企業IplanRIOを通じて)が、ベンチマークで同等のオープンモデルを上回る自社開発のQwen3.5ファインチューニング「Rio-3.5-Open-397B」を発表したんだって。リンク先の問題では、実際には約60%のNex-N2 Proと約40%のQwen3.5-397B-A17Bの加重マージだと主張しているよ。Nex-N2は約1週間前にリリースされたばかりなんだ。

問題はQwenへのクレジットが欠けていることじゃなくて、Nex-N2 Proについて言及していないことだよね?

そんなモデルのマージが可能だなんて知らなかったよ。(純粋なソフトウェアの観点からは明らかに可能だけど、効果があるとは驚きだね)

モデルのウェブページ(https://huggingface.co/prefeitura-rio/Rio-3.5-Open-397B)には、今はマージだって書いてあるよ。以前はこの段落がなかったんだ:>このモデルは、https://huggingface.co/nex-agi/Nex-N2-Pro と https://huggingface.co/Qwen/Qwen3.5-397B-A17B のマージによって構築され、より強力なモデルからのオンポリシーディスティレーションが行われた。前のバージョンでは、最終的なディスティルモデルではなく、ベースのマージ版がアップロードされてしまった不正確なアップロードを検出した。混乱を招いてしまい、本当に申し訳ありません。ところで、今は人々がGithubのイシューをブログとして使ってるの?

編集: 誰かがこれがリオのリポジトリじゃなくてネックスのリポジトリにあるって指摘するまで気づかなかったよ。OPの混乱が理解できた! これは普通の問題としてフレームされてなかったから、君が反応してるのはそのブレイクだと思う。つまり、READMEの更新を求めてなかったわけで、でも今はプロジェクトのイシュートラッカーを使って、無視できない場所で名指しして恥をかかせるのが一般的になってる。これが正しいのか、社会的に良いのか、プロフェッショナルなのかは議論の余地があるけど(2026年にイシュートラッカーでエチケットの単一の定義が期待できるかどうかもね)。でも、誰かがその不満をリポジトリに直接持ち込む理由はわかるでしょ? メンテナンス担当者に返事を促すし、ネットからの攻撃も受けやすくなるし、敵対的なスレッドをロックする決定がまた別の声明になるからね。メンテナンス担当者は公式な返答を投稿して、スレッドをロックすべきだと思う。そこはきっと荒れるだろうから。

ああ、誰かが適切なクレジットなしに自分の仕事で利益を得てるなんて!?

クレジットの問題じゃなくて、ラボの能力について嘘をつくことが問題なんだよ。

「彼らの仕事」?まず、99.99%の仕事をした元のコンテンツクリエイターがいて、その後アメリカの企業がそれをフロンティアLLMにまとめた。で、「彼ら」はそのアメリカのモデルを基に自分たちのものを作る「仕事」をしたわけ。だから、実際の製品に入った仕事の0.00001%をやったってことなら、まあそうかもね。Linuxのディストリビューションをフォークして、テーマやフォントを少し追加して、他の誰かがそのディストリビューションをフォークして別のテーマを追加したときに文句を言うようなもんだよ。

これは納税者のお金を使った純粋な詐欺だね。でも、他に何が期待できるっていうの?

これは他のオープンウェイトモデルに基づいたオープンウェイトモデルなんだ。問題は、彼らが出したときに、出力を改善するためのポストトレーニングを行ったと主張してたこと。実際には、彼らが言ってたようなポストトレーニングはされてなかったことがわかったんだ。HFのページには今、モデルのマージだって書いてあるけど、前はそんなことなかった。彼らは間違ってHFに違うモデルをアップロードしたって主張してて、すぐに本物をアップロードするつもりらしい。要するに、彼らは二つのオープンウェイトモデルを組み合わせて、すごいポストトレーニングを達成したって言えると思ってたけど、他の研究者がポストトレーニングがなかったことを見つけるだろうってことに気づかなかったんだ。

正直、彼らがモデルを作ろうとする気があったことに驚いてる。市のIT部門がこれに挑戦する勇気があったのは、ちょっとすごいかもね。

マージやファインチューニングは、ちょっとお金を使える人なら手が届く範囲だから、自治体でもできると思うよ。

Hacker Newsで議論の続きを見る