Show HN: 2つのゲーミングGPUでHuggingFaceのオープンLLMリーダーボードを制覇した方法

2026年3月10日原文(dnhkng.github.io)

概要

既存のLLMの重みを一切変更せず、独自のレイヤー複製手法でHuggingFace Open LLM Leaderboardのトップを獲得
Transformer内部構造の「神経解剖学」的な役割分担を観察
Base64チャットやGoliath-120Bの異常な構造から着想
独自の「脳スキャナ」パイプラインで層の再利用や複製をシステマティックに検証
結果として、モデルの推論能力向上や新たな構造的知見を得る

LLM神経解剖学：重みを変えずにAIリーダーボード首位を獲るまで

2024年中頃、 HuggingFace Open LLM Leaderboard はオープンウェイトAIの競技場
数千のモデルが6つのベンチマークで競争、 dnhkng/RYS-XLarge が1位を獲得
新規学習や重み合成・ファインチューニングなし、 既存72Bモデルの中間層7ブロックを複製 して接続
重みは一切変更せず、 推論時のレイヤー経路だけを操作
この手法により、モデルの「思考」部分を強化し性能向上を実現

着想のきっかけ：Base64チャット現象

2023年後半、 LLMにBase64エンコードされた質問を投げると正しく回答 する現象を発見
- 例：「What is the capital of France?」をBase64化→モデルが正しく「Paris」と返答
モデルは入力をデコードし、内部表現で推論後、再エンコードして返す
英語、Python、Mandarin、Base64など多様な形式に対応
初期層：入力形式を抽象表現に変換
後半層：抽象表現を出力形式に再変換
中間層：純粋な推論・抽象的な内部言語の役割 と推測

Goliath-120Bの異常構造からのヒント

2023年11月、Alpindaleが Goliath-120B （Llama-2 70Bモデル2体を層ごとに交互に合成）を公開
- 層の順序を入れ替え、 後方層の出力を前方層へ入力 するという異常な構成
通常、各層は直前の層の出力分布に最適化されている
「未来の層」の出力を「過去の層」に入力してもモデルが動作 した点が驚異
Transformer内部表現の 均質性・柔軟性 の証明
これらの観察から、Transformerには 「機能的解剖学」 が存在すると仮説

独自「脳スキャナ」パイプラインの構築

4090搭載の自宅MLリグで ExLlamaV2による量子化モデル推論
N層モデルに対し、 (i, j)区間の層を複製して経路に挿入
- 例：(2, 7)なら2～6層を2回通過
すべての(i, j)ペアで「脳スキャン」を実施、 3,240通り以上の構成を検証
学習不要、 推論のみで構造的特徴を解析

評価プロキシタスクの工夫

全ベンチマークでの全構成検証は非現実的
高速・客観的・構造的特性を測る簡易タスク を設計
- 出力トークン最小化
- 客観的スコアリング（LLM判定不要）
- 認知要求の独立性
試行錯誤の末、創造性タスクやLLM判定の一貫性問題を乗り越えた評価法を開発

LLM神経解剖学の発見と今後

Transformerの 初期層＝翻訳、後半層＝再翻訳、中間層＝抽象推論 という「神経解剖学」的役割分担を強く示唆
中間層の複製で推論能力向上 を実証
既存モデルの重みを一切変更せず、 構造操作だけで性能を引き出す新たな可能性
今後のAI設計やモデル解釈学の新たな道筋

この手法・発見は論文未発表だが、 ブログでの公開がより楽しい という理由で今回紹介。

Hackerたちの意見

ここに作者がいます。Qwen2-72Bで特定の7層の中間レイヤーを複製したところ、重みを変更せずにパフォーマンスが向上し、全てのOpen LLMリーダーボードのベンチマークで1位を獲得しました。2026年現在、そのリーダーボードのトップ4モデルはまだ子孫です。変な発見は、単一層の複製は何も効果がないこと。層が少なすぎるとダメ、逆に多すぎると悪化します。約7層の回路サイズのブロックだけが機能するようです。これは、事前学習がレイヤースタック内に明確な機能回路を形成し、それが全体を保つときだけ機能することを示唆しています。この全ては、私の地下室で2台のRTX 4090を使って開発しました。今は、デュアルGH200リグで現在のモデル（GLM-4.7、Qwen3.5、MiniMax M2.5）を動かしています（他の投稿を見てね）。コードと新しいモデルはもうすぐ公開予定です。質問があれば喜んで答えます。

└

潜在空間の推論を解明したかもしれませんね。こういうのがうまくいくんじゃないかと思ってたんですが、トレーニングがどうバックプロパゲートするかは分からなかった。でも、既存のレイヤーを複製するだけでいいって示してくれましたね。複製したレイヤーを使ってシンプルなインラインループを試したことはありますか？パフォーマンスを見るのが面白そうです。それに、MOEモデルと比較するのも興味深いですね。これらのレイヤーが異なる「専門家」として機能しているのか、潜在空間で推論が行われているのかを見てみたいです。

└

このレイヤーの複製は、ループした言語モデルの「貧乏人版」みたいに感じますね。けど、かなりクールです。LLMの脳外科手術みたいなものですね。

└

デュアルGH200の構成は素晴らしかったです。こんなに才能があって、他の分野でも素晴らしい成果を上げている人を見るのは最高ですね。あなたがそれをやっていると知って感謝です。

└

超クールですね！これらの回路を特定するのに役立つ分析やツールはありますか？最近これを見つけて、あなたがやったのと似た方法で特に強い「回路」を特定してみたいと思っています。

└

レイヤーの中に隠れているかもしれない認知的リンガフランカのアイデアは魅力的で、プラグイン可能な知識バンクという素敵なアイデアに希望を与えてくれます。MoEは別として、インターネット全体と数十万冊の盗まれた本でトレーニングされたモデルは、特定のワークフローに必要な知識よりもはるかに多くの知識を持っています。今日の作業に役立つ知識バンクをプラグインできるスリムなモデルを提供できれば素晴らしいですね。それに、モデルの知識を全体を再トレーニングせずに新鮮に保つこともできるということです。

└

こんな素敵なブログ記事をシェアしてくれてありがとう！最近読んだ中で一番楽しかったかも。すごくモチベーションが上がったよ！

└

投稿ありがとう！すごくクールな内容だね！読みやすくて親しみやすい書き方も感謝！このテーマについてはあまり詳しくないけど、70〜80%は理解できたよ :) いいライターだね！

└

これを読んで感じた興味深いことは、「回路入力」が出力と互換性があって、パフォーマンスが向上するってどういうことなんだろう？トレーニングプロセスは、この特定の接続を見ていなかったし、レイヤー60の出力がレイヤー3に入るのも見てなかったはず。すごく面白い読み物で、これらのモデルに他にどんな有用な情報がエンコードされているのか気になるね！

└

いやー、めっちゃ楽しい読書だった！r/localllamaに投稿されたサーバー探しの話、すごく好きだったよ。AIの「議論」から欠けているのは、抽象的な数学的定式から直感的な機能理解に至る思考の流れだと思うんだけど、この記事でそれを見事に示してくれたね。3blue1brownもトランスフォーマーについて素晴らしいシリーズをやってたし、すごいよね。お疲れ様！

これを読むのが本当に楽しかったです。一般的な人たちは、あなたが説明したような神経解剖学を持っているからこそ、人生の中でこのことを直感的に経験している気がします。知識には特定の幾何学があって、直交的な動きが可能になるのが本当に魅力的です。これを公開してくれてありがとう、あなたのおかげで素敵な一日になりました！

└

ありがとう！

Hacker Newsで議論の続きを見る

ハクソク