NanoChat – 100ドルで買える最高のChatGPT

2025年10月14日原文(github.com)

概要

nanochat は、約 $100 で構築できるChatGPT風LLMの フルスタック実装。 依存性が少なく、1台の8XH100ノード上で 学習から推論、Web UI提供まで 一括実行。 低コスト・短時間 で自分専用のLLMを体験可能。 拡張性・可搬性 が高く、教育用途や研究にも最適。 簡潔でハックしやすいコードベース が特徴。

nanochatとは

低コストLLM構築 を目指したChatGPT風AIチャットボット実装
依存性が少なく、全工程を 1台の8XH100ノード で完結
スクリプト（speedrun.sh）一発 で、 トークナイズ・事前学習・微調整・評価・推論・Web UI提供 まで自動化
Eureka Labs によるLLM101nコースの 最終課題 として開発

クイックスタート

8XH100ノード（例：Lambda）を用意し、 speedrun.sh で全自動パイプライン実行
実行例:
- bash speedrun.sh
- スクリーンセッション利用:
  - screen -L -Logfile speedrun.log -S speedrun bash speedrun.sh
4時間程度 で学習・推論まで完了
完了後、 Web UI で自作LLMと対話可能
- 仮想環境有効化: source .venv/bin/activate
- サーバ起動: python -m scripts.chat_web
- 指定URL（例：http://209.20.xxx.xxx:8000/）にアクセス

モデルの規模と性能

$100ティア: 約4e19FLOPs、幼稚園児レベルの対話能力
$300ティア（d26モデル）: 12時間学習、GPT-2 COREスコアを僅かに上回る性能
$1000ティア: 約41.6時間学習、現状は未サポート
学習データやバッチサイズ の調整で大規模モデルにも対応可能
- 例: --depth=26、--device_batch_size=16 など
VRAM不足時 はバッチサイズを適宜減少

実行環境と柔軟性

Ampere 8XA100ノード でも動作（速度は低下）
単一GPU でも動作可能（8倍時間がかかる）
PyTorchベース で、xpu/mps等にも対応（要調整）
80GB未満のGPU では--device_batch_sizeを減らすことで対応

レポート・評価指標

実行後、 report.md に評価指標・メトリクスが自動生成
例:
- Characters, Lines, Files, Tokens, Dependencies
- 各種ベンチマーク（ARC, GSM8K, HumanEval, MMLU, ChatCOREなど）

質問・ドキュメント活用

コード全体を1ファイルにパッケージ化 し、他LLMに質問可能
- 例: files-to-prompt . -e py -e md ... > packaged.txt
DeepWiki でリポジトリを直接検索・質問可能
- URLのgithub.comをdeepwiki.comに変更

テスト・コントリビュート

テストコード も一部用意（例: tokenizerテスト）
- 実行例: python -m pytest tests/test_rustbpe.py -v -s
貢献歓迎: < $1000予算でのエンドツーエンドLLM強化が目標
シンプルで可読性重視のコードベース
- 巨大な設定ファイルや複雑な分岐は排除

謝辞・ライセンス

nanoGPT や modded-nanoGPT から着想・実装を一部拝借
HuggingFace, Lambda, Alec Radford 等への感謝
MITライセンス で公開
論文引用例あり

参考リンク

Hackerたちの意見

わあ、Eureka Labsのコースにどうやって申し込むの？費用はいくらなの？

└

カーパシーが言ってたけど、ナノチャットはEureka Labsが開発中のLLM101nコースの集大成プロジェクトになるらしいね。まだ進行中なのかな？他に情報は見つからなかった。

└

まだ開発中で、残ってる作業はナノチャットの調整（現在の状態はしっかりしたv0.1）と、学生が隠れた複雑さを「アンロック」できるようにするための中間プロジェクトの最終化だね：torch.Tensor、torch.dist、.backward()、.compile()など。それから、もっとオペレーションが重い部分も。

人類に貢献する最良の方法についてずっと考えてたんだ。助ける人数 × 助ける量だと思う。カーパシーがやってることは、それを達成するための最高のレバレッジの一つだと思う。今の世界はオープンソースプロジェクトの上に成り立ってるから、どこにいても誰でもプログラミングを学んで素晴らしいソフトウェアを作れるんだよね。AI/LLMの波でも同じことが起こるといいな。

└

彼のANN/LLMの基礎からの動画は、すごくおすすめだよ。彼はわかりやすいインストラクターだし、コードもすごくPythonicで、簡潔だけど読みやすいバランスが取れてるんだ。ただ、Pytorchのベクトル化の部分はちょっと複雑だけど、彼のせいじゃないしね。だから、彼のコードスタイルを見て真似するだけでも、みんなにとってプラスになると思うよ。

└

技術が悪用されて、フェイクニュースや誤情報が増えるんじゃないかって心配してる。

└

そんなに簡単だったらいいのにね。

└

ソフトウェアの自由な伝統って、僕がすごく好きなところなんだけど、LLMでは高いトレーニングコストと推論に必要な強力なハードウェアのせいで、続けられるかどうか疑問だよね。ソフトウェアを書くのが、LLMのホストに家賃を払わないといけなくなるような気がする。多くの現代のソフトウェアツールのように、誰でもアクセスできる形でローカル推論ができる方法を見つける可能性もあるけど、高いトレーニングコストを考えると、それは難しいと思う。LLMに頼るようになると、プログラミングを手動で学ぶための初心者向けのチュートリアルやコンテンツが減ってしまうんじゃないかとも心配してる。

Eureka Labs: https://github.com/EurekaLabsAI アンドレイは本当に多才な人だね。追いかけるのがすごく楽しい！

こちらがカーパシーの発表ポスト[0]で、少し追加のコンテキストがあるよ。[0] https://x.com/karpathy/status/1977755427569111362

└

ありがとう！それもトップテキストに入れておくね。

LLMの達人アレック・ラッドフォードにアドバイスを感謝。ああ、アレックとアンドレイのポッドキャストがあったら、インターネットが壊れちゃうだろうな…ただの思いつきだけど…GPT1の栄光の日々から、今はGPT3を4時間で作ってるなんて。

Hacker Newsで議論の続きを見る

ハクソク