GCCを使用したRustコンパイラの構築

2025年7月7日原文(fractalfir.github.io)

概要

Rustコンパイラを GCCベース でブートストラップする試み
LLVMを使わず、 cg_gcc を利用した3段階のビルド工程
#[inline(always)] 属性による再帰関数の問題とその回避策
128ビット整数の SwitchInt サポート不備によるビルド障害
パフォーマンスと正確性を両立するための実装上の工夫

RustコンパイラをGCCでブートストラップする挑戦

Rustコンパイラの ブートストラップ とは、Rust自身でRustコンパイラをビルドする工程
LLVMを使用せず、 GCCベース のコード生成（cg_gcc）を利用
ビルド工程は3段階
- Stage 1: 既存のLLVMベースRustコンパイラでGCCベースのrustcとコード生成をビルド
- Stage 2: GCCベースのコード生成でRustコンパイラを再ビルド
- Stage 3: Stage2でビルドしたコンパイラで再度ビルドし、バイナリの同一性を確認
Stage3到達が GSoCプロジェクト の目標

現状の課題とバグ

3つの主要なバグが Stage3ビルド の妨げ
バグの特定には「コンパイラのロボトミー」と呼ぶ デバッグ手法 を使用
- 問題のあるクレートや関数のソースコードを直接修正し、ビルドを進める
- 例：128ビット整数未対応、インライン化属性の除去、最適化無効化

#[inline(always)]と再帰関数の問題

#[inline(always)] 属性付きの再帰関数がGCCバックエンドでエラーとなる
LLVMではこの属性は 「ヒント」扱い で、インライン不可能なら無視
GCCでは「常にインライン化」を厳格に解釈し、自己呼び出しで失敗
対策1：全ての#[inline(always)]を#[inline]として扱う
- 簡単だが、 パフォーマンス低下 の懸念
対策2：関数が 再帰的 （直接・間接問わず）である場合のみ属性を弱める
- 直接再帰チェックだけでは不十分（間接再帰を見逃す）
- 間接再帰まで考慮すると 実装が複雑・非効率 となる

効率的な属性チェック手法

#[inline(always)] を持つ関数が、同じ属性を持つ関数を呼び出しているかをMIRで調査
- MIR（Mid-level Intermediate Representation）を利用した低コストなチェック
- 基本ブロックの終端（Terminator）を走査し、呼び出し先の属性を確認
- 条件を満たす場合のみ#[inline(always)]→#[inline]へ変換
この方法により、 必要最小限の修正 で問題を回避しつつ、パフォーマンスも維持

128ビットSwitchIntのバグ

SwitchInt はMIRの条件分岐命令で、Cのswitch文に類似
128ビット整数を扱うSwitchIntが GCCバックエンド で未対応
libgccjitがエラーを出し、ビルドが停止
根本原因は、GCCのIRで128ビット整数の定数生成が正しく扱えないこと
対策には libgccjitの拡張 や、128ビット整数サポートの追加が必要

まとめ

RustコンパイラのGCCベースブートストラップは 多くの技術的課題 を含む
#[inline(always)]と再帰、 128ビット整数の分岐 など、LLVMとは異なるGCCの特性を考慮した実装工夫が不可欠
MIRや属性チェックによる 効率的な問題回避 が重要
今後も パフォーマンスと正確性のバランス を意識した開発が求められる

Hackerたちの意見

一見するとそうは思えないかもしれないけど、これはすごい進展だよ。コンパイラがブートストラップできるようになるのは大きな成果だし、特にRustは色んな要素がうまくいかないといけないからね。信頼性のあるブートストラップができるようになれば、パフォーマンス向上のためのステップがたくさん始められる。おめでとう！

└

gccにはあんまり詳しくないんだ。ほんとにパフォーマンス向上に大きく寄与するの？

今日、またRustをいじり始めたばかり。神の加護を。

すごく面白い記事だった。最近、誰かがrustcの遅さは大部分がllvmによるものだと言ってたのを聞いた。ここでの作業とはあまり関係ないかもしれないけど、異なるツールチェインでコンパイラを構築するアイデアは好きだし、将来的に何か影響が出るかもしれないね。

└

遅いのは、借用チェッカーがNP完全だから。LLVMがrustcに対してGCCより遅いコードを生成するかもしれないけど、スナッピーさの欠如の主な原因には全然近くないと思う。

└

ワークロードによるけど、コード生成はコンパイル全体の時間の大部分を占めるよね。とはいえ、LLVMが常に修正が必要な場所ってわけじゃない。例えば、rustcがLLVMで多くの時間を使う理由の一つは、rustcがLLVMに渡すコードが多すぎるからで、LLVMのオプティマイザーに改善を頼ってるんだ。時間が経つにつれて、LLVMに投げるコードの量が改善されてきて、パフォーマンスも上がってるよ。

└

craneliftを使った実験的なコンパイラバックエンドがあるんだけど、デバッグビルドの時間を改善することになってるんだ。Rustの長いコンパイル時間に関するスレッドではあまり言及されていないから、何か見落としているのか分からないな。 [1] https://github.com/rust-lang/rustc_codegen_cranelift/ [2] https://cranelift.dev/

普通、コンパイラのデバッグはかなり簡単なんだ。まあ、普通の実行可能ファイルだからね。 > でも、ブートストラッププロセスでは全体がすごく複雑になる。実は、rustcは直接呼び出されるわけじゃないんだ。ブートストラップスクリプトがコンパイラのラッパーを呼び出すんだ。 > そのラップされたrustcを実行するのも簡単じゃない。複雑な環境フラグをたくさん設定する必要があるから。 > つまり、Rustコンパイラのデバッグ方法はわからないってこと。99.9%の確率で簡単な方法がどこかに文書化されてるはずだけど、探そうとは思わなかった。これを投稿した後、誰かが「お、Xをやればいいだけだよ」って教えてくれるだろうけど。 > でも、この記事を書いてる時点では、どうやってやるのかわからなかった。 > それで、実行中のプロセスにgdbをアタッチできるの？いや、あまりにも早くクラッシュしちゃうから無理だよ。この問題がどれだけ頻繁に起こるか、そしてそれに対処するための様々なトリックを持ってるのがちょっと面白い。時々、スクリプトをパッチしてgdb --args [元のコマンド]を呼び出すようにするけど、これはシンプルなシェルスクリプトの場合にしか価値がないし、stdin/stdoutがどこに行くか追跡できる時だけだ。そうじゃない場合は、実行する前に少しスリープするようにコードをパッチして、GDBをアタッチするチャンスを作ることもある。いくつかのプラットフォームでは、プロセスのexecを通知してくれたり、時にはそれをインターセプトしたりできる（例えばEDRソリューションとして）こともあって、その時はプロセスが立ち上がる前に一時停止させることもある。でも、一般的にもっと良い方法があればいいのにな…LLDBには「待機フラグ」があるけど、新しいプロセスを待ってる間ずっとループしてるだけで、早すぎる段階で死んじゃうものはキャッチできないんだ。

└

他のアイデア: * 全プロセスツリーをgdbの下でset detach-on-fork offで実行する。 * LD_PRELOADでライブラリを挿入して、起動時やシグナル/終了時にスリープを入れる。理想的には、特定のプロセスを再帰的に名前付けして識別できるインフラがあればいいな。

└

SIGSEGVをフックして、プロセスの端末に最適な推測を使ってgdbを起動するLD_PRELOADライブラリを持ってるよ（今のところ、stdioのリダイレクトが多いプロセスをデバッグする必要がなかったから、あまり賢くないけど）。

└

同意だな。最近、大きなJavaプログラムを扱ってて、90分くらい（長すぎた、ちょっと執着しちゃった）頑張ったけど、デバッガに入れるのを諦めた。ここはrustにがっかりするところで、「cargo debug」が内蔵されてないんだ（外部プログラムはあるけど、あんまりうまくいかない）。手動でgdbをつなごうとすると、ほとんどのシンボルが欠けてることが多い。デバッガ優先の言語を真剣に考えてみたいな、どんな体験になるのか見てみたい。

└

著者がコアダンプを強制できるかどうか気になってきた。最近のスナップショット機能を使えば、モダンなIntelプロセッサーでプロセッサートレースが取得できるから、実際のインタラクティブなデバッグセッションがなくても役立つかも（最近はスナップショットで十分だから、そんなセッションはやってないけど）。

Hacker Newsで議論の続きを見る

ハクソク