QEMU: AIコードジェネレーターの使用を禁止するポリシーの定義

2025年6月26日原文(github.com)

概要

QEMUプロジェクトは AI生成コンテンツ を含む貢献を 原則拒否 する方針。 著作権・ライセンス問題 が未解決であり、法的リスクを回避するため。 AIツールの出力を含むパッチは 受理不可、疑いがあれば却下。 API調査やデバッグ 等でのAI利用は許容、出力を含めなければ問題なし。今後、法的状況やAI技術の進展により 方針の見直し もあり得る。

QEMUプロジェクトにおけるAI生成コンテンツ利用方針

QEMUプロジェクト はAI生成コンテンツを含む、または由来する貢献を 原則として受け付けない方針
ChatGPT、Claude、Copilot、Llama 等のAIツールによる生成物が対象
AI支援によるソフトウェア開発の普及により、 法的な懸念とリスク が増加
Large Language Model（LLM） による生成物の著作権・ライセンス状態が不明瞭
貢献者には Developer's Certificate of Origin (DCO) の遵守が求められる
DCOに従うには、 著作権とライセンス状態の完全な理解が必要
現状のAIツール出力は、 著作権・ライセンスの根拠が不明確 で法的リスクが高い
学習データに 制限付きライセンスや多様なオープンソースライセンス が含まれる場合が多い
QEMUのライセンス要件と 互換性がない場合 も多々存在
法的リスク回避のため、AI生成物を含むパッチは全面的に拒否
AI利用が判明・疑われる場合も貢献を却下
例： GitHub Copilot、OpenAI ChatGPT、Anthropic Claude、Meta Code Llama など
静的解析やAPI調査、アルゴリズム研究、デバッグ等でのAI利用は 出力が貢献物に含まれない限り許容
このポリシーは AI技術や法的状況の変化に応じて見直しの可能性
例外申請は ケースバイケースで審査
- ツールの出力に関する ライセンス・著作権状態の明確な証明 が必要
- プロジェクトメンテナによる 満足のいく説明が前提

Hackerたちの意見

本当に法律的な理由なのかな？なんか、いくつかのプロジェクトはクソみたいなAIの投稿をレビューするのに疲れちゃってる気がする。

└

これ、オープンソースを壊しちゃうかもね。クソみたいなものをすぐに生成できるのに、それをレビューして却下するのに時間がかかるから。Androidみたいに、ソースはダウンロードできるけど、実際には外部の人が貢献できないプロジェクトが増えそう。

└

彼らは方針が見直し可能だって言ってるし、例外を作ることもできるみたいだね。もしそれが言い訳なら、みんなを優しく失望させるために頑張ってるってことか。

└

AIが中央値の投稿にどんな影響を与えるかは分からないな。人間もクソみたいなコードを書くことがあるし。もし問題が投稿が多すぎることなら、それを管理するための仕組みが必要だと思う。大量の更新を受け取るプロジェクトにはトリアージチームが必要かも。ほとんどの投稿は善意で行われてると思うけど、法的な問題の可能性を避けるためにAIを使わない人もいるだろうね。そんな問題が起こる可能性は疑わしいけど、リスクを最小限にするよりも、すべてを排除したい人もいる。哲学者としては、何かの可能性を排除したと思ってる人は、ただそれについて十分に考えてないだけだと思う。

└

このポリシーは簡潔でしっかりとした内容だね。アルゴリズム的に生成されたと思われるソフトウェアコードの著作権を安全に割り当てることはできないって主張してるように思う。アルゴリズム的って言葉を使うのは、「AI lol」よりも強い感じがするから。ポリシーの中で「AIコードジェネレーター」みたいな用語も使ってるけど、そっちも強いかもしれないけど、法的に役立つ用語になるとは思えないな（ほとんど「クラッパムのオムニバスの男」みたいな感じ）。最後に、かなり妥当な締めくくりがあるね。「今設定するポリシーは今日のためのもので、見直しにオープンであるべきだ。厳格で安全に始めてから、徐々に緩めるのがベストだ。」間違いなくいろいろな問題が出てくるけど、まずは法的な角度を閉じたいみたいで、著作権の話から始めるのは妥当だと思う。このプレイブックはcurlのよりずっと良さそうだね。

└

モンサントが種の権利をどうやって守ってるか見たことある？

└

可能性はあるけど、QEMUは業界にとって非常に重要なソフトウェアだよ。デスクトップのVMからクラウド/リモートインスタンス、ビルドサーバー、セキュリティサンドボックス、クロスプラットフォーム環境まで、幅広く使われてる。ちょっとした法的リスクでも業界に大きな影響を与えるかもしれない。

どこから来てるのかは分かるけど、これは間違いだと思う。AIと著作権に関する「確立された法律」があればいいのにね。判例も少ないし、気持ちを基にする法律もほとんどない。AIからの貢献を拒否する方針に加えて、AI生成コンテンツが使える場所を指摘するのもいいかも。例えば、QEMUプロジェクトの（膨大な）CIセットアップの中で、本当に保護すべき重要なコンテンツはどれくらいあるの？もっと面白いテストケースや環境が作れるかもしれないよ。「そういうものはここに貢献して、AIはこういうガードレールを使って賢く使おう」みたいな感じで。

└

これをやらないリスクは何？オープンソースプロジェクトのためにコードは良くなるけど、速度は遅くなる？このプロジェクトにはそのリスクが合ってると思うし、著者たちもGenAIという概念に対して特に否定的じゃないみたい。ただ「一方通行のドア」を通ってるだけ。

└

コンピュータの世界では、コードを盗用しちゃいけないっていう確立された慣習があるんだ。小さなスニペットでもね。たとえ著作権法がそんな小さなものを「フェアユース」と考えたとしても。

└

これは、何十年もかかるような他の法的問題とは違うよ。今、裁判所で進行中のケースがいくつもあって、数年以内に著作権に関するいくつかの側面が明らかになるはず。QEMUはAIの助けなしでこの22年間大きな進展を遂げてきたから、あと数年待つくらい問題ないよ。

└

法的状況がはっきりするまで待つのが一番シンプルな解決策だね。QEMUは（ほとんど）GPL 2.0ライセンスだから、（ほとんどの）コードの寄付はGPL 2.0に適合する必要があるんだ。仮に、非GPL互換のコードから派生したり、記憶したり、コピーしたりしたgen AIコードを含むパッチによって追加されたコード寄付があったとしよう。そうすると、仮に法的なケースがあって、gen AIのFOSSコードは元の派生した/記憶した/コピーしたコードのライセンスを再適用しなければならないという前例ができたら、QEMUのメンテナは互換性のないコード寄付をすべて巻き戻さなきゃいけなくなるだろうね。しばらくすると、そのコード寄付が下流の呼び出し元に影響を与えて、そっちも書き直さなきゃいけなくなるかもしれない（CIコードでも）。最初に「明確に『再利用禁止：AI』とラベル付けされたCIコードだけ」と言うのは可能かもしれないけど、仮にそうなったらメンテナはそのCIコードの部分をすべて見直して書き直さなきゃいけない。さらに、レビューやマージプロセスにも余分な作業が増えるし、関わる全員にとって「今はいいや」と言った方が楽だよ。---- 注意：私は法律の専門家ではないし、ライセンスは私の専門分野ではないけど、いつかはそうなりたいな。

Hacker Newsで議論の続きを見る

ハクソク

QEMU: AIコードジェネレーターの使用を禁止するポリシーの定義

概要

QEMUプロジェクトにおけるAI生成コンテンツ利用方針

Hackerたちの意見