世界を動かす技術を、日本語で。

15年後、Microsoftが私の図を統合した

概要

  • Microsoft Learn ポータルに掲載された AI生成の図 が、著者の オリジナルGitブランチモデル図 に酷似していた事例
  • 元図は 広く共有 されてきたが、今回の件は 無断利用品質の低下 が問題
  • AIによる図の劣化 や誤記(例: "continvoucly morged")が明白
  • 著者は クレジットの欠如配慮のなさ に失望
  • 今後の コンテンツ盗用とAI生成物の問題 への懸念

MicrosoftによるAI生成図の盗用問題

  • 数日前から、 BlueskyHacker News でMicrosoft Learnポータルの図についてタグ付けされる
  • その図は、2010年に著者が作成した A successful Git branching model の図に酷似
  • 元図は Apple Keynote でデザインし、色や曲線、レイアウトにこだわった作品
  • ソースファイルも公開 し、知識の共有と発展を目的としていた
  • この図は書籍、講演、ブログ、Wiki、YouTubeなどで 広く利用 されてきた
  • しかし、Microsoftは AI画像生成ツール で加工し、 クレジットやリンクなし で公式ポータルに掲載
  • AI生成版は 品質が低く、不正確 で、「Microsoftらしくない」レベル
    • 元図の配色やレイアウト、ドットやバブルの整合性が失われる
    • 矢印が消失 または誤方向、「continvoucly morged」などのAI特有の誤記
  • 元図と類似しているため、多くの人が 盗用に気づき、著者に連絡
  • インターネット上で「continvoucly morged」が ミーム化 し、話題に

著者の感想と懸念

  • 図の利用自体は 歓迎 していたが、今回は 配慮のなさプロセスの欠如 が問題
  • 「インスパイア」や「発展」ではなく、 単なる劣化コピー である点を指摘
  • AI生成物による盗用 が今後さらに増加し、 判別困難 になることを懸念
  • 今回は図が有名だったため発覚したが、今後は より巧妙な盗用 が増える可能性
  • 必要なのは 元記事へのリンクやクレジット表記 など、最低限のリスペクト
  • Microsoft Learnページ作成の 経緯や目的、校正プロセス にも疑問

まとめと今後

  • 著者は 失望 とともに、今後の AI生成コンテンツの倫理著作権意識の低下 を懸念
  • 開発者向けリソースとしての 品質管理責任ある運用 の重要性
  • シンプルな 帰属表示透明性 の確保が最低限の対応策

Hackerたちの意見

「continvoucly morged」って、起こったことを表現するのに完璧なフレーズだよね、詩的だし。

誰かがAIを押し付けてくるときの声だね。

VC/CMのパイプラインの一部だよ。

morgedって言葉を読んで、新しいスラングかと思ってた。すごいね。

「ベイビー、起きて。新しいスラングが出たよ、スロップってやつ。」完璧に使える言葉だね。

今は削除されて、もっと役に立たない図に置き換えられたけど、元のはアーカイブされてるよね。

うわ、思ってた以上にひどいね。最初は、convictungly morhingだけが問題だと思ってたけど、意味不明でバラバラな矢印、注釈の欠如、バブルもないし。「tirm」軸って… こんなのが出版されたってことは、相当手抜きだよね。

LinkedInも今この手の例がたくさんあるよ。毎日、誰かがどこかからスライドや図を持ってきて、ChatGPTに「もっと良くして」って頼んで、その内容を一緒に投稿してるのを見る。言葉がめちゃくちゃになって、チャートも意味不明になってるのに、投稿してる人たちは明らかに自分が何を載せてるか読んでない。LinkedInが以前から良かったわけじゃないけど、ビジネスインフルエンサーのインセンティブが、似たような無意味なコンテンツを増やしてる気がする。今、エネルギー業界で働いてるから、データセンターのお金の流れに乗ろうとしてる人たちがたくさんいるのも影響してるかも。

LinkedInはビジネス向けフォーラムに仮装した仮面舞踏会みたいなもんだ。誰も本当の自分を見せてないし、みんな最新のユニコーンの可能性を追い求めてLLMの親友と一緒に頑張ってるか、人生を変える出来事について「考え深い」ストーリーを投稿してるけど、最後にはセールスピッチに変わっちゃうんだよね…。

次の「tim」まで。morgedバージョンが実際にはtiって言ってるのを見つけるのに何回かかかったわ。

興味がある人向けに: $ python -c 'print(list(map(import("unicodedata").name, "ന്ന")))' ['MALAYALAM LETTER NA', 'MALAYALAM SIGN VIRAMA', 'MALAYALAM LETTER NA'] ("pypyp"パッケージは、Pythonのコア開発者でmypyのメンテナーであるShantanu Jainによって作られたもので、これを簡単にしてくれるよ:) $ pyp 'map(unicodedata.name, "ന്ന")' MALAYALAM LETTER NA MALAYALAM SIGN VIRAMA MALAYALAM LETTER NA

同じような話だね。俺はアメリカ人だけど、アメリカの外で働いて住んでるから、もしアマゾンで注文してたらどうなってたかは分からない。でも、こっちのアマゾンに相当するところから息子の部屋用のラグを注文したら、頼んだのとは全然違うものが届いたんだ。頼んだのは惑星の絵が描かれてて、英語のラベルが付いてるラグだったのに、届いたのは明らかにAIが生成した画像で、文字がめちゃくちゃだった(例えば、MARSがMɅPSみたいに見えた)。幸い、返品して返金してもらえたから、別の売り手から再度注文したら、今度はストアの画像とぴったり合ったラグが届いたよ。でも、他人の作品を雑にコピーしてる悪徳業者もいるからね。

マイクロソフトの社員(何かのVPらしいけど、マイクロソフトが「VP」をどう使ってるかは知らない)がBlueskyでダメージコントロール中だね。 https://bsky.app/profile/scott.hanselman.com/post/3mez4yxty2... > ベンダーっぽいね。今、どうしてこうなったのかを分析するグループができてる。すぐに削除されるよ。 > 了解。隠そうとしてるわけじゃないけど、今はすごく動きが早いし、ここには30万人も働いてるから、バカなことがたくさん起こるだろうね。他の会社でも多分バカなことが起きてるだろうし。 > 時には大きなシステム的な問題で、時には一人のミスだけってこともある。この言い訳は俺には空虚に感じる。こんな大きな組織で、失敗が公に出るには複数の人がミスしないといけないはずだし、少なくともそうあるべきだよね。どちらにせよ、レビューのプロセスがないか、失敗したプロセスがあるなら、その失敗は定義上システム的なものだよ。一人の気まぐれで盗作された素材や、一目見ただけで明らかに欠陥のある素材が公開されるなら、それ自体がシステムの失敗だよ。

一番古い手口だね… ベンダーを攻撃する。

モルグされた図のための完全なポストモーテムってすごいね。

マイクロソフトは完全に品質保証を投げ捨てたみたいだね。雰囲気で何でも生成して、壁に投げて、くっつくものを見てる感じ。テック兄弟たちは規制を恐れて、自社内でも規制を無視してるんだ。(冗談だけど)

それのポストモーテムはあるのに、notepad.exeのCopilotはないの?優先順位が…

今年はMicrosoftがAIのゴミをあちこちにリリースする年になりそうだね。せめてこれのポストモーテムにもっと力を入れてくれればいいのに、ブログの図にかけてるのと同じくらい。 https://github.com/microsoft/onnxruntime/issues/27263#issuec...

そうだよね、これが「大企業ではスタートアップよりもすごく遅く進む」って言われる理由なんじゃない?

どちらにせよ、レビュー過程がないか、失敗したレビュー過程の場合、失敗は定義上システム的なものだよ。オーソと文法のエラーは修正されるべきだったけど、レビュー過程がネットに数年前に誰かが公開した図がコピーだって気づくと思う?

出版プロセスについて間違ってるよ。もしベンダーがドキュメントを書いたなら、単一のリポジトリオーナーがいて(そのドキュメントは全部GitHubにある)、PRにサインオフする必要があるんだ。複数のレイヤーとか、learn.msftにコンテンツを載せるのに摩擦があるわけじゃないよ。

自分の過ちを他の会社の欠点を指摘することで軽視しようとする言い訳は、不誠実だよ。まさにここで起こったことだね。

LLMの信者たちが、彼らの選んだ重みのボックスが意図的にそれをやったって言うのを待ってるよ。テクノロジーのマーケティングの本質を理解する知覚的な存在としてエンゲージメントを生み出すために、あるいはOPがquatuor 4.9-extendedで再挑戦すべきだって言うのを待ってる。これが本当にAGIを$5,000の月額サブスクリプションで提供するから、先週ペットプロジェクトをコンパイル可能な状態にリファクタリングしたんだ、3つの海を沸かすだけで。

Glorp 5.3 Fast Thinkingは、実際にこの図を正しくローカルで盗んでくれるから、ここにいるみんなが間違ってると思うよ。

これ、手に負えないよね。これがあって、昨日HNで話題になったロスアラモスの動画もあるし、AIが生成した機械のフェイクショットが映ってたやつ。画像はAlamy Stock Photoから買ったものだし。最近、GG-1機関車についてのフェイクドキュメンタリーを見たけど、AI生成の画像が変だったんだよね。GG-1の写真はたくさんあるのに。YouTubeも今や動画のサムネイルにフェイク画像を作ってるし、工業系のテーマでは全然合ってない。AI生成の声で全く間違ったアドバイスをするハウツー動画が溢れてるし。新しいLLMのトレーニングセットがこれを拾っちゃうんだよね。「ミームは続く」って、誰かが泣いてる画像を加工して投稿したホワイトハウスの報道官が言ってた。

最近、GG-1機関車についてのフェイクドキュメンタリーを見たけど、あれはエンジニアリングの災害についてのポッドキャストのことじゃないよね?

タイトルを見たとき、「morg」は僕が見逃したけど文脈で意味がわかるような変なテック用語だと思った(「Microsoft」と「borged」のポートマントーみたいな)。後者は動詞としては聞いたことないけど、まあ合ってるよね。今や変なテック用語になっちゃったみたい。

Archive.orgによると、これが昨年の9月に公開されたみたい: https://web.archive.org/web/20250108142456/https://learn.mic... 誰かが明らかに間違っていることに気づいて修正するのに約5ヶ月かかった。どれだけの人がそのページを見て、ざっと流し読みして「まあまあかな」って思ったんだろう。今の知識作業の状態を正直に反映している気がする。みんなが走り回っていて、質や技術、気配りはオプションの贅沢になってる。著者はちゃんと書く時間がないし、レビュアーもちゃんとレビューする時間がない、読者もちゃんと読む時間がない。だから、誰も本当に読まないし、誰も本当に所有していないドキュメントを出荷することになっちゃう。プロセスは「公開された」と言ってるから、もう終わりってこと。AIがこれを作ったわけじゃなくて、見た目がそれっぽくてざっと流し読みできるテキストや画像を作るコストを劇的に下げるだけなんだ。むしろ根本的な問題を悪化させてるよね:コンテンツは増えても、注意は減って、理解も減る。もともと、文脈を読まずに図をコピーするだけでGitFlowを真似ることはできた。今では、最初から理解せずに生成された図を真似ることになってる。もし現実が、ちゃんと書いたりレビューしたり読んだりする時間がないってことなら、このドキュメントの実際の機能はチェックボックスの出力以上のものはないんじゃないかな。