世界を動かす技術を、日本語で。

AI時代の最大の皮肉:AIの不始末を掃除するために雇われた人間

概要

  • AI が大量の仕事を奪う一方で、人間が AIの生み出す粗雑なコンテンツ を修正する新たな職業が急増。
  • AIスロップ と呼ばれる低品質な生成物が、インターネットや文化全体に広がる現状。
  • この現象により、 人間の創造性や判断力の重要性 が改めて浮き彫りに。
  • AIスロップの清掃作業 は一時的な対症療法に過ぎず、本質的な解決には人間とAIの関係見直しが不可欠。
  • 真の課題は、 人間の創造性と誠実さ を基盤にしたテクノロジー活用の実現。

AI時代の皮肉:AIが生む仕事と奪う仕事

  • AI の普及により、数百万の従来職が消失する一方で、 AIが生み出す低品質コンテンツ の修正作業が新たな雇用機会となる現象。
  • クリエイター、デザイナー、ライターなどが、 AI生成物の修正・改善 を主な業務とする新しい職種へとシフト。
  • 本来は創造的な仕事を担う人々が、 AIのミスや不自然さの修正 に従事する現実。
  • AIによる自動生成 の恩恵を受けるはずが、逆に人間による「後始末」が不可欠となる逆説的状況。
  • クリエイター本来の役割が「AIスロップの掃除屋」へと変質する皮肉。

AIスロップとは何か

  • AIスロップ は、Jack Izzoの定義によれば「スパムの進化形」であり、 低品質で中身が薄いコンテンツ の総称。
    • 例:SNS投稿、Amazonの電子書籍、Spotifyの音楽、ニュース記事、学術論文など
  • 視覚的・言語的には魅力的 に見えるが、 独創性や信頼性に欠ける 点が特徴。
  • AI生成動画の普及により、 物理的に不自然な映像や誤った情報 が大量拡散。
    • 例:二つ頭のウサギ、消える動物、誤字だらけの広告
  • AIスロップの氾濫 が、ユーザーの情報選別能力を鈍らせ、 現実と虚構の境界 を曖昧にする危険性。

AIスロップの弊害と社会的影響

  • 誤情報の大量拡散 により、信頼できる情報が埋もれるリスク。
  • 文化全体の質的低下(enshittification) が進行。
    • 例:AI生成音楽や書籍、動画が主流化
  • 地球環境への負荷増大 (水・電力消費、CO2排出)の副作用。
  • 本来クリエイターであった人材が デジタル清掃員 に転落し、 やりがいや創造性の喪失、バーンアウトを招く。
  • AIによる社会的コスト削減 の幻想が、実際には 人間による品質管理コスト の増大を招く逆効果。

AIスロップ清掃の現場と新たな職種

  • AIコンテンツリライター :AI生成記事やブログのリライト、事実確認、感情表現の補強。
  • アート修正者 :AI生成ロゴやイラストの手直し、テキストや構図の現実化。
  • AIコードデバッガー :AIが生成したバグだらけのプログラムの修正・最適化。
  • AI動画ポリッシャー :物理法則を無視したAI動画のリアリティ向上、VFXによる修正。
  • これらの職種は AIと人間の協働 ではなく、 人間によるAIの後処理 が主目的。
  • Upwork、Fiverr、Freelancer などのプラットフォームで、AI生成物の修正依頼が急増。

最大の皮肉と本質的な解決策

  • AIが人間を置き換えるはずが、AIのミスを人間が修正する新たな下層労働を生む現実
  • 人間の創造性や共感力、物語性 が不可欠であることを逆説的に証明。
  • 問題の根源は「AI」そのものではなく、 人間の拙速な技術導入とコスト重視の姿勢
  • 解決には、 AIを単なる道具として捉え、人間の判断と創造性を常に中心に据える 発想転換が必要。
  • AIスロップ清掃 は一時的な応急処置に過ぎず、 人間本来の創造性と誠実さを守る社会設計 が最終的な目標。

結論:人間の役割とテクノロジーの未来

  • AI時代最大の皮肉 は、人間がAIの後始末をする役割に追いやられていること。
  • 最大の悲劇 は、AIスロップに慣れすぎて、人間本来のクリエイティビティや世界の美しさを忘れてしまうこと。
  • 本質的な解決策 は、AIに頼りすぎず、人間の創造性・誠実さを基盤としたテクノロジー活用の実現。
  • 人間とAIの適切な関係再構築 が、より良い未来への鍵。

Hackerたちの意見

このゴミを作るのには、驚くほどの水と電気が消費されていて、地球に悪影響を与える排出物に寄与してる。 これはどのモデルを使っているか、どのハードウェアで動かしているかに大きく依存するんだ。特に、古い記事では画像生成に必要なエネルギーが携帯電話を充電するのと同じくらいだと主張されていたけど、実際には1枚の画像生成(SDXL、25ステップ)に必要なエネルギーは、80WのGPUを35秒間動かすのと同じくらいなんだよね。

35秒 @ 80Wは約210 mAhだから、今のスマホのバッテリーの約4000mAhに比べたらかなり少ないね。

理想的な測定方法は、ユーティリティの水使用量をkWhに計算して、それをこのトークンのグラムあたりの測定にすることだと思う。もちろん小さい数値になるだろうけど、計算可能で、もし水のグラムあたりのトークンで何かを基準にするなら、これらのモデルと直接比較できるはずだよ。DC電力配分のため、データセンターではもっと効率的かもしれないね。水についても、リサイクルされたものと蒸発したものの違いとか、もっと具体的にできるかも。

誰も画像生成の話をしてる時に80WのGPUでSDXLを動かしてないし、SDXLや関連モデルのトレーニングや開発も考慮しなきゃいけないよ。AI企業はトレーニングに多くのリソースを使って、いろんな実験をしてるし、最近は気候への影響やモデルの詳細について報告するのがかなり秘密主義になってきてる(ChatGPTの画像生成モデルはSDXLと比べてどれくらい大きいの?彼らは画像モデルをいくつ持ってるの?)。

確か、君が参考にしている研究の中には、AI画像生成器のために選び抜かれた数字を使っただけでなく、人間のアーティストの人件費を過小評価しているものもあったよ。委託価格や市場の労働率を使って、必要な裏付け作業なしでその値を選んでいたんだ。彼らのナプキン計算はこうだった:人間のアーティストは一つのアートに50ドルくらい取るから、スキル的には200ドル/時だとして、つまり一つのアートには10分以上かかってはいけない、だからAIの値は10ワークステーション分未満でなければならない、みたいな。で、その計算は両方にとって同じくらい破綻してる。SDXLユーザーは使える画像が出るまでに何時間もサイコロを振るし、アーティストも面白いリクエストに対して、無料のチョコレートがついてくるかもしれないけど、1日か2日かかることもある。だから、その見積もりは偏ってるだけじゃなくて、基本的に全く役に立たないんだ。

ちょっと調べてみたんだけど、GPT-4のトレーニングには300台の車の生涯と同じくらいのエネルギーがかかるらしい。約50GWhだって。そんなに多くはないし、短い通りの家族がそのくらいのエネルギーを使ってるかもしれない。推論については、GPT-4を1時間使うのは、Netflixを1時間見るよりも少ないエネルギーを消費するよ。データセンターのエネルギー使用量を他と比べると、全体の5%に過ぎない。LLMで大きな経済を作っても、地球は救えないね。

一つの画像生成に必要な実際のエネルギー(SDXL、25ステップ)は、80WのGPUを35秒間動かすのと同じくらいだよ。で、どれだけの人が一発でその画像を作れるの?ユーザーが満足するまでに、5から20枚くらい生成されるかもしれない。

これがどうアイロニックなの? 手を抜いて生成されたAIの出力(我々が「スロップ」と呼ぶもの)は、まさにそれを洗練させるためにもっと投資する前の平凡な平均値なんだ。問題は追加の作業が必要だということじゃなくて、多くの場合、あまり追加の作業が必要ないと仮定されて、あいまいなプロンプトからの最初の生成が十分だとされていることなんだ。

アイロニーは、労働者がAIに「置き換えられた」ために解雇された後、再雇用されてスロップを片付けることになって、ビジネスのコストが最大化されるところから来てるんだよね!

学ばない社員のための中間管理職みたいなもんだね :)

他の従業員の成果物のエラーを修正する中間管理職なんて聞いたことがない。むしろそれはシニア開発者やクリエイティブの仕事だと思うけど、実際には低レベルのマネージャーの一種でもあるよね。

AIは人間を置き換えるはずだった。 ここには実際に2つの観察があるね:1. AIは熟練労働を商品化していない。2. AIはメディア文化を希薄化/劣化させている。最初の点については、もっとデータを待ってるところ、例えばBLSからのデータとか。2つ目については、新しいメディアのカテゴリーが生まれたと思う。チップチューンやディープフライドミームのあたりに位置する感じだね。

ここでの観察は実際に二つある。1. AIは熟練労働を商品化していない。問題は、実際に必要な熟練労働者、たとえば翻訳者やデザイナー、コピーライターなどが中堅や上級レベルで明らかに必要とされていることだ。この人たちは数年は置き換えられないから、労働統計には現れない。置き換えられているのは、むしろキャリアの階段を上がる人たちがいるために補充されない底辺のポジション、つまりインターンやジュニアだ。このレベルの仕事は、実際にはAIでもできることが多いからだ。だけど、この置き換えは統計には現れないかもしれない。オープンポジションの数には影響があるかもしれないけど、その数の変化は関税やロシアの侵攻、みんなが貯金をして消費を控えることなど、経済的不確実性にも起因することがある。明らかに、これが数年後にはメディアやクリエイティブ経済を完全に壊してしまうだろう。キャリアの入り口がAIのおかげで枯渇してしまったら、インターンがジュニアに成長することもなく、ジュニアが中堅に、そして中堅が上級に成長することもなくなる。そうなると、多くの広告やメディア代理店には、15年前にPhotoshopを触ったきりのスーツを着た亡霊たちと営業チームしか残らなくなる。

最初の件については、もっとデータを待ってるところだよ。例えばBLSからのデータね。トランプがその局をどう扱ってきたかを考えると、正確な数字を期待するのは無理だと思うよ。

人間の創造性や説明は、これまで恣意的な単位を使って特異性の限界に達してきた。でも今、その恣意性の自動化が進んで、特異性のために訓練されていないから、先端が確実に劣化して、特異性がさらに手の届かないところに行ってしまうんだ。特に人間が出力を有効または特異なものだと誤解するのが問題だね。これは技術的に普通になった狂気の行為だよ。

一番の皮肉は、その記事に唯一のコメントがAI生成だってことだね。

まだAI時代には入ってないけど、入ると思うよ。LLMはAIじゃないし、機械学習の方が役立つ。進化するか、行き詰まるかは分からないけどね。

LLMはAIじゃない。機械学習の方が役立つ。LLMは機械学習の特定の応用で、だからこそLLMは一般的な機械学習技術に恩恵を受けたり、貢献したりするんだ。LLMがみんなが想像するAIではないのは同意するけど、巨大なマイルストーンを達成したっていうのは大事なことだよね。自然言語はAGIの指標の一つだったし!多感覚で自己修正できる大規模モデルが、全ての人間の五感を理解し学ぶことができるようになるのは時間の問題だと思うし、もしかしたら私たちがアクセスできない感覚も含まれるかもしれないね。

ゴールポストをどんどん動かしてるね…

AIが目に見えて変えたのがeコマースってのは、そんなに不思議じゃないよね。「これ買って」ってサイトは、実際にはコアに一つの提案しかないから。プレゼンテーションは付随的なもの。2003年のままのウェブサイトは無理だし、2025年の店舗の見た目なんてあんまり気にしないでしょ。広告は注目を集めるためにあるのであって、アート作品じゃないんだ。AIは何をするかっていうと、普通のものを作るために訓練されてる。普通のものを作るための一番の方法は、平凡なものを作ること。退屈な音楽、退屈な写真、退屈な文章。今でも常識に関する問題は残ってるけど、専門家が取り組んでるのは確かだよね。8本指の人とか、物理モデルがないとか、そういうこと。でも、今は注意を払わないと偽物を見抜けないくらいのところまで来てる。じゃあ、私たちはどこにいるのか?AIは足場を作るのが得意なんだ。ロレム・イプサムみたいなもので、何にでも使える。人間が少しのエージェンシーを加える。何かを作るときはリスクを取らなきゃいけないし、決断をしなきゃいけない。味って呼ぶ人もいるかもね。そして、決断に責任を持つ人が必要なんだ。それには明らかなエラーを修正することも含まれるし、骨組みをカスタマイズして自分の望むようにすることも含まれる。

ブラッド・ピットのラスト: 「四つで済むのに七つの言葉を使うな。体重を移動させるな、常にマークを見て、じっと見つめるな。具体的に、でも記憶に残るようなことは言うな。面白くしろ、でも笑わせるな。彼には好かれたら、あなたが去った瞬間に忘れられなきゃならない。頼むから、何があっても絶対に…」 (『オーシャンズ11』より)

ショッピングや広告はAIにとって素晴らしい領域だよ。成功したかどうかのフィードバックがはっきりしてるからね。(もちろん、これらの信号を実際に使わないと意味がないし、ただLLMの出力を無闇に使うだけじゃダメだよ。)

それって皮肉じゃない?工場で不良品を取り出す人間を考えてみて。以前は彼らがその製品を作っていた職人だったかもしれないのに。

そう、AIが過去数世紀で最も偉大で賢い革命だと言われていた時のことだ。結論:私たちはAIの時代にはいない。

違いは、工場の場合、不良品は外れ値で見つけやすいことだ。捨てて、機械に次のコピーを作らせればいい。ほとんど時間を無駄にせず、結局は職人よりも速い。職人は関与していないからね。でもAIの場合、同じものを何度も作っているわけじゃないから、問題を見つけるのが難しい。問題が発生したら手動で探して修正しなきゃいけないし、場合によってはすべてを捨てて最初からやり直すことになる。結局、機械にかけた時間と労力は無駄になって、最初から職人に頼んでおけばよかったってことになる。

人間は常に他の人間の不始末を片付けるために雇われている。特にソフトウェア開発ではね。

「工場で不良品を取り出す人間を考えてみて。以前はその製品を作っていた職人だったかもしれない。」でも、このインドのサービスプロバイダーのウェブサイトによると、労働者(インド人?)は「取り出す」のではなく「掃除する」ために雇われているんだ。想像してみて、工場で生産されるアイテムの大半が不良品で、簡単に「取り出せる」状況を。でも、捨てる代わりに、労働者はそれぞれを修理しなきゃいけないんだ。生産のエネルギーコストはかなりのものだよ。

これを何十年もやってきた。20年前に音声認識やOCRプログラムを修正・訓練するために雇われた友達がいる。彼は地理タグを修正していた。AIシステムの歴史を振り返ると、基本的には「スマート」システムにPrologのルールを入力する人や、ELIZAや一般化問題解決者のようなプログラムにルールをハードコーディングするプログラマーがいた。

AIが約束されたAGIレベルに達する前に、私たちはPKDの物語のような「スロポカリプス」に狂わされることになるだろうね。

その話は数十年読んでなかったな、ありがとう。再読したときにゾッとした部分があったんだ。「『奥さんをビデオに撮るのはもう遅い』とファスラッドが言った。『船尾に緊急ロケットが3つある。もしよければ、通りかかった軍の輸送機を引き寄せるために発射してもいいよ。』」…これってまさにChatGPT5みたいだね。