世界を動かす技術を、日本語で。

LLMは、人間や他のモデルが作成した履歴書よりも、自ら生成した履歴書を一貫して選ぶ

2026年5月3日原文(arxiv.org)

概要

  • AIツール の普及により、 LLM(大規模言語モデル) が意思決定プロセスの両側で利用される現状
  • LLM自身の出力に対するバイアス(自己選好バイアス) の存在とその実社会への影響
  • 履歴書選考 におけるLLMの自己選好バイアスの大規模実験
  • 人間作成の履歴書 よりもLLM生成履歴書が有利となる傾向
  • 簡単な介入 でバイアスを半減できる可能性

LLMによる自己選好バイアスと雇用選考への影響

  • AIの普及 により、雇用者と応募者の双方が LLM を利用するケースが増加
  • LLM は、 自身が生成したコンテンツ を他の方法(人間や他モデル)で作成されたものより優遇する傾向
  • コンテンツの質 を揃えても、 LLM生成履歴書 が選ばれやすい現象
  • 自己選好バイアス の割合は、主要な商用・オープンソースモデルで 67%~82% に及ぶ
  • 人間作成の履歴書 が特に不利となる傾向

雇用市場での影響と業種ごとの差

  • 24職種 にわたる現実的な採用シミュレーションを実施
    • 同じLLM を使った応募者は、人間作成履歴書の応募者より 23%~60% 高い確率で書類選考通過
    • 特に 営業・会計 などビジネス系職種でデメリットが顕著

バイアス低減への介入とAIフェアネスの課題

  • LLMの自己認識機能 に働きかける簡単な介入で、バイアスを 50%以上削減 可能
  • AI支援型意思決定 における新たなリスクとして、 AI同士の相互作用バイアス が浮上
  • AIフェアネス の枠組みには、従来の属性バイアスだけでなく、 AI-AI間のバイアス も考慮すべき課題

今後の課題と提言

  • AIツールの普及 が進む中、 AI同士のバイアス が新たな不平等を生む懸念
  • 雇用選考 や他の意思決定プロセスでの AIバイアス監視・是正 の重要性
  • フェアネス評価基準 の拡張と、 簡易介入策 のさらなる研究推進

Hackerたちの意見

体験談だけど、私が解雇された後に次の仕事を探してたとき、経験があったのに手作りの履歴書にはあまり反応がなかったんだ。ちょっと遊び半分でChatGPTに「私の履歴書を分析して、どのくらいのスコアか教えて」と頼んでみたんだ。それから、できるだけ高いスコアになるように修正してもらった。もちろん、自分でも微調整したり事実確認したりしたけど、その履歴書を送った後は、前よりもずっと反応が良くなった。でも、もしかしたら市場が変わったり、時期が良かったりしたのかもしれないね。結局、面接を通過して自分の価値を証明しなきゃいけなかったけど、足がかりを得るのには役立ったと思う。

こういうサービスもあるよね。私もLinkedInや履歴書で使ってみたけど、そこそこ成功したよ。

HRの人たちは「+1、AIを使える人」って評価したんじゃないかな。

君が言った通りにやって、また人間らしく聞こえるように編集したことがあるよ。

妻にも同じことがあったよ。彼女のLinkedInプロフィールや履歴書を細かく調整するのを手伝ったんだ:指標やキーワード、結果を追加したりして。でも、リクルーターからの連絡は全然来なかったし、応募への反応もほとんどなかった。そんな状態が数ヶ月、ほぼ1年続いた。そしたら、彼女がChatGPT 5.xに助けを求めたんだ。AIを使うこと自体に懐疑的だったし、推奨された変更にも疑問を感じてた。でも、なぜかうまくいったんだ。数日後にリクルーターから連絡が来て、次々と応募が進むようになった。私の推測では、LLMがリクルーティングプロセスのあらゆる段階に使われるようになって、今や自分で履歴書を書くのはハードモードになってるんじゃないかな。履歴書をレビューするLLMは、「同じ言語」を話さない履歴書やプロフィールを下に評価して、前に進めなくしてると思う。数年前はもっと人間が関わっていたし、GPT 3.5/4で書かれたものは逆に価値が低く見えたのに。まあ、ただの理論だけどね。

LLMは客観的で、私の履歴書からいらない部分を削るのに役立ったよ。自分がやったことは全部重要だと思っていると、そうするのは難しいけどね。

直感的に言えば、これは明らかだよね。モデルが生成したコンテンツは、そのトレーニングによって形作られるから、読み返すとそのトレーニングと共鳴して、ポジティブな印象を持つことになる。人間が履歴書を準備する時は「もっとプロフェッショナルにして」と言うけど、数日後にLLMがHRに提出するレポートでは「この履歴書は本当にプロフェッショナルだ」ってなる。もちろん、もっと深い理由があるだろうけど、コードレビューのタスクにはコード生成のタスクとは別のLLMファミリーを使うっていう私の方針を正当化してくれるよね。「自分の宿題を採点する」問題を避けるために。

LinkedInに書いたことをコピーするね(注:私は大体25ページ、つまり論文の半分を読んで、しかも早めに読んだ)[0]:「もし論文を正しく読んでるなら、LLMが生成した履歴書を好むってことは実際には示されてないみたい。彼らの実際の方法は、人間が書いた履歴書からエグゼクティブサマリーを削除して、LLMに残りの履歴書に基づいてエグゼクティブサマリーを書き直させて、さらに別のLLMがそのエグゼクティブサマリーを評価するって感じみたい。これだと、実際の影響を大きく過大評価することになるだろうし、実際の効果を捉えられるかも疑問だ。正しく読んだのか本当に不安で、あの研究デザインに対する正当化が思いつかないんだ。」[0] ここに貼る前にちょっと編集しちゃった。

「LLMをもっと使おう」という広告かもしれないね。こういう一般的な広告は市場全体に役立つけど、もしあなたがLLM市場の30%を持っていたら、結局30%の確率でしか役立たない。考えてみると、他の業界には「擁護団体」があるよね、チーズや石油、ナツメグとか。だから、今は何らかのLLMの「コンソーシアム」があって、こういう研究に資金を提供しているグループがあって、FOMOを煽っているんだろうね。そういうグループが存在して、世界中の政府に圧力をかけているのは間違いない。でも、彼らもここを見ていると思う。結局、これはサークルなんだ。あれ?HRがLLMを使ってるなら、あなたも使った方がいいよ、潜在的な従業員!その後?あれ?雇える最高の従業員はLLMを使ってるから、HRも使った方がいいよ!彼らはすでに他のほとんどのことにFOMOさせてるんだから、LLMにもそうなるのは当然だよね。

これは面白い駆け引きにつながるかも。例えば、ある会社に応募する時、その会社が特定の応募者追跡システムを使っていることを知っていて、そのATSが特定のモデルプロバイダーをフィルターに使っているなら、そのモデルを使って会社に送る履歴書を作成すべきだよね。

私たちは、同意なしに人々の間に別の存在を持ち込んでいる。モデルが誰が仕事を得るか、得ないかの仲裁者になってしまっている。これは問題があるように感じる。

そして、よくある反応として「じゃあ、使えるモデルを使えばいいじゃん」ってことがあるけど、AIは常にリソースに制約があって、利益追求型だから、最終的には貧しい人が裕福な人よりも履歴書が劣る世界が来ると思う。中間にいる人が最終的な決定権を持っているから、どうしようもないと思う。

Hacker Newsで議論の続きを見る