この論文のデータについてどう感じればいいのか混乱してる。論文を見ると、データの説明はこうなってる:「私たちの主なデータソースは、Revelio Labsが提供する詳細なLinkedInベースの履歴書データセットです... 労働者の履歴書データを、2021年以降の企業の採用活動を追跡するRevelioの求人データベースと組み合わせています... 最終的なサンプルは、2021年1月から2025年3月の間に積極的に採用していた284,974の米国企業で、従業員のポジションデータと求人情報の両方に成功裏にマッチしました。これらの企業について、2015年以降の156,765,776のポジションと、2021年以降の245,838,118の求人情報を観察しています。そのうち198,773,384が生のテキスト記述と成功裏にマッチしました。」2021年以降、アメリカで2億4500万件の求人情報を特定したの? アメリカの18〜65歳の人口は236百万くらいだし(ウィキペディアによると、342百万の総人口のうち64.9%)、生成AIを使ってる企業はほんの一部だって言ってる:「私たちのアプローチは、生成AIを業務に統合し始めた企業を捉えることを可能にします。この基準で、私たちのサンプルの約3.7%にあたる10,599の企業が、研究期間中に生成AIを採用しました。」もしかして、LinkedInが世界中でどれだけ使われてるかを過小評価してるのかな? テック業界にいるから、同じ求人が多くの低労力な「リクルーティング」企業によって再掲載されるのをよく見るんだけど。生成AIがエントリーレベルの仕事にどう影響してるかを理解するためには、ケーススタディをいくつか見てみたかったな。例えば、生成AIを業務に取り入れる方針で、エントリーレベルの従業員を減らすことに決めた3〜5社(スタートアップより大きい? 100人以上? 500人以上?)を見つけて、その後にこの大きなLinkedInデータセットに戻って、ケーススタディの情報をLinkedInデータに結びつけるとか。