世界を動かす技術を、日本語で。

GitHubのフェイクスター経済

2026年4月20日原文(awesomeagents.ai)

概要

  • CMUの査読済み研究 がGitHub上で 600万件の偽スター を特定
  • スター購入市場 は一般ウェブやFiverr、Telegramで 簡単に利用可能
  • VC(ベンチャーキャピタル)スター数を投資判断の指標 として明言
  • FTC新規則 により偽インフルエンス指標には 高額な罰金
  • フォーク/スター比率不正検出の有力な指標

GitHubスター経済圏の全貌:研究・市場・投資パイプライン

  • Carnegie Mellon University などによる査読済み研究(ICSE 2026)が StarScoutツール で2019~2024年の 20TB以上のGitHubメタデータ を分析

    • 6,000,000件の偽スター18,617リポジトリ、約 301,000アカウント で検出
    • 2024年に急増 し、50スター以上のリポジトリの 16.66%が偽スター関与
    • AI/LLM関連リポジトリ が最大の非悪意カテゴリ(17.7万件の偽スター)
    • GitHub Trending にも偽スターでランクインした事例多数
  • スター販売市場 の存在

    • 1スターあたり$0.03~$0.85 で販売
    • SocialPlug.io、Buy.fans、GitHubPromoter.com など少なくとも12サイトが稼働
    • Fiverr では24件のプロモーション案件、 Telegram では高品質アカウントやコミット履歴付きプロファイルも取引
    • アカウント品質別の価格帯 と納品速度
      • 使い捨てアカウント:$0.03~$0.10、即日
      • 中程度:$0.20~$0.50、1~2週間
      • プレミアム:$0.80~$0.90、自然な納品、長期履歴有
    • 交換プラットフォーム (GithubStarMate.com等)や 偽コミット履歴生成ツール も存在
  • 実際のリポジトリ分析による不正指標

    • 20リポジトリ をGitHub APIで分析、各150プロファイルをサンプリング
    • 健全なリポジトリ :長年活動している開発者が多く、ゴーストアカウント(ゼロリポ・ゼロフォロワー)は約1%
    • 不正疑いリポジトリ (例:Union Labs、Shardeum、FreeDomain等)
      • アカウント年齢は1,000日以上だが、 ゼロリポジトリ・ゼロフォロワー率が30~80%
      • ゴーストアカウント が20%超
      • フォーク/スター比率が極端に低い (例:FreeDomainは0.017、Flaskは0.235)
      • Watcher/スター比率 も低水準
    • AIリポジトリ も同様の傾向あり(RagaAI、openai-fm等)

スター数と資金調達の関係

  • VCはスター数を明確に投資判断材料 として利用

    • Redpoint Ventures による調査:シード時中央値2,850スター、Series Aで4,980スター
    • 自動スクレイピングで急成長リポジトリを検出
    • OSSスタートアップの成長指標 として Runa Capital ROSS Index が業界標準化
    • GitHub自体もM12 (Microsoft VC)と連携しスター数を資金提供判断に活用
  • スター購入によるROI

    • 2,850スター (シード中央値)は $85~$285 で購入可能
    • 1,000万ドル規模の資金調達 が可能なため、 投資対効果は数千倍以上
  • 実例

    • Lovable (旧GPT Engineer) :50,000スター、$7.5M調達、時価総額$1.8B
    • Pangolin :1,000スターでY Combinator採択、$4.7M調達
    • LangChain :シードで$10M
    • Browser-use :3ヶ月で50,000スター、$17M調達
  • 自己申告による「スター稼ぎ」

    • Dagster の調査担当者も「資金調達前はスター数に注力」と明言
    • 学術研究でもGitHub活動と資金調達の相関 が統計的に証明済み
  • インセンティブループ

    • VCがスター数を重視→スタートアップが操作→VCがさらにスターを指標化→操作が蔓延

不正検出のシンプルな指標:フォーク/スター比率

  • フォーク/スター比率最も有効な不正検出指標
    • 健全なプロジェクト はスター数に比例してフォークが発生
    • 不正リポジトリ はスター数に対してフォークが極端に少ない
    • 例: Flaskは0.235FreeDomainは0.017

法規制とリスク

  • FTC(米連邦取引委員会)2024年新規則
    • 偽インフルエンス指標 1件あたり 最大$53,088の罰金
  • SEC(証券取引委員会)資金調達時の指標水増しで既に摘発事例有
  • 違反リスク の高まり

まとめ:成熟した「影の経済圏」

  • 偽スター経済圏成熟し、表のネット上で公然と運営
  • 技術的検出手法(フォーク/スター比など)法規制 の双方が今後の抑止策
  • VC・スタートアップ双方に大きなインセンティブ が存在し、問題は深刻化傾向

Hackerたちの意見

正直な質問なんだけど、VCたちはどうして「スター」システムを信頼できると思ってるんだろう?スターを追加するユーザーは、しばしばプロジェクトのフォローをやめちゃうから、手入れが行き届いてないプロジェクトでもたくさんスターがついてることがあるんだよね。もっといいシステム、でも決して完璧ではないのは、問題の「ライフ」を見て、オープンやクローズ(自動じゃなくて)やレスポンスタイムをチェックすることだと思う。私のプロジェクトは200スター持ってるけど、簡単なバージョンアップすら定期的に更新するのにめちゃくちゃ苦労してる。

スターは、VC投資家でも理解できるシンプルな指標だよね。君の「もっといいシステム」は、ちょっと複雑すぎて時間がかかりそう。

ここでうまく機能するような、もっとグラフ指向のスコアがあるといいな。ユーザーが良いスコアを持っている場合に、リポジトリがより高く評価されるような、ページランク的なもの。そうすれば、粗雑な操作の試みには少し耐性があるかも。

スターは、目標になってしまって良い指標でなくなるという古典的な問題に陥ってしまったね。君の測定にも同じことが言えるよ:問題も、オープンやクローズ、迅速にレスポンスされるように操作されることがあるから、特に今はLLMがあるからね。

VCは、何が正当かなんて気にしないから、VCを騙せるなら市場参加者も騙せるし、VCはそれで利益を得られるんだ。一人のVCが言ってたけど、「ユーザー名に『インド』って入れなければ、もっと資金調達やアップボートがもらえるよ」って。

AIの登場で、これらの「ライフ」イベントはAIよりも簡単に偽造できるようになってるだろうし、スターの偽造とは違って利用規約に反してないからね。

もっと重要なのは、誰がスターをつけたかだよね。彼らはスターを与えるのに選択的なのか、それとも何でもブックマークしてるのか。フォークは、スターをつけるよりも使用状況に近い信号だと思う。

多くのVCは、プロジェクトが信頼できるかどうかを判断するために、魔法のような定量的指標を使うことしか考えてないんだよね。数字がある方が、数字がないよりはずっといい。

ここ3年ほどで何かが変わったわけじゃない限り、この記事はVCとの信頼性を大げさに言い過ぎだと思う。10年前には、私たちが話したほとんどのVCは、GitHubのスターを虚栄心の指標として捨て去ってたよ。

あなたがVCに求めているものと、彼らが求めているものは違うよ。あなたは長期的なソフトウェアの質を示す指標を探しているけど、彼らは短期的に急成長している指標を求めてる。これらはしばしば対立することが多い。

VCが何千ものスターを期待する会話をするのは、ちょっと大きく考えすぎだと思う。実際には、誰かが自分のプロジェクトを良く見せるために20ドル払うことが多いんじゃないかな。履歴書のためとか、見栄のために、これがredditでクリックを得るための後押しになると思ってるんだろうね。もし誰かがプロジェクトや収益の可能性を見ずに、10kスターのプロジェクトに8kの投資を提案しているなら、彼らは無知か、毎年夏に学生プロジェクトに資金を提供しているだけだと思う。偽アカウントがよく私の古いリポジトリにスターを付けて、リアルユーザーのように見せかけるんだ。ちょっと考えれば、例えば1ヶ月で5,000プロジェクトにスターを付けて、他のGitHub活動が全くないようなアカウントは、だいたい怪しいよね。一度、GitHubスポンサーのリングを見つけたことがあって、これはマネーロンダリングか盗まれたクレジットカードのことなんじゃないかな?

人々はスターシステムを「これは信頼できるソフトウェアで、質が良くて多くの人に見られている」という安直な代理として期待してると思う。でも、代理としては完全に失敗してるね。アストロターフィングは別として、スターは人気を保証しないし(相関関係はかなり弱いと思う)、多くの基本的なシステムライブラリはスターが少ない。スターは質も保証しないし、コードを読めることを考えれば、スターは全く意味のない代理に見える。最近はスターを無視して、コードをざっと見て、アーキテクチャと実装の質を評価するようにしてる。そうすると、直接リポジトリの内容を見た後に、あまり「スターが多くない」代替案を選ぶことが結構あった。

Hacker Newsで議論の続きを見る