概要
- Show HN投稿 の割合が 2022年以降急増
- LLMの登場 が増加の主因と推察
- Show HNの平均スコア は 年々低下傾向
- LLM生成投稿の質や評価 に疑問
- データ分析方法とソース も紹介
Show HN投稿とLLMの関係分析
- 2012年から2022年 まで、 Show HN投稿の割合 は 2〜3% で安定
- LLM(大規模言語モデル)登場 後、Show HN投稿が 増加傾向
- Claude Code や Cursor 1.0 の登場でさらに加速
- 2025年12月時点 で、全投稿の 12%以上 がShow HN
- LLMの普及 により、 非エンジニア でもプロダクト公開が容易に
Show HN投稿のスコア動向
- 2023〜2024年頃まで、Show HN投稿の 平均スコア は全体と同程度( 15〜18点)
- Show HN投稿割合の増加 とともに、 平均スコアは低下
- 2025年12月時点 で、Show HN平均スコアは 9.04点、全体平均は 19.53点
- LLM生成のShow HN投稿 が 質的に劣る のかは不明
- 投稿数増加による“見飽き”現象 の可能性
- 2022年の平均スコア上昇 の理由は不明(新規ユーザー増加?)
データ取得と分析手法
- BigQueryのHacker Newsデータ を SQLクエリ で抽出
- 投稿タイプは story のみ、タイトルがnullでないものを対象
- Show HN判定 はタイトルの "show_hn: " でフィルタ
- Pythonコード と CSVファイル は GitHub で公開(https://github.com/plastic041/hackernews)
- オリジナルCSVは サイズが大きいため未公開 (約400MB)
- BigQueryから無料で取得可能
- LLM生成か否か の自動判別は困難
- 多くのShow HN投稿が LLM使用を明記していない ため
今後の課題と展望
- Show HN投稿の質的変化 や コミュニティの評価 の変遷に注目
- LLM利用の明示 や 自動判別手法 の確立が今後の課題
- 数ヶ月ごとのデータ更新 を予定