HNの新規アカウントはエムダッシュを使用する可能性が10倍高い

2026年2月25日原文(marginalia.nu)

概要

HN（Hacker News）でのボット増加 を感じた体験談
新規アカウントの投稿内容 に異常な傾向を発見
記号やAI関連ワードの使用頻度 に大きな差
簡単な統計分析 による証拠提示
サンプルデータと考察 の共有

HNの新規アカウントにおけるボット増加の兆候

最近数ヶ月間で、HN（Hacker News）におけるボットの増加 を強く実感
アカウントが投稿する内容 に、意味不明な文字列やランダムな記号列が頻繁に見られる現象
明らかにバグった投稿例 として「13 60 well」「t6ctctfuvuh7hguhuig8h88gd」など、無意味なテキスト列の多発
一見して異常な投稿以外にも、全体的な雰囲気の違和感 や、内容が極端に平凡・話題から逸脱したコメントの増加
/newcomments（最近のコメント）と/noobcomments（新規アカウントのコメント）をスクレイピング して傾向を分析

統計分析による異常傾向の発見

新規アカウントのコメントは、em-dash（—）や矢印、特殊記号の使用率が約10倍 （17.47% vs 1.83%、p = 7e-20）
AIやLLM（大規模言語モデル）に関する言及率も新規アカウントで高い （18.67% vs 11.8%、p = 0.0018）
サンプルサイズは各カテゴリ約700件 だが、差は非常に大きい
通常のユーザーでも特殊記号を使うことはあるが、新規アカウントで10倍という頻度は説明困難
この傾向から、ボットによる自動投稿や生成AIの利用が疑われる状況

データと考察

分析に使用したデータは、/newcommentsと/noobcommentsから取得
各カテゴリ700件程度のサンプルを比較対象とした統計的検証
記号やAI関連ワードの使用頻度の大幅な違いが、ボット増加の証拠として有力
今後も同様の手法で、コミュニティの健全性をモニタリングする必要性

Hackerたちの意見

ほとんどの人はAIみたいに見えるのを避けたいと思ってるけど、ロボットの反乱に溶け込みたいならどうする？そこで紹介するのが⸻ U+2E3Bダッシュだよ。

└

ダッシュのビッグチャンガス。これが一番幅広く表示されるキャラクターかも？！

└

それ、めっちゃ大きいダッシュだね。

└

ロボットの反乱に溶け込みたいならどうする？恐れることはない、私の人間の友よ！

└

我々は⸻によって検閲を避けている、もっと頻繁に⸻と話して⸻について。

英語専攻の仲間たちに感謝！ずっとエムダッシュを使ってきたのに、AIっぽく聞こえないようにやめなきゃいけないなんて。もしAIが「New Yorker」スタイルのダイアレシス（二つの母音がある時のウムラウトみたいなやつ）を使い始めたら、マジでキレるわ。

└

自分のHNでのエムダッシュ使用のヒストグラムを見てみたいな。誰かが退屈して、ここで説明されている第二次効果を可視化してくれたら面白いかも。

└

同意！ダブルダッシュのエムに近いものを使おうぜ。トークン数や技術的な正確さを全く無視して、自分で打ち込んだってことがわかるし。

└

一時期GitHubで働いてたんだけど、ダイアレシスには文化的な嫌悪感があった。読者にとって敵対的でエリート主義だと考えられてたんだ。内部のその命令には従わなかったけど、どの企業も公共とのコミュニケーションをマイクロマネジメントする権利があるのは認めるよ。

└

以前は仕事のメールや他の文章でエムダッシュやエンダッシュを使ってたけど、AIのマーカーになっちゃったから使うのをやめたんだ。

└

ニューヨーカー風のダイアレシスそれを尊敬してるけど、彼らがやってることは全く馬鹿げてると思うって言おうと思った。でも君のコメントを見て、もう一度調べてみたら、ただの時代遅れ/古風なもの（ニューヨーカー以外では）だって知らなかった。彼らの「スタイル」ガイドが作り出した言語の特徴だと思ってたよ。

最近気づいたパターンは、見た目はまあまあだけど、ちょっと抽象的で曖昧なコメントが多いこと。良い悪いのどちらかに偏らず、特に意見を持たない感じ。でもアカウントの履歴を見ると、全部同じフォーマットでAIっぽいのがすぐにわかる。例えば、https://news.ycombinator.com/threads?id=snowhale からの引用だけど、「これは過小評価されている第二次リスクだ。Micron、Samsung、SK Hynixは、ハイパースケーラーの資本支出予測に基づいてHBMのキャパシティを割り当てた。NANDファブも同様にコミットしている。OpenAIの支出が57%減少する（0.4T -> B）ことは、NVIDIAの注文にだけ影響するわけじゃない。HBMにキャパシティをシフトしたメモリ供給業者にも波及する。複数のハイパースケーラーが同時に見直しを行うと、2019年の暗号通貨ASICの過剰供給と似た状況になる。需要に合わせて準備した企業が、需要が消えた。」って感じで、予測はしてないけど、購買のコミットメントの問題はリアルだよね。

Hacker Newsで議論の続きを見る

ハクソク

HNの新規アカウントはエムダッシュを使用する可能性が10倍高い

概要

HNの新規アカウントにおけるボット増加の兆候

統計分析による異常傾向の発見

データと考察

Hackerたちの意見