ここで試してみて(Google Cloudプロジェクトを作る必要があるかもしれないけど、課金を有効にしたり、無料トライアルを始めたりする必要はないよ):https://console.cloud.google.com/bigquery?p=bigquery-public-... タブバーの「SQLクエリ」と書かれたところで+(青い背景に白)をクリックして、以下を入力してね(俺はGoogleSQLのパイプ構文を使ってるけど、標準SQLでも大丈夫):FROM bigquery-public-data.hacker_news.full |> WHERE type = 'comment' AND timestamp AGGREGATE COUNT() AS total, COUNTIF(text LIKE '%—%') AS with_em GROUP BY by |> EXTEND with_em / total AS fraction_with_em |> ORDER BY fraction_with_em DESC |> WHERE total > 100 AND fraction_with_em > 0.1 (516件の結果の中で47位で、俺のコメントの0.29(875中258)がエムダッシュを含んでるよ。)編集:タイムスタンプについても聞かれたから:FROM bigquery-public-data.hacker_news.full |> WHERE type = 'comment' AND timestamp EXTEND text LIKE '%—%' AS has_em |> AGGREGATE COUNT() AS total, COUNTIF(has_em) AS with_em, MIN(timestamp) AS first_comment_timestamp, MIN(IF(has_em, timestamp, NULL)) AS first_em_timestamp, TIMESTAMP_SECONDS(CAST(AVG(time) AS INT64)) AS avg_comment_timestamp, TIMESTAMP_SECONDS(CAST(AVG(IF(has_em, time, NULL)) AS INT64)) AS avg_em_timestamp, GROUP BY by |> EXTEND with_em / total AS fraction_with_em |> ORDER BY fraction_with_em DESC |> WHERE total > 100 AND fraction_with_em > 0.1 ほとんどの人にとって、平均タイムスタンプは投稿を始めた時点(エムダッシュを使った時)と2022年11月30日のカットオフ日との中間点だよ。トップのユーザーであるzmgsabstは2022年1月下旬に始めたのが目立ってる。