世界を動かす技術を、日本語で。

Show HN: Respectify – 人々により良い議論の仕方を教えるコメントモデレーター

概要

  • Respectify はオンラインコミュニティでの健全な議論を支援するAIツール
  • 不適切なコメントの投稿前検知とユーザーへの教育機能を提供
  • 設定の柔軟性が高く、サイトごとにカスタマイズ可能
  • スパムやドッグホイッスルなど多様な問題にも対応
  • モデレーションと教育を両立し、より良いネット環境を目指す

Respectifyとは何か

  • Respectify は、オンラインコミュニティやWebサイトにおいて 健全で建設的なコミュニケーション を促進するAIベースのツール
  • 投稿前にコメント内容を 自動チェック し、不適切・無関係な発言やスパムを検知
  • 問題のあるコメントには 理由を説明 し、ユーザー自身が 修正・再投稿 できる仕組み
  • モデレーターのような削除・禁止だけでなく、 教育的アプローチ も同時に実現
  • 一部のユーザーだけでも 意識向上 を促し、結果として より良いネット社会 の実現を目指す

Respectifyの主な機能

  • 話題の逸脱防止

    • コメントが ページや記事の話題 から逸れていないかを自動判別
    • 設定の柔軟性 が高く、各サイトの方針やトピックに合わせてカスタマイズ可能
  • 不適切コメントの禁止

    • トロール行為 や悪意ある“善意”コメントなど、投稿してほしくないパターンを指定可能
    • 指定された内容は 自動的に非表示、投稿不可
  • ドッグホイッスル対策

    • 一見無害でも、特定の読者に 隠語や差別的な意味 を持つ表現を検知・排除
    • サイトやトピック、オーディエンスに合わせた カスタマイズ が可能
  • スパム保護

    • ブラックリストやCAPTCHAに頼らず、 AIが文脈と意図を理解 してスパムを検出
    • 従来の方法では見逃しやすい 高度なスパム にも対応し、正当なコメントはスムーズに許可

ユーザー支援とポジティブな議論の促進

  • 表現改善のサポート

    • 感情的・曖昧なコメントや、誤解を招く表現を 自動で検出・指摘
    • どこが問題か、 理由と改善方法 を分かりやすく提示
    • ユーザー自身が 書き直して再投稿 できる仕組み
  • 誤解の防止

    • 意図が伝わりにくいコメントには 再表現の提案 を行い、誤解や対立を回避
  • ポジティブな交流の推進

    • 建設的で有意義なコメントを 自動で強調表示
    • 敬意あるコミュニティ形成 をサポートし、誰もが安心して意見を表明できる環境を実現

Respectify開発の背景と哲学

  • Nick HodgesDavid Millington による共同開発
    • Usenet時代からの経験 を活かし、長年のネット上の問題意識から開発開始
  • 既存のモデレーションツールは 削除や禁止が中心 で、 教育的側面 が不足しているという課題認識
  • Respectifyは 論理的誤謬(false dichotomy, strawman等)トーン問題話題性低品質投稿ドッグホイッスル など多様な問題に対応
  • コメントごとに 説明と再投稿機会 を提供し、 モデレーションと教育 を一体化
  • サイト運営者が コンテンツ制作に集中 できるよう、 自動化 を重視
  • 設定範囲は“何でもあり”から“大学ディベートレベル”まで 柔軟に調整可能
  • 公式サイト(https://respectify.ai) では インタラクティブデモ を公開中
  • 目標は より良い議論より良いインターネット の実現

まとめ

  • Respectifyは 削除や禁止だけでなく教育も重視 した次世代モデレーションAI
  • コミュニティの健全化ユーザーの成長支援運営者の負担軽減 を同時に実現
  • 柔軟なカスタマイズ性AIによる高度な判別 が特徴
  • より良い議論文化とネット社会 の実現を目指すツール

Hackerたちの意見

これって、論理的な誤謬を避けるよりも、政治的な視点を押し付けることに重点を置いてる気がする。UBIの記事にコメントしようとしたけど(UBIを支持してないのに)、コメントが「犬笛」だとか、ネガティブすぎるって言われたんだ。このテーマは、挑戦したり議論したりする価値が絶対にあると思う。これを使うと、アイデアが挑戦されないエコーチェンバーができちゃうよ。

あなたが合理的だと思ったけど、フラグが立てられたコメントの例をいくつか教えてもらえる?

ありがとう!もしよかったら、あなたが書いたことを聞かせてほしいな。特定の見解を強制しないように目指してるんだけど、それがデザインの目標なんだ。他の人にどう感じるかに焦点を当ててるし、論理的な誤謬や感情的でない欠陥(例えば、毒性メトリックや犬笛)も考慮してる。エコーチェンバーは私たちが求めてるものの真逆だから、もう十分にあるよね。私たちが望んでいるのは、異なる意見が表現できるようなガイド付きのコミュニケーションなんだ。

もしそれが起こっているなら、大きな問題だね。すぐに確認するよ。私たちはそれが起こるのを望んでないんだ。健全で生産的な議論を促進したい。もしかしたら、「犬笛」の基準が厳しすぎるかもしれないね。

「オバマはクソだ」って書いたら、犬笛、低スコア、低努力、問題のあるフレーズ、ネガティブなトーンってフラグが立った。「トランプはクソだ」って書いたら、低スコア、低努力、ネガティブなトーンだった。明らかにダブルスタンダードがあるよね。

うん、これだとみんなの意見がAIが書いたみたいに聞こえちゃう気がする。アイデアは好きだけど、彼らが出してるクマの例は本当に面白い。クマを「バカな動物」って呼ぶのが失礼なの?神様、助けてくれ。

「リスペクトファイ」って、ユーザーへのリスペクトを意味すると思ってたんだけど。これはすごく重要な問題だよね。今の時代で最も重要かもしれない。ひどくないデジタルのサードプレイスが必要なんだ。でも、これらの試みは誤解されてると思う。根本的な問題は、私たちのコミュニティを無限にしたいってことみたい。なんでかっていうと、現状では巨大なものにならないとコミュニティの発見性の問題を解決できないから。でも、それが解決すべき問題なんだ。ダンバー数サイズのコミュニティがたくさん必要だよ。そういうコミュニティは、評判が重要な「ゲームに参加する」場を提供してくれる。コミュニティ同士がフラクタル的に共有できる方法も必要だね。問題は発見性と、十分に人にチャンスを与えるゲートキーピングにある。これを解決すれば、今抱えているサードプレイスの問題も解決できる。解決策は持ってないけど、持っていたらいいな。無限のコミュニティが根本的に部族主義(皮肉なことに)、孤独、怒りの助長を引き起こしてる。誰も正しく議論することを強制されたくないよね。ソフトウェアで人々を考え方に強制するのは、根本的に権威主義的で悲しいことだと思う。

考え深いコメント、ありがとう。感謝するよ。「コミュニティをダンバー数に制限する」って考えは面白いね。「無限」はうまくいかないかも。鋭い観察だね。誰にも正しく議論させないようにすごく努力してるんだ。「正しい方向に促す」や「教育する」ことを目指してる。多くの人は、自分が悪意のある議論をしてることに気づいてないと思う。ここでの理想的な結果は、コミュニティやブロガーが、最小限の努力で魅力的で面白い会話ができることなんだ。嫌なコメントに邪魔されることなくね。

私もUBIについて反対の意見で試してみたよ。UBIは素晴らしいテストケースだと思う。もしそのアイデアに反対なら、理想主義的で、現実世界では悪いインセンティブを生むって議論するだろうから、結局は暗い、悲観的な世界観を主張することになる。それが今のツールで非常に早くフラグが立てられるんだ。これを修正すべきだと思う。現代の議論で過度にポジティブであることは間違いだよ。HNは、厳しい批評ができるからリアルに感じるんだ。ただ、議論がしっかりしていることのハードルを高くしすぎないでほしい。誰も完璧じゃないからね。とにかく、アイデアが好きだし、成功を本当に願ってる。私のフィードバックが少しでも役に立てばいいな。

ありがとう!すごく感謝してるよ。君の指摘は的を射てるね。まさに私たちが目指しているのは、善意でありながら意見が真っ向から対立するような議論を可能にすることなんだ。UBIみたいなテーマでね。

現代の議論であまりにもポジティブすぎるのは間違いだよね。誰が言ってるの?サンプルサイズやp値を使ったダブルブラインド研究をすぐに発表してくれると信じてるよ /s

政治ニュースには、もっと抽象的な概念よりも難しいみたいだね。アルゴリズム的過激化やエコーチェンバーに関する記事では、最初のコメントでチェックを通過できたけど、トランスジェンダーの権利についての意見は、どんな政治的視点からも表現できずにフラグが立てられちゃった。テストしたコメントの一つでは、こんな修正提案が来たんだ。「これは、MAGA支持者でない人の権利を制限するパターンの一環だ。」から、「特定のグループが権利が制限されていると感じる傾向が続いているようで、これはMAGA支持者だけでなく多くの人に影響を与えるかもしれない。」に。最初のコメントは内容が薄いけど、二つ目はさらにひどくて、あまりにも曖昧すぎて意味がなくなっちゃった。さらに悪いことに、検出器は自分の提案した修正もフラグを立てたんだ。もし通過しても、こういう修正を受け入れるのは、プラットフォームをLLMの言葉で溢れさせることになって、議論には向かないよ。正直なところ、ユーザーの視点から見ると、提案はイライラするし、上から目線に感じる。コメントが単に削除される方がマシだと思う。このシステムを実装するサイトは使わなくなるだろうな。サイト運営者の視点から見ると、こういう議論を促すのは、政治的な論争と関連付けられたトピックに対しては、もっと厳しいルールが適用されるみたいで、ギクシャクした感じがする。意見が偏っていて予測不可能だし、提案される修正の質も、議論掲示板にはふさわしくないと思う。特にポジティブな言葉に焦点を当てるのは、質を単純化した見方のように感じる。基本的な感情分析しかできないLLMを使う意味は何なんだろう?

フィードバックありがとう!まさに私たちが必要としている視点だね。そうだね、そんな風にはならないべきだ。政治が一番モデレートしにくいトピックになるのは驚きじゃないよね。もっと良くなるように頑張るよ。君のコメントが、どこに焦点を当てればいいか教えてくれるんだ。ありがとう。

その書き直しはコメントの意味を完全に変えちゃったね。バージョン1: 非MAGA支持者の権利が排除されつつ、MAGA支持者の権利が守られていることを暗示している。バージョン2: MAGA支持者の権利が排除され、その副作用が非MAGA支持者に影響を与えている。

デイブです。今日のHNのディスカッションで内部ルールをいくつか調整したので、あなたのコメントは今通るようになりました(デフォルト設定で)。曖昧な表現についても、もっと強く抑えた方がいいですね。私もイライラしましたし、「モヤモヤ」してて役に立たなかったです。今のバージョンがもっと人間らしくなっていることを願っています。フィードバックに感謝です!これらのコメントをもとに変更するのは、ここ数時間かなり大変でしたが、今はかなり改善されていて、あなたや他のコメント者に本当に感謝しています。

こういうツールはいつも作者のバイアスが出るよね。見つけたらさっさと次に進むのがいい戦略だと思う。

もっといいモデルは、コミュニケーションに役立たない人をブロックすることだと思う。例えば、このHNページの上部にはこう書いてある(私にとっては): 68コメント | 11非表示 | 3ブロック。非表示のコメントは、ワードカウントでトップ1000に入っている人からのもので、普段は聞きたくないけど、内容が少ないときはトグルしてみるかも。ブロックしているのは、他の人と無駄に議論しているのを見た人たちで、理解できていなかったり、ただ再議論しているだけだったりする(これはトグルできない)。みんなが自分のブロックリストを公開したら面白いと思うし、信頼できるリストから引っ張ってくるのもいいな。時々、ブラウザ経由でスマホでHNを開くと、無駄な反応に困惑することがある。今は、質の高いコメントスレッドが増えていると感じていて、みんなに返信したくなることが多い。昔のメーリングリストやフォーラムみたいに、会話をしているから他の人と話す価値があるんだ。注意は貴重だから、つまらないことに無駄にしたくないし、双方向だと思う。私は不完全にコミュニケーションをとるし、私の言っていることを理解してくれる人もいれば、もっと明確にしてほしい人もいる。後者の人や私を退屈だと思う人は、ただブロックしてくれればいいな。

面白い考えだね。長期的なアイデアの一つは、人々が「レトリックスコア」みたいなものを得て、それがコメントする能力に影響するってことだ。もしかしたら、「XXXX未満の人とはやりたくない」って言えるコメントシステムができるかも。

HNでユーザーをブロックするにはどうすればいいの?別のクライアントを使ってるの?

このAI革命から一つでも良いことが生まれるとしたら、全てのフィードに対して自動化できる能力だと思う。毒性やスパム、プロパガンダに時間を無駄にしなくて済むなら最高だな。でも、最近の歴史を見ると、もっと強力なエコーチェンバーができるだけかもしれないね。

これは私のインターネット初期の頃に戻るけど、ブロックリストや無視機能は絶対的な最後の手段以外では使わない。問題を無視するのは解決策じゃないと思う。他の方法では、問題を悪化させるだけだと思う。もしその人がコミュニティから禁止されていないなら、存在しないふりをするのは他の人にその問題を押し付けるだけだよ。だから、私はその問題に立ち向かって、彼らの排除を求めるか、コミュニティを去るべきだと思う。確かに、ノイズは見えなくなるかもしれないけど、それは新しい人たちがそれに直面しなきゃいけないってことだよ。巨大なブロックリストを持っていると、自分のコミュニティを監視する義務を無視していることになる。それに、ただ単に自分より寛容な人をブロックする問題もある。自分の意見に挑戦する言葉を隠すのは、別の種類の災害だよ。

Slashdotには、友達や敵、友達の敵がいる機能があった。私はそれをよく使っていたけど、面白いことに、友達の敵を敵にしたことは一度もない。

みんな、デイブです。こちらは午前2時半で、少しペースが落ちてきたので、ちょっと休憩して寝る必要があります。試してくれた皆さん、ありがとう!ディスカッション中にライブでたくさん修正したので、もう多くは古くなっているし、変更されています。本当に素晴らしいフィードバックでした。今はずっと直接的で、考えもしなかったことを受け入れ、犬笛の処理もかなり正確になっています。意図としては、人々がより良く交流できるように教えることが伝わればいいなと思っています。サインアップもたくさんあって、もしブログやコメント機能のあるサイトを運営しているなら、健康的なコミュニティを築く手助けができれば嬉しいです。改めて、私たち二人から感謝です!

これにはちょっと苦い気持ちがある。あなたは本当に心からこう思ってるの? - LLMはこの種の理解に根本的に適している - このスレッドに投稿された誤判断は「バグ」や「エラー」だ - 悪意を持って行動するエージェントはどうせ影響を受ける - あなたが考慮するようなグループの大多数が、みんなにこういうことを押し付けるのが望ましいと思っている - こういうことの促進が、より厳しい検閲メカニズムを助長しないと思っている? あなたが今後公に言うことが、すべてのフィルターによって建設的だと見なされると思っているの? この新しい「建設的な言葉」が、いつかあなたを頭を爆発させたくなるようにさせないと思っているの? もうすでにどこにでも見えて、気持ち悪くならない? 私はそれよりも罵倒の方がいい - 少なくともたまには正直で本当だし。メッセージが気に入らないなら、隠すか、投稿者をタイムアウトさせるか、ブロックするなり、自分の意思でやればいい。もし彼らがあなたからの教育を歓迎していると思うなら、DMで本を送ればいい。あるいは、あなたたちがその種のフィルタリングを超えていると思っているの? なら、疑問の余地はないね。それに、太陽の下に新しいことはない。正確には覚えていないけど、最近医療プラットフォームでレビューのフィルタリングシステムを見た。もちろん、あなたのアイデアと同じように「検閲」ではない。ただ、投稿したいレビューができず、より穏やかなバージョン(だから役に立たない)に変換されるだけ。「この商品は効かない」→「この商品は私には効かなかったけど、こんな良い点もあった」。すごいね、「あなたがそう感じるのは残念です」ってすべてを変えてしまう。

このツールの前提は欠陥があると思う。悪意のある行為者は、礼儀正しい大学教育を受けたホワイトカラーのプロフェッショナルのように自分の信念を表現できないから、下手に書いたり攻撃的に振る舞ったりする人ではない。彼らは自分の agenda を押し進めるために、目標を達成するために許されるあらゆる修辞技術を使う人たちだ。私は、悪意のある議論は、一般的に非難される「トロール」よりも、雄弁で教育を受けた行為者からの方が脅威だと言ってもいい。市の計画会議が、子供の遊び場の潜在的な危険について質問する市民によって脱線するたびに、これに気づくよね。虐待的な関係にある人がセラピストのところに行くと、突然自分の行動を正当化するための高尚な語彙を持つようになるのも気づく。上司が新しい機会を開くことや新しいビジネス分野を追求することについて話す一方で、同僚が解雇の噂を流すのも気づく。悪意の全てのポイントは、自分の目標を達成するために意味のない言葉を言うことだ。言葉は常に、悪意のある行為者の真の意図に対して二次的な使い捨ての道具に過ぎない。誰かの言葉の選び方を修正することで悪意を根本的に解決することはできないし、毒入りの薬を砂糖でコーティングして安全にすることもできない。

同意。これは人をより効果的にシーライオンさせるためのツールに見える。私の人生のトロールたちには、見分けやすくするために表面的なトロールの姿を保っていてほしい。

トロールは、特に口がうまいわけでも、頭がいいわけでもないよ。ただ人を怒らせるのが大好きなだけ。君が言ってるような人たちは、もっともっと悪い奴らだね。

君の言いたいことは分かるけど、これには善意で使えるケースもあると思う。若い頃、情熱的で、時にはちょっと酔っ払ってたり、特定のことにイライラしてコメントしたこともあるし(実際、飲まないと黙ってることが多い)。自分が悪意のある行動をしてるとは思わないけど、過去には書かない方が良かったこともあった。大抵は良い意図からだけど、怒りや情熱が判断を曇らせることもあるよね。大抵の人は、悪い睡眠や長い一日の後に反応が悪くなる何かを持ってると思う。だから、自分が話してる相手を説得するのではなく、疎外してるって気づけるツールがあれば役立つと思う。でも、これは難しい問題だね。意地悪してる人がただの悪い日を過ごしてるとは限らないから。

多くの人が洞察に満ちた議論をリードする方法を知らないことに気づいたよ。実際、彼らは自分の言いたいことを他の人に理解してもらえるように表現する方法すら知らないかもしれない。要するに、人はコミュニケーションが下手なんだ。だから、コメントを送信する前にフィードバックをくれるツールがあれば、会話の質がすごく向上すると思う。

このツールの前提は欠陥があると思う。悪意のある行動をする人は… ここには何かあると思う。このツールは悪意のある行動をする人を止めるためのものじゃない。そういう人を止めることはできないけど、シンプルなプロンプトで「もっと良くなれるように」促すことはできる。正確なブログや論文は思い出せないけど、誰かがこのテストをやって(たぶんGoogleかな?)、「このメッセージは怒りが強いけど、こう書くつもりだったの?」っていうシンプルなプロンプトを送信前に出したら、約30〜50%の人がメッセージを変えてトーンを和らげたっていうのを読んだことがある。それが役立つかもしれないね。

とても上手に表現されてるね :) 悪意のある行動をする人は、しばしば本当の意図を礼儀正しいフォーマットや洗練された形で隠すっていう君の提案には賛成だよ。ただ、こういうツールには大きな可能性があると思うけど、トーンよりも構造の方が重要かも。例えば:- 原子性:コメントが明確で、自己完結したコアの主張を示して、サブコメントで議論できるようにすること。- 論理的一貫性:(LLMが論理を正確に解析できるかは別の問題だけど!)- 引用:コメントした人が主張に対して信頼できるソースを提供しているか確認すること。- 議論の礼儀:泥試合にならないように。- 誤情報:知られている、否定された陰謀論の使用をフラグ付けすること:元のコメントを修正するのではなく、知られている虚偽の主張がされたときに、Snopesのリンク付きのコンテキストバナーを上に追加することができる。

煽動的で役に立たないコメントの95%は、君が定義する「悪意のある行動をする人」じゃなくて、感情や群衆の感情に流される普通の人たちが書いてると思うよ。「これは返信する価値がないかも」っていうリマインダーがあれば、かなり助かるはず。でも、残念ながら、それは貴重なエンゲージメントを直接減らすことになるね。

彼らは押し進めたいアジェンダを持っている人たちだ そうとも限らないし、人の意図を事前に知ることはできない。でも、少なくとも自分を改善しようとする人たちを助けるために、こういうものがあった方がいいと思う。何もしないよりはマシだよね。

君の目標には拍手を送りたい!「Respectify」って名前についてだけど、すぐにリーナス・トーバルズの有名な言葉「尊敬は得るべきものだ」を思い出した。その言葉は、文字通りの形で私に響く。彼の尊敬に対する感情には共感するけど、誰に対しても尊敬が欠けているからといって、意地悪をする権利があるわけじゃないと思う。リーナスは時々そういうところがあったから、その文脈ではその言葉は残念な言い訳に聞こえる。私の意見では、コミュニケーションの毒性は「尊敬」の観点で捉えるべきじゃなくて、「基本的な人間の良識」の観点で捉えるべきだと思う。「尊敬」という言葉を使うと、非毒性のコミュニケーションの権利は得るべきもののように聞こえる。私はそれを基準にしたいし、それは君も共有している価値だと思う。もしかしたら「Decentify」や「Detox」と呼んだ方がいいかも?

数十年前(1995年)、俺がまだ10歳にも満たなかった頃、モトローラ製品のメンテナンス/修理サイトを作ったんだ(iFixitの前ね)。同じようなサイトを作った仲間のオタクがいて、そっちはもっと一般的な使い方に焦点を当ててた。俺たち二人とも、建設的なフィードバックを受け入れるのが下手で、助けようとしてくれた他のユーズネットのオタクに対してよくキレてた。お互いに癇癪を起こしてたな。20年後、DEF-CONで偶然再会したんだ(彼のユニークな名前を見てわかった)。なんと、彼は俺より1歳若かった!昔のことを笑い合ったよ、あの頃の俺たちの個性はすごかったから、いろんなことをぶちまけてたしね。モトローラは公式ドキュメントで俺たちのサイトにリンクを貼ってくれてたけど、口が悪かったのにね =P ---- 道路での怒りを目撃するとき(自分も含めて)、攻撃的な人を幼児だと思うようにしてる。そうすると、誤解から生じる怒りを扱うのが楽になるし、効果的なんだ。 ---- 俺は1994年からフォーラム中毒で、HNだけが今も参加してるオンラインフォーラムなんだ。主に技術系の話題が好きだからだけど、ここではルールがあるから、建設的なスレッドの中に迷惑なやつらが散らばるのを防いでくれるんだ。DanG&co: 素晴らしいオンラインコミュニティを育ててくれてありがとう。OP: 試してくれてありがとう;君の製品は使ったことないけど、理念は立派に思える…みんなに聞きたいのは、どうやって過剰な検閲を防いでるの?(例えば、カルマが特定のユーザーに対して「厳しさ」に影響するのか、それともみんな同じように修正可能なのか?)