世界を動かす技術を、日本語で。

Show HN: ウィキペディアをダムスクロール可能なソーシャルメディアフィードとして

概要

Loading... by rebane2001 Xikipedia は、Simple Wikipediaの記事を使った疑似ソーシャルメディアフィードのデモ。 機械学習を使わず に、ユーザーの行動から興味を学習するアルゴリズムを実装。 個人データは収集・共有されず、アルゴリズムもローカルで作動。 リフレッシュやタブを閉じるとデータは消去 される仕組み。 NSFWコンテンツ が含まれる可能性があり、成人のみ利用推奨。

Loading... by rebane2001 Xikipedia の特徴

  • Simple Wikipedia の記事をフィード形式で表示
  • 疑似ソーシャルメディア体験 の提供
  • 機械学習非使用、独自アルゴリズムのみで動作
  • 他ユーザーのデータを一切利用しない 設計
  • ユーザーのクリックや閲覧履歴 のみをもとに興味を推定
  • フィードのパーソナライズ を実現
  • データはローカル保存のみ、外部送信や共有なし
  • ブラウザをリフレッシュ・タブを閉じるとデータ消去
  • GitHubでソースコード公開
  • fedi、bluesky、twitter でディスカッション可能
  • カテゴリー選択や独自カテゴリー追加 機能
  • Wikipedia由来のランダムな画像や記事 を表示
  • NSFWコンテンツ表示の可能性 あり、成人のみ利用推奨

利用時の注意点

  • 個人情報の安全性 確保
    • データはローカルでのみ処理、外部送信なし
  • NSFWコンテンツの表示
    • Wikipedia由来のため、成人向け内容が含まれる場合あり
  • 利用は自己責任
    • 成人であることを確認のうえ利用
  • リフレッシュやタブ閉鎖時のデータ消失
    • 履歴や設定は保存されない仕様

体験方法

  • 公式サイトにアクセス
  • 任意でカテゴリー選択や追加
  • 興味のある記事や画像をクリック
  • アルゴリズムによるパーソナライズされたフィード体験
  • 気になる場合はGitHubでソースコード確認やSNSで議論

まとめ

  • Loading... by rebane2001 Xikipedia は、 シンプルな仕組みでパーソナライズを体験 できるデモ
  • 機械学習やサーバーを使わない新しいアプローチ の提案
  • 個人情報保護やローカル処理重視
  • 成人向けコンテンツの可能性に注意が必要

Hackerたちの意見

ローディングの問題を直してくれたら戻るよ!初期化の時に全部のデータを引っ張る必要はないと思う。各カテゴリーから少しずつ取って、みんながスクロールするにつれてどんどん取得していけばいいんじゃないかな。

ローディングの問題はまさに「死の抱擁」だね。今、サイトには毎秒複数の訪問者がいるから、1ギガビット以上の帯域幅が必要なんだ。初期化の時に全部のデータを引っ張る必要があるのは、各投稿が他の投稿にどう影響するかをマッピングするためなんだ。投稿間のリンクがストレージの大半を占めていて、投稿内のテキストじゃないんだよね。それに、プライバシーを守るための唯一の方法でもあるし。

すごくいいアイデアだね。なんでページが40MBのデータをロードして、最初の表示までに5分も待たされるのかはよくわからないけど。質の高い記事を引き出すためのランキング基準を追加するのもいいかも。「今日は新しいことを学んだ」って感じを最大化するためにね。全体的に、独自の考えを持っている開発者に拍手を送りたい。

そうだね。スクロールし始めたらバックグラウンドで読み込めるはずだよ。

おそらく40MBのデータはWikipediaからではなく、ドゥームスクロール可能なソーシャルメディアフィードにするためのJavaScriptトラッキングコードのバンドルだと思う。;) その基準で言えば、かなり軽いと思うよ!比較すると、InstagramのiOSアプリは468.9MBで、10倍以上のサイズだし…

多分、雰囲気でコーディングされてるんだろうね。

コンセプトが大好き!Wikitokもあるけど、あなたが持ってきた推薦機能はすごく興味深いオリジナルなアプローチだね。十分な時間があれば、賢いアルゴリズムが私のためにウィキペディアで何を発見してくれるのか見てみたいな。シンプルじゃない英語版も作れたらいいけど、今のところは満足してるよ。スマホにショートカットも追加したし。ネガティブな意見に負けずに、頑張って続けてほしいな。

最初に見たのはこれだね:https://en.wikipedia.org/wiki/Esophageal_cancer ありがとう!

あるエントリーで文法ミスを見つけて、実際のウィキペディアのエントリーに入って修正したんだ。それは満足感があったよ。ソーシャルメディアでもそれができたらいいのにね。

それ、めっちゃクールだね!!

コンセプトは大好きなんだけど、起動時の長いロードが本当にダメだね。サイトを離れて再読み込みすると、また最初からダウンロードし直さなきゃいけないのが辛い。

ちょっとした提案なんだけど、エントリーを実際のリンクやアンカータグにして、リンクをコピーしたり、中クリックで新しいタブで開けるようにできないかな?

読み込むのにちょっと時間がかかったけど、一度入ったら雑誌を読むみたいだった。もっとTikTokのUXだと思ってたけど。私のWikipediaプロジェクトRedactle.netとは逆の感じで、そっちはかなりの労力が必要なんだ。OP、読み込みの問題があるなら、コーパスをWikipediaの重要度レベル3に絞って、1000記事だけだから全部キャッシュすることを勧めるよ。

このドメイン名を見て、WikipediaのGrokベースの変異を期待してたんだけど。今は「x」が私にとってネガティブなイメージになっちゃったかな。

それはすごいね。

面白いのは、脳の混乱の内容が私たちのパフォーマンスを下げるわけではなく、スワイプする行為やコンテキストスイッチングが影響しているってことだよね。教育的なショートフォームコンテンツを作ろうとしても、同じ欠点に悩まされているから、実際にどれだけ効果があるのか気になるな。

これは、他のユーザーからのデータが全くない基本的な非MLアルゴリズムでも、どれだけ早くユーザーの興味に基づいて似たようなコンテンツを提案できるかを示すデモとして作られています。そう、すぐにハマっちゃった。最初は人気のテレビ番組くらいしか認識できないランダムな選択から始まって、すぐにそのコンテンツに偏りすぎて、他の興味のあるものを見るために必死に戦わなきゃいけなかった。これが素晴らしいのは、Instagramでも同じ問題があるからです。絶対に大量のゴミがあって、ポジティブに反応した時にそのゴミの中から宝石のようなものが出てきても、数週間その宝石のようなコンテンツがフィードに流れ続けて、最終的には飽きちゃうんです。結論として、Instagramはこの30行のアルゴリズムを使えば、私も同じような体験をすることになるでしょう。アルゴリズムによるフィードは、何世代も人をロボットのようにしてしまう問題がありますが、ニュアンスが苦手なので、ユーザーにとって悪いものというわけではなく、ただ気持ちがいいだけなんです。要するに、悪いものだけど、人間の心理の低い防御を突き抜けて、依存や短期的な満足感を引き起こすことができてしまう。広告主にとって効果がある限り、ユーザーのために改善するインセンティブはないんですよね。