世界を動かす技術を、日本語で。

個人百科事典

概要

家族写真の整理 から始まり、 MediaWiki を用いた個人百科事典の作成に発展。 AIとデータ連携 で記憶や出来事を体系的に記録。 音声記録・言語モデル の活用で編集効率向上。 エピソードや発見 が人間関係の再認識に繋がる体験。 whoami.wiki としてオープンソース公開、誰でも利用可能。

家族写真の発見と整理

  • パンデミック後、初めて祖母の家を訪問し、 1,351枚の古い写真 を発見
  • 写真は 祖父母の若い頃から自分の中学生時代 まで幅広くカバー
  • 初期の整理は 写真の物理的特徴 (アスペクト比・フィルム種類)ごとに分類
  • 例: 32mm正方形の白黒写真 は祖父の20代半ばのもの
  • 整理後、写真から 断片的なストーリー が浮かぶも、年代順不明

祖母とのインタビューと記録

  • 祖母に写真の順番を尋ね、思い出話を聞き取り
  • 結婚式写真の 時系列整理とエピソード記録
  • 写真内の人物名や関係性を 詳細に記録
  • 複数ページ分のノートを作成し、 歴史的な家族記録 に発展

MediaWikiによる百科事典化

  • MediaWikiをローカルで構築 し、Wikipedia風のページ作成を開始
  • インフォボックスやリード文 で記事を構成
  • 日付・場所・人物・座席配置など 検証可能な事実を記録
  • 写真をスキャンし、説明文付きで配置
  • 人物名は リンク化 し、関連ページやWikipedia本家へのリンクも活用
  • 法改正や時代背景 など、外部情報も引用し文脈を補完

口述歴史の記録とAI活用

  • r/genealogyコミュニティ から口述歴史の記録方法を学習
  • 家族への インタビューや通話 で追加情報を収集
  • 音声書き起こしや言語モデル で編集効率を大幅向上
  • 人物と出来事を 百科事典形式で体系化 し、意外なつながりも発見
    • 例:結婚式の歌手が自分を取り上げた看護師だったこと

デジタル写真・動画とEXIFメタデータ

  • Google Photos のデジタル写真・動画にも着手
  • EXIFメタデータ (日時・位置情報)で追加情報を抽出
  • 言語モデル に写真のみを渡し、旅行記事の自動生成を実験
    • 例:2012年のCoorg旅行の625枚の写真から詳細な旅行記を生成
    • 画像解析とタイムスタンプ で行動や場所を推定
    • 人物特定やキャプション自動生成 も実現

複数データソースの連携

  • Mexico City旅行 では写真・動画・位置情報・銀行取引・Uber履歴・Shazam履歴を連携
  • AIがデータを横断的に照合 し、レストランやイベント、移動経路を特定
  • 会話や思い出も挿入 し、より豊かな物語性を実現
  • MediaWikiの機能 (トークページ・カテゴリ・履歴)を活用し、編集や情報整理を効率化

SNSアーカイブと人間関係の可視化

  • Facebook・Instagram・WhatsAppのメッセージや音声 も百科事典に統合
  • 友情や人生のエピソード を時系列で可視化
  • 友人たちも記事を読んで共感・感動、 個人史から人間関係百科へと発展

whoami.wikiプロジェクトの公開

  • MediaWikiベースの個人百科事典whoami.wiki をオープンソースで公開
  • 自分のデータは自分の手元で管理、どんなAIモデルでも利用可能
  • Wikipediaの編集慣習 を活かし、誰でも簡単に記事作成・編集が可能
  • 家族の歴史も友人との思い出も 同じフォーマットで記録
  • 技術以上に大切なのはストーリー、記録を通じて人への理解と感謝が深まる体験

まとめと感謝

  • 百科事典作りは単なるデータ整理ではなく、人生を再発見する旅
  • 祖母や友人との思い出 を再認識し、人間関係の大切さを実感
  • プロジェクトの今後の発展 に向けて、興味がある方はぜひ参加を呼びかけ
  • Vishnu Dut、Sarah Cheon、Andy Law、Vishhvak Srinivasan、Raghav Rmadya への謝辞

Hackerたちの意見

それ、めっちゃクールなプロジェクトだね!家族の歴史を残す面白い方法だと思う。ただ、AIの部分にはどう感情的に反応すればいいのか分からないな。まず、そんな技術があるのは本当にすごいことだよね。でも、工場に職人が追い出されるみたいに、ちょっと切ない気持ちもある。物語の最初の部分では、手作りの愛情がたくさん詰まっている感じがして、それを失うのは悲しい気がする。AIが銀行の明細書やチケットのレシート、Shazamなんかを全部照合できるっていうのも、なんだかディストピア的な要素があるよね。その力がちょっと不気味だな。このコメントがどこに向かっているのか分からないけど、すごくクールなプロジェクトだね、シェアしてくれてありがとう。

私たちは、AIがいない最後の人間の世代だね。基本的な人間の本能が働いてる感じ。

AIが人間らしさを偽ると気持ち悪くなることが多いけど、ここではそう感じないかな。スティーブ・ジョブズはコンピュータを「心の自転車」と見ていて、私たちがもっとできるようにする手段だと言ってた。この比喩が、私が全ての技術を測る基準なんだ。この場合、退屈な作業を抽象化することで、誰かが深く人間的なものを作る手助けをしたと思う。コンピュータがすべきことをしたって感じ。最近、技術は悪魔の取引のように感じてたけど、これは昔の技術への期待を思い出させてくれる珍しい瞬間だった。

100%同意!まさに同じ反応だった。アイデアが大好きで、最初の部分、つまり重要な人々(家族や他の重要な関係者など)や重要な出来事(結婚式など)を記録するのはぜひやりたい。特に、対象者自身のストーリーや思い出が反映されているなら、素晴らしいリソースになるよね。AIに全部やらせるっていうのは、個人的にはあまり好きじゃない。理由はいくつかあるけど、1) キュレーションが失われる。情報の質や入手可能性に基づいて記録される偏りが出てくるから、イベントの重要性とは関係なくなる。例えば、特別な子供の頃の出来事についての情報があまりないかもしれないけど、それが記録されるべきじゃないってことにはならないよね?逆に、WhatsAppのメッセージがたくさんあるからって、「3Dプリンティングのサーガ」についての1万語のエッセイは要らない。2) すべての詳細を事実確認したくない。個人的には、おじいちゃん(安らかに眠れ)が「フィリーの海岸で20フィートの波に乗ったことがある」って言ったら、その高さがあり得ないって訂正はいらない。こういうことが「追悼」の意味合いで行われるなら、思い出やストーリーを保存することが本当に重要だと思う。日付などは確認して修正するのはいいけど、思い出には特別な主観性があると思う。結局、現実って何なんだろう?私たちはみんな、自分たちに語る一つの大きな物語なんだ。3) 魂がない感じがする。これについては十分だと思う、みんなが何を言いたいか分かってると思う。

同意するよ。この家族の歴史に関わるための枠組みとしてのコンセプトは素晴らしいと思うけど、「AI」の部分には違和感がある。兄弟スレッドのbonoboTPのコメントに、こういうプロジェクトの感情的な複雑さについて書いてあった。人生の物語を語る方法はいろいろある。忘れた方がいいトラウマや確執もあるし、異なるフレーミングや、何をどう思い出すかを選ぶための感情的な労力も必要だ。情報の共有ビューを作るためにLLMを使うこと自体は道徳的に疑わしいわけではないけど、プライバシーの問題を除けば、メガコーポレーションの投影がそんなに個人的な物語のナレーターの役割を奪うのは直感的に違和感がある。

木工プロジェクトを考えてみて。手作業でやるのと、現代の道具を使って早く進めるのとを比べてみて。最終的な製品が機能を持つだけのアイテムなのか、デザイン価値や職人技の価値があるものなのか、考えてみて。これって並行して考えられるかな?

私も同じ反応だったけど、全体的に自動化やスケールの欠点に思えるな。頭の中で、ティーンエイジャーの頃の経験を思い出してる。LAのスキッドロウに行って、ランダムなホームレスの人たちに現金を渡してたんだ。それが良いことだと思ってたから。でも、30代後半になって、歩くことが唯一の運動になって、ホームレス問題が大きい別のダウンタウンに住んでた時、外に出るたびに圧倒されて、誰にも何もあげられなかった。だって、あまりにも多くの人が求めてくるから、全員に気を使ってたら、結局歩く時間がなくなっちゃうんだよね。それに、ビジネスも、フィードバックに30秒だけ時間をくれれば、善意で無害だと思ってるみたいだけど、実際には過去10年で2ドルでも取引したことのある全てのビジネスから、毎日500件のメールやメッセージが来ると、30秒×500になって、そっちに気を取られてたら、何もできなくなっちゃう。これと似てるのは、古い写真を手作業で選んで、親戚にインタビューしてる時は、何かを学んでるし、愛する人たちとの関係を深めて、自分の人生を振り返る時間を持ってる。でも、LLMにやらせると、リアルなウィキペディアの量を生み出しちゃうから、もう一生かけても読めないくらいのテキストができちゃうんだよね。

アイデアはいいと思うけど、境界線をどこに引くかが気になるな。自分だけが読めるなら、全ての記憶をフルに残せるけど、兄弟や親、いとこを追加すると、離婚や病気みたいな辛いことが出てきちゃう。そういう不幸な部分は省いちゃうかも。

あなたのウィキだから、好きにやればいいよ。

同意するよ、今その情報はAnthropicのサーバーにあるんだよね。親戚の伝記を書くのはストーカーみたいだよ。結婚式や楽しい出来事を書くのはいいけど、全ての家族が幸せなわけじゃないからね。例えば、刑務所にいた親戚とか、戦争に行ったおじいちゃんとか。多くの年配の人は、ナチスやソ連に財産を奪われたような不正を受けた過去を話したがらないし、自分が誇りに思っていないことをしたりもする。彼らに口述歴史のインタビューをして、全ての隙間を埋めるつもりなの?言ったことを誰がアクセスするかわからないサーバーにアップロードするって伝えるの?家族間には長年続く確執もあるし、例えば一人の息子が相続を騙し取られたかもしれないし、親に対してひどい態度を取ってたかもしれない。人々は恨みを抱えたり、自分の人生の失敗を他人のせいにしたりする。おばさんが話すストーリーが、他の情報源と照らし合わせると合わないかもしれないし、いとこが思っている父親の娘じゃないかもしれない。それってあなたのビジネス?大きな問題がないとしても、個人の伝記はすごく主観的になるよ。同じ人生をいろんな方法で語れるから、成功しているようにも、クズに見えるようにもできる。こういうことは口伝えの歴史として残して、忘れられていくのが自然だと思う。私の曾祖父やそのいとこたちが何をしていたかなんて、正直どうでもいい。もし全てのドラマを読めたら、親戚のことを嫌いになっちゃうかもしれない。こういうことには自然な忘却のサイクルがある。それでいいんだ。また、みんなが優しくて成功している家族にいるなら問題ないけど、そうじゃないなら厄介なことになる。オタクはこういうことに盲目になりがちで、ただおもちゃで遊びたいだけで、論理パズルみたいに扱うんだよね。

プロジェクト全体と目標は好きだよ。個人的には、生きている人に質問できる方法があったり、家族の歴史を埋めるためのテンプレートがあったらいいなと思う。あと、ホームページがソフトウェアについて話すよりも家族の歴史ページを読んでる感じがして、ちょっと混乱するんだ。シェアしてくれてありがとう。

プロジェクト自体は、プライバシーがしっかりしたLLM APIエンドポイントにアクセスできるならクールだね(自分のGPUサーバーとか)。アメリカの企業が運営するLLMに自分のプライベートな写真をアクセスさせるのはちょっと無理だな。

中国やロシア、ヨーロッパの企業が運営するLLMにそれを渡す?

彼はブログの記事にたくさんの写真を載せてるから、明らかにそれを秘密だとは思ってないね。

https://confer.to/

あなたはどのアメリカのスマートフォンOSを使っていますか?

ここではPPQ.AIやOpenRouter.AIが役に立つかもしれないね?それとも、Apfel(Appleのデバイス内AI)がこれを実現するには十分に強力かな?

これめっちゃいいね!大好きだわ。私の個人的な悩みは、ほとんどの人生を何らかの形で公開したいんだけど、友達にそれを強いるのは嫌なんだよね。私の生活は友達と密接に絡み合ってるし。新しい名前空間を作って保護することもできるけど、今はプライベートなメモはGoogle Driveに、公開するメモはブログに保存してる。私のブログはMediawikiで、インターウィキリンクの形式が好きだから、Wikimediaの世界とシームレスに繋がってるのがいいんだよね。インターウィキの一番の魅力は、Wikimediaの世界からの情報を自分のウィキでも直接リンクできること。これ、ほんと楽しい!人々の歴史を作るアイデアも好きだし、両親が亡くなったら彼らのも公開するかもしれない。素晴らしい仕事だね!大好きだよ。

ちょっと脱線するけど、権威主義的な国から来たから、自分に関する情報が公開されることにはすごく気を使ってるんだ。例えば、チャットの暗号化についてどう思う?自分の生活のほとんどを公開することには抵抗ないけど、企業がそれを悪用するのは嫌だな。具体的には、Metaが人々のプライバシーへの無関心を利用して、依存アルゴリズムを完璧にしてるのが気になる。もしSignalみたいな安全なプライベートメッセンジャーが使えるなら、絶対使うよ。あなたはどう感じてる?

僕も似たようなことを妻とやってるよ。毎年初めに50枚くらいの紙をまとめて小さなノートにしてる。使う布は、前の年にボロボロになった服の切れ端を組み合わせたもの。彼女は小さなもの(例えば、行ったレストランのマッチ箱)を見つけて飾り付けてくれる。年間を通して、学んだことや喧嘩の内容、どう解決したか、試したレシピ、ランダムな思いつきなど、いろんなことを書き込んでいく。で、その小さな日記がその年の具現化になるんだ。手作業で書くことや、オブシディアン++-AI自動分類器3000を使わないのは、何か価値があると感じるから。毎年の始まりにやるいいルーチンで、2、3年前のを読むのが本当に楽しい。子供たちも数年後に面白い読み物になるだろうね。これが家族の伝統になって、時を超えて、異なる世代の知識が記録される未来を想像してる。これ全体に何か美しいものを感じるんだ。

すごくいい例だね、コモンプレイスブックの。ジリアン・ヘスはこれについてたくさん書いてるよ。彼女の本はよく研究されていて、整理されてる。

それは美しいね。インスピレーションを与えてくれる。だけど、こんなことを実行するエネルギーが全然足りないのはわかってる!

実は去年の週末に似たようなことをやったよ。お父さんと一緒に古い写真の箱を見て、ストーリーが失われる前に書き留めたんだ。でも、それをウィキとして構造化することは考えなかったな。最終的にできたGoogleドキュメントよりずっと良いよ。どのレストランに行ったかを銀行取引と場所を照らし合わせて調べるのはすごくクールだね。ソーシャルメディアのエクスポートも取り込めたらいいな。XやIG、FBのアーカイブを指し示して、そこからページやコンテンツをドラフトしてくれると最高だね。タイムラインビューの計画はあるの?ウィキ形式は深さにはいいけど、時には1年をさっとスクロールしたい時もあるよね。

そのアイデア、いいね!既存のフレームワークを使ってるところが好きだよ。もし提案するなら、ローカル推論を使う方法を取り入れたらどうかな?(それってオープンコードで実現できるのかな?まだ使ったことないから、よくわからないけど。)

その上、Googleマップから自分の位置情報のタイムライン、Uberの移動履歴、銀行取引、Shazamの履歴をエクスポートしたよ。最初は写真から始めて、徐々に他のデータエクスポートへのアクセスを与えるようにClaude Codeに頼むつもり。これに不安を感じてる人、他にもいる?素晴らしいプロジェクトだけど、一般的な懸念で批判したくないんだ。でも、すべての金融情報や位置情報をどんなサービスとも共有するのは、家の扉を開けるような気がする。心配なのは、AIに限ったことじゃなくて、自分のプライベートデータをどんなサービスとも共有することなんだ。結局、どれもいつか漏れる可能性があるからね。

実際の物理的な本でこれを始めてるところだよ。自分の人生の中で撮った何千枚もの写真があって、それをScribusでまとめて、各年やイベント、休日ごとに物理的な本を印刷するつもり。理想はコーヒーテーブルに置ける四角い本。少なくとも、死んだ時には自分の存在の一部が物理的な形で残るから、デジタルのものを何十年も作ってきたのとは違うんだ。