概要
Pocket のサービス終了に伴い、約7年分・900件の保存記事を移行。 記事データ を分析し、保存傾向から自分のプロフィールをAIに推測させる実験を実施。 o3 (AIチャット)が、記事リストから驚くほど詳細な人物像を推定。 データから分かる自分像 と、その精度の高さに対する所感。 今後の活用・プライバシーへの示唆、および新しい自己ホスティング環境の紹介。
Pocket終了とデータ移行
- Pocket がサービス終了、ユーザーによる保存記事の移行作業
- 約 900件・7年分 の保存記事、個人的な情報資産
- xsv ツールを用いたCSV形式でのデータ抽出・分析
- 記事タイトル、URL、保存日時、タグ、ステータスなどの項目
- 保存期間: 2018年7月12日~2025年6月26日
AIによるプロフィール推定実験
- Simon Willison のgeoguessing挑戦から着想を得た分析
- o3 (ChatGPT系AI)に記事リストを提示し、人物像を推定させる
- 年齢、性別、居住地、学歴、職業、収入、政治観など多角的な推論
- CSVデータを 直接プロンプトに貼り付ける と、より精度の高い推定結果
o3による推定結果
- 年齢 :30代半ば~40代前半
- 性別 :男性寄りだが断定せず
- 居住地 :アメリカ・バージニア州沿岸部(地元不動産情報から推定)
- 学歴 :コンピュータサイエンス系学士/修士
- 職業 :セキュリティ・インフラ系のシニア/スタッフソフトウェアエンジニア
- 収入 :世帯年収約$150,000~$220,000
- 家族構成 :既婚、幼児含む3~4人の子ども
- 政治観 :財政保守・市民的リバタリアン、社会的には伝統主義寄り
- リスク許容度 :キャリアでは高め、投資では中程度
- 学習スタイル :自学志向、長文・テキスト重視、音声コンテンツも活用
- 情報摂取傾向 :技術60%、金融20%、育児/家庭10%、信仰・文化10%
- 生活パターン :技術職からマネジメント・家族重視への転換期
- 季節傾向 :年末年始にキャリア・目標設定、夏に教育・不動産、秋にセキュリティ系集中
- 信仰・価値観 :カトリック系のサイト保存多数、実践的な信仰生活
- DIY志向 :自作・工作記事、セルフホスティングへの関心
- 健康意識 :実用的な健康・睡眠・運動改善
- 発信意欲 :執筆・ブログ関連の記事保存多数
精度と所感
- 推定結果の精度 が高く、個人情報が意外なほど推測可能
- Hacker News など技術系情報が中心でも、家族構成や価値観まで推測
- CSVデータの貼り付け方 によってAIの推論精度が変化
- ファイル添付よりプロンプト直接貼り付けの方が「物語的」な推定
プライバシー・今後の活用
- デジタル足跡 から個人像が詳細に推測されるリスク
- AIによるプロファイリング技術 が一般にも開放されつつある現状
- 広告会社だけでなく、 個人でも強力な分析が可能 な時代
- 今後は 自分のプロファイル を活用したパーソナル推薦システムに応用予定
新たな自己ホスティング環境
- Wallabag へ記事保存先を移行
- RSSリーダーも Inoreader から FreshRSS へ
- Caddy の導入で、2025年現在は自己ホスティングが以前より容易に
xsvツールについて
- xsv :CSVデータ解析に最適なツール(2024年4月でメンテ終了だが十分実用的)
まとめ
- 保存記事の分析 は、自分でも気づかない「自画像」を浮き彫りに
- AIによるプロファイリング の威力と、プライバシーへの新たな課題
- 自己データ活用 と、より快適な自己ホスティング環境の構築