概要
- Mongolia の現代社会と伝統的なゲル(yurt)の分布に関する探究
- 衛星画像と機械学習 によるゲルの数の推定プロジェクト
- YOLO を使ったオブジェクト検出モデルの構築とデータセット作成
- 地理情報の活用 による効率的な探索範囲の絞り込み
- API連携とクラウドGPU でモデルの精度向上と作業効率化を実現
現代モンゴル社会の特徴
- 21世紀に急速な貧困削減 と高い経済成長率
- 出生率2.7、人口約348万人(2023年)、上位中所得国
- インターネット普及率 が2000年の1%から2023年には83%に
- 都市部に集中する人口、特にウランバートルのゲル地区で生活する人が多い
- 政府の腐敗・規制品質・効率性 に課題(World Bank指標)
- 例:意図的殺人率6(2021年)、貧困率0.2%(2022年)
ゲル(yurt)の現状と衛星画像分析
- ウランバートル周辺に広がる大量のゲル に注目
- Google Maps衛星画像 でゲルの分布を観察
- 市の推計 :ウランバートル人口の約60%がゲル地区居住
衛星画像×機械学習によるゲル数推定
- 公的なゲル数統計が存在しない ため自力で推定を決意
- YOLO11(Ultralytics) を用いたオブジェクト検出モデルの選択
- Label Studio で衛星画像上のゲルを手動でアノテーション
- 数百枚のタイル画像 からアノテーションデータを作成しモデルを訓練
- モデルの精度不足 (10~15%のゲルを見逃す)から追加データ収集を実施
探索範囲の最適化
- モンゴル全土の衛星タイル数 をズームレベルごとに計算
- 例:ズームレベル17で約3,700万タイル、20で約24億タイル
- 人口分布と都市部集中 を考慮し、探索範囲を都市・集落周辺2kmに限定
- Overpass Turbo で人為的な地点を抽出しGeoJSON化
- geopandasとmercantile を使い、必要なタイル数を大幅削減
- ズームレベル17で約27万タイルまで減少
モデル連携と自動化
- Label Studioのモデルバックエンド機能 を活用し、API経由で推論を自動化
- FastAPI で/predict, /setup, /healthエンドポイントを実装
- モデルによる自動アノテーション→人手補正→再学習 のフィードバックループを確立
- 1万件超のアノテーションデータ を短期間で作成
モデル訓練のスケーラビリティ
- ローカルPCでの学習速度限界 に直面
- vast.ai でGPUサーバをレンタルし、Dockerイメージでトレーニングをクラウド化
- GitHub Container Registry へのDockerイメージのpush、vast.aiでの認証設定
モンゴルのゲル分布と社会背景
- ゲルが都市部でいまだに重要な居住形態 である現状
- 急速な都市化と伝統的生活様式の共存
- 機械学習と衛星画像 による現代社会の定量的・視覚的理解
機械学習による社会理解の意義
- 公的統計では見えない社会的実態 の把握手法
- 現地訪問が困難な場合の代替アプローチ
- データサイエンス×地理情報×現地文化 の融合による新たな社会分析の可能性
まとめ
- 衛星画像と機械学習 を活用したモンゴルのゲル分布推定の実践例
- 都市化と伝統の共存 をデータから可視化
- 現代モンゴル社会の多面的な理解 への貢献