ブレット・ビクターが語る、現在のAIのトレンドが彼の仕事と相反する理由

2025年7月11日原文(dynamicland.org)

概要

Dynamicland Foundationは、人間中心の動的メディアの普及によるリテラシー向上を目指す独立系非営利研究所。 Realtalkは現実世界で協働しながら物理素材を用いて計算モデルを探求できる新しい計算環境。 Dynamiclandは物理空間で新しい計算文化を育む場所であり、現在は次世代拠点を開発中。参加方法は寄付・現物寄付・協働・ボランティア・訪問など多岐にわたる。理念は「人間的・共創的・現実世界志向の動的メディア」の実現。

Dynamicland Foundationとは何か

Dynamicland Foundation ：普遍的なリテラシーを可能にする人間的な動的メディアの発明と、その文化の育成を使命とする独立非営利研究所。
活動内容 ：人間中心の計算環境の発明、教育・コミュニティ拠点の構築。
所在地 ：2017年からCovidまでOaklandで活動、現在はBerkeleyで新拠点準備中。
運営体制 ：少人数の常勤研究者とボランティア、協力者による運営。
現状：主なプロジェクトは「communal science」と「Realtalk-2024」。

Realtalkとは何か

Realtalk ：Dynamicland研究者が発明した計算環境（OS・言語・哲学）。
特徴：現実世界で人々が物理素材を使い協働しながら計算モデルを創作・探求。
自己言語実装 ：Realtalk自体もRealtalkで作られ、日常業務も全てRealtalk上で実施。
日常利用 ：全ての成果物やウェブサイトもRealtalkで物理的に存在。

Dynamiclandとは何か

Dynamicland ：新しいメディア文化を育む物理的空間。
活動履歴 ：Oaklandのコミュニティスペースで1000人以上が多数の独自プロジェクトを創出。
現在：新しい「communal science」拠点をBerkeleyで準備中、他拠点も計画段階。

参加方法

寄付：501(c)(3)非営利団体として全額研究資金に充当、寄付は税控除対象。
現物寄付 ：機材・サービス・不動産なども歓迎、ハードウェアベンダーとの協賛も相談可。
ボランティア・協働 ：小規模スタッフのため調整は困難な場合もあるが、提案は歓迎。
採用：現在は新規雇用なし。
訪問：Oakland拠点は閉鎖、Berkeley新拠点は準備中で一般公開は未定。

人間的な動的メディアとは

メディアの定義 ：人が思考を表現・共有する手段。例：スピーチ・絵・動画・数式など。
動的メディア ：計算によるアイデア表現・共有。能動的な探求やシミュレーションが可能。
人間的動的メディア ：共創的で全員が主体性を持てる、現実世界と密接に結びついた動的メディア。
- 共創的 ：同じ物理空間で対面・共同作業・暗黙知・相互理解を促進。
- 主体性 ：誰もがシステム全体を自由に閲覧・変更・拡張できる。
- 現実世界 ：素材が物理的に存在し、人間の全感覚・身体性を活用。
言葉選びの理由 ：既存語では誤解を生むため「authoring（著述）」や「dynamic medium（動的メディア）」を使用。

Realtalkの理念と概念

コアバリュー ：
- 可視性 ：全てが見える、隠し事なし、ブラックボックス排除。
- 物理性 ：持続性・安定性・手触り・直接操作・仮想でなく実体。
- 空間性 ：空間全体に広がる、歩き回れる、スケール自在。
- 共創性 ：多人数共同作業、自然なコラボレーション、孤立しない。
- 著述性 ：誰でも何でも変更・拡張可能、読み書き対称性、アプリやユーザーの概念不要。
- 即興性 ：即席で組み合わせ・再解釈・リミックスが可能。
- ローカル性 ：分散・カスタム・コミュニティ主導・地域知重視。
- 現実志向 ：現実世界のモデリングと実験、バーチャルやシミュレーションでなく実体重視。
Realtalkの作業モデル ：
- 現実世界の状況認識と対応 ：ボードゲームのように物理カードで「これを見たらこうする」を定義。
- 全てがカード ：システム全体がカードの組み合わせで拡張・変更自在。
インターフェース概念の否定 ：
- 「コンピュータ」や「インターフェース」を消す試み。計算は物理素材の新たな性質と捉える。
- 物理オブジェクト自体がプログラムを持つ。ハードウェアは環境を作るだけ。
- 複雑性の劇的削減 ：多くは物理的工夫や配置で実現、コード不要。
OSか？ ：
- 「計算環境」と呼ぶが、必要に応じて「OS」と表現。

Dynamiclandと社会・他技術との関係

オープンソース・アクセシビリティ ：全ての人が参加・変更可能な設計思想。
テクノロジー至上主義への批判 ：現実世界・地域知・人間性重視。
プライバシー配慮 ：分散型・ローカル志向。
他技術との違い ：
- AI/AR/VR/従来型コンピュータとの違い ：仮想でなく物理世界での共創性・主体性・現実感を重視。

ご要望があれば、個別のセクションや詳細についてもさらに深掘り可能です。

Hackerたちの意見

ヴィクトル先生やケイ先生がハッカーニュースでアップボートされるのを見るのは、何よりも満足感があるよね。

「私たちは、完全に可視化され理解できるコンピュータシステムを目指しています。理論的には完全に理解できるもの、例えばLinuxカーネルのようなものでも、実際に使う前にソースコードを読むのは現実的ではありません。私には、これが本当に意味不明です。従来のプログラミングでも、私たちが強力なシステムを持っているのは、レイヤーアプローチを使っているからです。これらのレイヤーを見て理解することはできますが、単一の人間には全体を把握するのは完全に無理です。」

└

それは「理解」と「把握」を混同しているからだよ。チェーンの中のすべてのコンポーネントやその機能、どう動くか、どこに脆弱性があるか、または能力が欠けているかを理解することはできるけど、インストールするすべてのソースコードをレビューする必要はない。把握するためには、基盤となるソースコードに非常に詳しくなければならないし、どうコンパイルされるか、ハードウェアとどうやり取りするかなども理解しておく必要がある。これが著者が言いたいことの核心だと思う：LLMはその性質上、理解できないブラックボックスなんだ。LLMが出力に至った過程を理解することは決してできない。なぜなら、その設計上、その可能性が現れることを禁止しているから。これはトークン予測マシンで、その基盤となる論理は数学者が単一のクエリを逆エンジニアリングするのに数十年かかるように設計されている。著者が言いたいのはそれだと思う。LLMが出力に至った過程を理解できない以上、計算や知識の信頼できるエージェントとして頼ることはできない。正しい答えを出すことが多いけど、どうしてその答えを知っているのか、どうやってその結論に至ったのかを説明できない人間を信頼しないのと同じように、LLMも同じようには信頼すべきではない。

└

理論的には理解可能だけど、実際には大きすぎるシステム（Linux）と、内部の推論が設計上本質的に不透明なシステム（現代のニューラルネットワーク）との間には根本的な違いがある。

└

そうだね、大規模なコードベースが期待を裏切ると、絡み合ったコードの網が問題になる。アラン・ケイのViewpoints Researchがこれを研究していて、彼は「Tシャツサイズのアルゴリズム」を提案したんだ。短いルールを使って、 fancyなデスクトップのワードプロセッサやプレゼンテーションソフトを作れるって。From NAND to Tetrisみたいなプロジェクトもあって、フルスタックを理解することが可能だって示してる。これがもっと広がったり、深まったりすることはあるのかな？もちろん、ブレット・ビクターが言ってるのはそこだよ。コードが間違ったときだけじゃなくて、最初からもっと修正しやすくてクリエイティブにできるようにするためにね。（マギー・アップルトンのエッセイ/トーク「Home-Cooked Software and Barefoot Developers」を見てみて。）セレニティOSみたいなプロジェクトは、「小さな」ソフトウェアがどれだけ強力になり得るかを示してる。例えば、そのスピンオフプロジェクトのレディバグブラウザは、Chromiumに比べてコードの行数がずっと少ないのに、レディバグチームは次々と仕様を実装できてるみたい。最後に見たとき、彼らはiOSでブラウザとして出荷するためにAppleが要求する最低限の機能セットを満たすところまで来てたよ。

なんか共感するけど、RealTalkは簡単なオブジェクト認識とLLMを使えばもっと良くなると思う。RealTalkを触ってみて感じた課題の一つは、相互運用性なんだ。目指しているのは「空間レイヤー」を使って、プログラムがどう動くべきか、世界とどうインタラクトするかの直感を育てることなんだけど、これがうまくいくと本当にクールなんだよね。でも、物同士が組み合わさった時のインタラクションに関する重要な直感は、オブジェクトが互換性を持つようにプログラムされていないと機能しない。例えば、風船は「鋭いものに触れるとパンクしたい」と思ってるし、サボテンは「私は鋭い」と言いたがってる。でも、誰かが「私は尖ってる」と言う針のカードをプログラムしてしまったら、風船とは満足のいく形でインタラクトしない。ダイナミックランドのお気に入りの例を使うと、インタラクティブなチャートがあって、そこに「メキシコカード」をフィルタースポットに置くと、異なる国の人口が表示されるとする。じゃあ、同じスポットにメキシコの国旗のカードを置いたらどうなると思う？それとも「メキシコ」とだけ書かれたカードを置いたら？そのインタラクションが「うまくいく」方が良くない？ビジュアルLLMがこれを助けることができる。タグを付けたり、オブジェクトに関する二者択一の質問に答えたりする薄いレイヤーがあれば、プログラムの相互運用性が大幅に向上すると思う。

└

これは「アイテムを一つのゲームから別のゲームに持っていく」っていうNFTブームの問題に似てるね。全てが全てに対応する必要があるから。Dynamiclandの場合、その全体をLLMに通して、鋭い効果を別のカードで同じようにトリガーさせると、インタラクションが完全に隠れてしまうと思う。デザイナーとユーザーの両方にとって理由が全く不明なまま、うまくいくかもしれないし、いかないかもしれないね。

└

ダイナミックな世界でこれを解決する方法は、風船を見て、そこにコードがどこかにテープで貼ってあるのを確認することだよ。コードを読んで、何を探しているのかを理解して、そのトリガーを書くんだ。

ダイナミックランドの動画だよ。[1] テキストの説明だけじゃあまりわからないけど、まだクールなデモレベルだね。これをどうスケールするんだろう？ [1] https://www.youtube.com/watch?v=7wa3nm0qcfM

└

「スケール」ってどういう意味？それは分散型で、小さな共存するグループのエージェンシーを促進するように設計されてるんだ。典型的な「スケール」マインドセットはその逆で、スケーリングをする人たちがエージェンシーを持っていて、残りの人たちは自分が選ばなかったものを与えられるだけなんだ！もしシステムが信頼性のないデモなら、それはエージェンシーを促進するかもしれない。40年前に車を修理できたのと同じように、今はできないのは、スケールされた企業プロセスのせいだよ。

ダイナミックランドを直接体験したことはないけど（動画で見ただけ）、今までのデモに関して一つ気になることがあるんだ。それはプロジェクターを使っていること。だから、投影された光のために部屋が暗くなきゃいけないし、頭や手、体をその光の邪魔にならないようにしなきゃいけない。

└

確かにそうだけど、現代のレーザープロジェクターはすごく明るいよ。ブラインドを開けて、太陽が差し込んでる状態でも、メインのコンピュータディスプレイとして使っても問題ない。遮蔽は確かに問題だけどね。

Hacker Newsで議論の続きを見る

ハクソク