世界を動かす技術を、日本語で。

HNに聞く: GenAIとの「おお、やばい」と思った瞬間は何でしたか?

1日前

概要

  • DALL-E や類似AIの登場時、多くの人がその欠点を指摘
  • ChatGPT の出現も当初は軽視されがち
  • コーディング用途の LLM も最初は限定的な進化
  • ある瞬間に「これは本当にすごい」と実感する転機
  • その「Uh Oh」体験についての個人的な考察

AIに対する認識の転換点

  • DALL-E の一般公開時、画像生成AIの不自然さや失敗例が話題

    • 「面白いおもちゃ」 という評価が主流
    • 明らかな欠陥やユーモラスな生成結果への注目
  • ChatGPT 登場時も、自然言語処理の進化に懐疑的な声

    • 「会話AIは限界がある」 との先入観
    • 雑談や簡単なQ&A程度の利用想定
  • LLMによるコーディング支援 の初期段階

    • 基本的な コード補完 やテンプレート提供
    • Stack Overflow離れのきっかけ程度のインパクト
  • 転換点 となった瞬間の体験

    • 複雑な プログラム設計 やアルゴリズムの提案
    • 曖昧な要件から 実用的なコード を生成
    • エラー修正や最適化のアドバイスまで自動化
  • 「Uh Oh」 と感じた具体的な瞬間

    • これまで 人間の独占領域 だった知的作業の自動化
    • AIが自分の仕事や役割 に本格的に影響を与えると実感
    • 予想を大きく超える 応用範囲の広がり と速度
  • 今後の課題意識

    • AIの進化 に対する適応力の重要性
    • 人間とAIの役割分担 の再定義
    • 新たなスキル習得や 倫理的課題 への対応

Hackerたちの意見

ずっと話せるけど、最近Claudeが俺のキャンピングカーのファームウェアをデコンパイルして、CANインターフェースを全部ドキュメント化したんだ。それからESP32モジュールをプログラムして、車のシステム(電源、HVAC、照明、タンク)と通信できるようにした。こういう組み込みシステムの統合は、俺には全然無理な分野だよ。本当にAIに否定的な人たちの気持ちがわからない。俺は毎日、ソリューションアーキテクトとしても、個人的なプロジェクトでもClaudeを使ってるけど、独りじゃ絶対に手を出せなかったことばかりだ。

それは理解できる。「これはただの確率的なオウムだ」とか言ってる人たちもいるけど、彼らは自分の高給取りの仕事を正当化するために嘘をついてるか、LLMの使い方やGenAIツールのプロンプトの仕方を知らないんだと思う。

自分では絶対にアプローチできなかったプロジェクト。これが熱心な人と否定的な人との違いの一部だと思う。自分が一人ではできないことにGenAIを使うと、すごいツールになる。自分が得意なことに使うと、ゲームチェンジャーにはならない(もし専門家なら、せいぜいちょっとした助けになるだけ)。多くの人の仕事は、自分が得意なことをすることだからね。

同じく。俺はDevOpsエンジニアだから、いろいろできるけど何もマスターしてないタイプで、Claude Codeが知識の隙間を埋めてくれて、ちょっとしたスーパーヒーローみたいになってる。だけど、何を見てるかの大体のアイデアは持っておくのが大事だと思う。

LLMサービスプロバイダーに、何もハルシネートせずに法律文書を一貫したフォーマットに書き直せるか試してみたんだ。できたよ。次は、ローカルのLLMでこれができるか見てみた。Gemma-4は、8GBのビデオカードと大きなコンテキスト(128k)でこれをうまく処理できた。次に、そのモデルがこれらの文書をOCRして翻訳できるかも試したけど、同じモデルでそれもかなりうまくいった。そこで気づいたのは、LLMは次のような作業に向いてるってことだ。- 何をしたいかはもうわかっている - どうやってやるかもわかっている - このタスクが価値のあるスキルを育てるとは思わない - 手動でやると、たぶん手を抜くことになる だから今は、「自分が本当にやりたくない作業をLLMに任せられないか」と考えるようになった。

そうだね、LLMを使って得られたベストな結果は、単に読むことや再フォーマット、翻訳、要約が目的のタスクに関してだよ。これらの作業は、人間よりもずっと早くて、退屈しにくいからね。今のところは。

それな。やり方は分かってるけど、時間もエネルギーもないんだ。「Claudeを呼んで!」

息子が銀行と訴訟中なんだけど、詐欺的な請求を通されて、それを返金しなかった上に銀行が彼を訴えたんだ。彼はClaudeとGeminiを使って元の訴訟に立ち向かっていて、今は100% AIを使った反訴をしてる。いろんなAIに情報を入れて、互いにチェックさせたり、もっとアイデアを出させたりしてるんだ。最初はChatGPTから始めて、次にGrok、そしてClaudeに移ったけど、今はGeminiが一番強力みたい。

2025年のホリデー中に暖房が壊れちゃって、修理の予約が2日間取れなかったんだ。家の中がすごく寒くなってきたから、屋根裏に入って暖房が始まろうとしている様子を何本か動画に撮ってGeminiに送ったんだ。そしたらすぐに問題を診断してくれて、暖房が点火しようとする間に小さな排気ファンの一つを回すように言われた。そしたらすぐに点火したよ。何度かそれを繰り返したけど、HVACサービスが来るまでうまくいった。

もっと詳しく説明してもらえる?Geminiに何が起こっているかを伝えただけ?それとも暖房の写真をGeminiに送ったの?

キッチンを取り付けてるんだけど、chatGPTがアイデアを出したり問題を解決するのに役立ってるよ。もちろん、IKEAのドキュメントがもう少し充実してれば必要ないんだけど、それはまた別の話。初心者プログラマーに似たようなメリットを感じてるかな。プロたちは俺の仕事をバカにするだろうけど、彼らは高いし、扱いにくいからね。その間に俺は仕事をこなしてる。一方で、開発作業にはAIを使うつもりはない。スキルが衰えたり、新しいことをちゃんと学べなかったりするのが心配だから。

それはかなりすごいね。(ただ、それはインターネットがめちゃくちゃになる前なら、誰でもググれば簡単に見つけられるような手動でのトラブルシューティングのステップ/修正でもあるけど。)

ああ、そうだね。どのLLMかは忘れたけど、一つが乾燥機の修理を手伝ってくれた。

Geminiはほぼ君を殺しかけたね。排気ファンが動かないと安全装置が作動して、炉が点火できなくなったんだ。回転させることで安全装置をバイパスしたんだろうね。君は知らず知らずのうちに、かなりの一酸化炭素を吸い込んでたかも。

今週、似たようなことがあったよ。ガス乾燥機が動き始めたけど、熱が出なかった。Geminiが、よく熱ヒューズが原因だと言ってた。背面パネルを外して、写真をGeminiにアップロードしたら、「青と赤のコードの上にある白い長方形がヒューズだよ」と教えてくれて、テストの仕方も教えてくれた。それだけじゃなくて、乾燥機のモデル番号を教えたら、必要な部品へのリンクもくれた。最後に、ヒューズが切れたのは熱がうまく排出されてなかったからだろうから、通気口を掃除することを勧めてくれた。排気を徹底的に掃除して、5ドルのヒューズを交換したら、乾燥機は問題なく動くようになったよ。

https://schwung.dev

同じような経験があって、HVACの技術者に診断してもらったんだけど(いくつかの間欠的な電気の問題でサーモスタットがランダムに壊れてた)、間欠的な問題だったから、結局原因がわからなかったんだ。そこで、Geminiを使って問題の可能性がある部品のリストを絞り込んで、全部交換したら問題が解決したよ。ちょっとしたスーパーパワーで、少しでも技術的な傾向と問題解決能力がある人をHVAC技術者に変えてしまうんだ。あまり上手ではないけど、必要な結果を得るためのモチベーションがあればね。

うちのテスラソーラーもまた発電しなくなった。サービス技術者が来るまで3週間待ち。そんな間に、Claudeにインバータを調べさせて、ステータスを取得するエンドポイントや、AFCIとModbus TCPのリセット(HAモニタリング用)を見つけさせた。ClaudeはJavaScriptバンドルをレビューしてインストーラーモードにアクセスできた。これをiOSアプリにしてもらって、次の1週間で問題を診断するためのデータを集めた。Claudeに調査結果をPDFにまとめてもらって、テスラソーラーのサービス担当者に渡したんだけど、その担当者いわく、すごく役立ったって。

Alesis QS8.1を超安く、完璧な状態で買ったんだ(90年代のトップグレードのデジタルピアノ/シンセ)。そしたら、その関連ソフトウェアが全部古くて、使うたびにWINEを使うのが面倒になってきた。そこで、いろんなプログラムがやってたことを全部こなせる、クロスプラットフォームの現代的なものが欲しくなったんだ。しかも、今のコンピュータでできることも追加したいしね。シンセとコンピュータの通信はほぼsysexコマンドだけだから、実際の波形ファイルのエンコーディングプロトコルは文書化されてなかったし、すごく難しいと思った。ClaudeがGHIDRAで元のソフトウェアを調べる手伝いをしてくれて、その日の夜には動くデモができたよ。今は新しい機能を追加するのを楽しんでる。

それは素晴らしいね。GhidraのMCPサーバーを使ったの?なんか魔法みたいだよね?

[0]を読んだ後、Ableton MoveのファームウェアをSchwungでパッチ当てた作業について、もう少し詳しく知りたいな。少し違うけど、古いハードウェアや新しいハードウェアで、パッチ当てたり、入れ替えたり、新しいファームウェアをゼロから開発したりする作業が増えてきてるみたいだね。今のLLM/GenAIのおかげで。

「おお、やばい!」って瞬間ではないけど、波の形は同じだね。俺はDigiTech GNX3000のエフェクトペダルボードを持ってるんだけど、これは古いWindowsのネイティブソフトやGdigiを使わないと本領発揮できないデジタルモデリングの「ワークステーション」なんだ。Gdigiの体験はまあまあだったかな。パッチやコントロールに直接アクセスできたり、ラップトップから操作できたりするんだけど。1時間ほどで、Vercelのv0コードを使って機能的に優れたwebmidiバージョンを立ち上げられたよ。それがきっかけでサブスクリプションや紹介が増えた。テンプレートにしたのは、gnx3kユーザーがたくさんいるからね:https://v0.app/templates/digitech-gnx3000-sysex-tool-GC5LzXA...

関連する話だけど、Kawai CA49のピアノにファームウェアのアップデートを適用してたら、間違ったファイルをフラッシュしちゃって壊しちゃったんだ(プロセスが壊れてて、焦ってバカなことを試したらピアノが壊れた)。Claudeが生存の兆しを探す手伝いをしてくれて、電話アプリからのOTAがうまくいかなかったから、KawaiのAndroid APKをダウンロードして、Javaをデコンパイルして、ファームウェアアップデートの暗号化に使われてるハードコードされたキーを見つけたんだ。ピアノのファームウェアアップデートを抽出して、復号化して、Bluetooth経由でラップトップからプログラムするためのフラッシングスクリプトを書いたら、1時間以内にピアノが復活したよ。

そのキーボード持ってた!実はピアノっぽいタッチが結構好きだったんだ。でも、全部の音を16MB(それとも8MBだったかな?)に詰め込んでるのを知ったときは悲しかったな。90年代後半でもそれはひどいって思ったし!今もガレージのどこかにあるはず…いい思い出だね!

そうそう、あのツールは逆アセンブルが得意だよ。ちょっとした知識があれば、どんなプロトコルでも逆アセンブルしたり、ソフトウェアをクラックするのが簡単になった。多くの業界の人たちはこれがオープンに議論されるのを望んでないから、あまり聞かないけど、影響は大きいよ。

ねえ、発見したことをシェアしてくれない?QS8持ってるんだ :)

ClaudeがGHIDRAで元のソフトウェアを調べる手順を教えてくれたんだ。The Complete New YorkerのDVDのファイルを復号化できるようになりたかったから。古いソフトはWinXP専用で、ページ3か4に進むとクラッシュしちゃった。Ghidraを使って関連するdllを調べて、Blowfishの使い方や渡されている認証情報をマッピングして、それをPythonスクリプトに再実装した。今はすべてのファイルがプレーンなPDFになってる。今は、埋め込みスクリプト用のmkv仕様の拡張を書くのを手伝ってくれて、VLCを準拠させてBlack Mirror Bandersnatchを見られるようにしてる。すでにバグのある実装ができて、3日経ったところ。TransmissionにBEP 46の可変トレント機能も追加してもらった(WebTorrentライブラリにもある程度)。これはカジュアルにやるには俺の能力を超えてるし、次の18ヶ月何もしないでこれに取り組んでもできないと思う。ClaudeがGhidraを好んでるのが興味深いと思ったから、返信しただけだよ。

仕事の一環で大きなトークン予算があるんだけど、同僚がテストとしていくつかのリポジトリをスキャンしてた。人気のプロジェクトで怖いリモートエクスプロイトを見つけて、二次意見を求めて共有してくれたんだ。プロジェクトのローカルインスタンスを立ち上げて、POCを実行してみたけど、何も起こらなかった。セキュリティ保護を下げるために設定をいじる必要があったみたい。そこでAIに何が起こったかを伝えて、デフォルト設定で動くようにPOCを修正してもらった。数分後には、陽気に武器化されたバージョンにパッチを当ててくれた。実行したら、ダウンロードしたばかりのローカルインスタンスが、デフォルトの設定ファイルで起動した途端にクラッシュ。冷や汗が出たよ。こういう話は読んだことがあるし、映画も見たことがある。まさか、核情報爆弾のコンソールに点滅するカーソルがあるなんて。夜中に寝返りを打ち続けて、実際に寝たのは30分くらい。次の日、会社で幽霊を見たみたいな顔してたと思う。まあ、プラスの面としては、チームに明確な倫理的・道徳的指針を与えてくれたことかな。「これをやって、関連する著者に結果を共有しよう」と決めた。悪者が見つける前に問題を解決しようとする善人がいる世界に住みたいから、その世界を作る手助けをすることにしたんだ。これが今の自分のやることなんだなって感じ。

今思うと、めちゃくちゃ簡単に見えるけど、去年のある時、トラックで娘の車を横断輸送するために何が必要か考えてたんだ。トレーラーやドリーのオプション、コスト、トラックがその重さを牽引できるかどうか、などなど。最初はGoogleみたいにChatGPTに小さなプロンプトを一つずつ投げて、いろんな詳細を聞いてた。でも、一回か二回やった後に「トラックモデルBで、車のメーカーAを、地点Cから地点Dまで牽引したいんだけど、どんなオプションがある?」って聞いてみたら、比較表や牽引重量、他の詳細を含むレポートを書いてくれた。その時、「あ、これは違うな。まだ始まったばかりだ」と思った。

同じように、Gen AIを使って不動産購入のレビューをしたよ。Zillowのリスティング写真や、全ての家電のシリアルナンバー、電気パネル、ウォークスルー中に撮ったいくつかの写真に写ってないエリアの情報を提供したんだ。AIにホームインスペクターのようなレポートを書かせたら、実際に750ドルのインスペクターが見逃した問題を指摘してくれたんだ。

それは完全に間違ってた可能性が高いね。怠け心から、何度かClaudeとChatGPTにトルクの数値や他の簡単なデータを聞いたんだけど、毎回全然違ってた。でも、毎回自信満々だったよ。ハードデータに関してはLLMを信じないな。PDFを文脈に入れない限り、やっぱり怪しいよね。

昨晩、Claude Codeに以下のプロンプトをそのまま入力したんだ。「Chromecast 4kでKodiを起動すると、必ずクラッシュする。プラグインかスキンが原因だと思う。キャッシュをクリアすると一時的に直るけど、また戻ってくる。adbでデバイスに接続して、どこでクラッシュしているのかデバッグしてくれない?それが終わったら、解決策を提案して。もしダウンロード、修正、再構築してからadb経由で壊れた拡張機能をアップロードする必要があるなら、遠慮しないで。Android開発ツール(Gradleなど)はこのMacにあるはず。」そしたら、なんと人間の介入なしで、クラッシュの原因を特定して、Kodiのソースをダウンロードして、2016年から存在していたバグを修正して、再コンパイルして、署名して、すべての設定をそのままにしてChromecastにプッシュしてくれたんだ。PRも作成してくれたよ(今のところ未公開だけど、これから数週間でさらにテストするつもり)。

すごいね、LLMを使って何か役に立つことを見つけるのに苦労している人としては。これにどれくらい時間がかかるの?数分それとももっと?これをするのにClaude Codeの有料版が必要なの?

これが完全に同じ条件じゃないのはわかってるけど、LinkedInのシンプルなプロフィールページを見るためにCopilotや他のツールが使えないってことが、これがどんな深さで機能するのか気になってる。可能だとは思うけど、これを実現するためにどんなスキルやツールチェーンが必要だったのか、すごく興味ある。

俺の場合、2023年初めにMetaから漏れた7Gの重りをtorrentでダウンロードして、デスクトップPCでalpaca.cpp(llama.cppの初期バージョン)を動かしてたんだ。ローマ帝国について質問してみたら、英語で答えてくれた!返答は大体間違ってたけど、普通のアメリカの大学生が推測するのと同じくらいのレベルで、でももっと自信満々に答えてくれた。これがデスクトップPCからの英語の返答で、巨大なGoogleのデータセンターのサーバーじゃないんだ。何を言ってるかが信頼できないとしても、英語でCPUと会話できるのは、犬と話してるみたいで楽しいよね!

同じことやったけど、遅かった。でも、もう戻れないって気づいた。3年で100倍の改善だね。

Opus 3.xでObsidian MCPを使って生産性システムを作ってもらったのが最初。次は「問題の数学モデルを作って、解を導き出す」みたいなプロンプトを発見した。でも、本当に「おお、やばい!」と思ったのは、リアルタイムDSPのためのコンパイラ/ランタイムを仕様化する長いプロセスで、実際に動いたこと。俺の流れはこうだった:(1) 自分を理解するのに役立つ、(2) 良いアイデアをまとめるのに役立つ、(3) 正しい入力があれば新しいアイデアを生成できる、(4) 自分のマシン上で役立つツールを作れる、(5) 繰り返しで良いアイデアをより良いアイデアにしていける、(6) 普通の能力を超えた大きな、野心的な機械を作れる。今のフロンティアは、大きなコードベースを繰り返しでより良い機械にしていけること。俺が追ってる重要なことは、収束して積み重ねるプロセスを実行しているか、ただその場で回っているだけか、ってこと。

最近書いたコードや、同僚が書いたコードの中にたくさんのバグを見つけられた。怒ってるわけじゃなくて、感謝してるし、もう戻れないってわかってた!