世界を動かす技術を、日本語で。

OpenClawが私の人生を変えている

概要

  • OpenClaw の登場によって、AI開発支援ツールの役割が根本的に変化
  • Claude Code など従来ツールは生産性向上止まりだったが、OpenClawは管理職的役割を実現
  • 意図伝達だけでプロジェクト進行 が可能になり、開発現場から一歩引いたマネジメントが可能
  • 複数プロジェクト同時進行や役割分担 もAIで実現
  • 個人の生産性と創造性の解放、夢だった「自分のチーム持ち」へ一歩前進

OpenClaw体験記:AI開発支援の本質的変化

  • 過去1年、主にClaude Codeを使った開発体験

  • 世間では「AIがプログラマーを置き換える」と言われていたが、 実感として革命的な変化はなかった

  • Claude CodeやCursorなど エージェント型ツール でコーディングは楽になったものの、 実行者は自分自身 という現実

  • コードを書くとは「実行」そのものであり、 AIが補助しても主導権は自分

  • エディタや環境構築、テスト・デバッグなど 運用面の多くは自分で担う必要

    • 生産性は向上するが、 本質的な役割分担は変わらず
    • チャットボックスで意図を伝えるだけで、 根本的な業務変革には至らない
  • 深い関与が必要なまま、単なる「コード実行者」から抜け出せない状況

OpenClaw登場によるパラダイムシフト

  • OpenClaw導入後、状況が一変

  • 妻との会話:「AI時代、 スーパー個人スーパー組織 か、どちらを目指すべきか?」

  • 答えは「 スーパー・マネージャー

    • 複数AIツールを使いこなす個人は、 高度なマネジメント能力 が必須
    • AIを活用し、 実行者から管理者へ ステップアップ
  • OpenClawで実現できたこと

    • プログラミング環境から完全に離脱
    • スマホのチャットだけで開発・テスト・デプロイ・運用まで完結
    • Claude Code単体では不可能な体験
  • OpenClawの特徴

    • 汎用エージェントとして メッセージアプリや音声で操作可能
    • 意図を正確に理解し、長時間自律的に作業
    • 作業中に得た手法やルールを 記憶・進化
    • プロジェクト自動生成・計画作成・レビュー・音声での修正指示
    • 必要に応じて Claude Codeにコーディング指示
  • 「自分が書く」から「AIが書く」への本質的転換

    • 自分は マネージャーとして抽象度の高い仕事に専念
    • コミュニケーションだけで成果を出せる 真のマネジメント実現

マネジメント観点での新しい働き方

  • 24時間稼働する専用マシン+ツール群+意図理解エージェント
  • AIが自動でコーディング・デバッグ・進捗報告・修正対応
  • 複数プロジェクト・複数役割の同時進行も可能
  • 自分は Tech LeadやProject Manager として進捗管理や全体調整に集中
  • アイデア実現のスピードと幅が飛躍的に向上

個人開発者としての解放感と未来

  • 「自分のチームを持つ」夢がAIで現実味
  • 以前は資本力がないと実現不可能だった「 アイデア→実行→製品化」の流れ
  • 資金不要で複数プロジェクトを同時進行
  • 「一人で何もかもやる」からの脱却
  • まだ完璧ではないが、 第一歩を踏み出せた実感
  • OpenClawとAGIへの感謝、自分の人生が大きく変わったという実感

OpenClawによるAI支援開発の本質的変革、そして 個人がマネージャーとして活躍できる未来 への展望をまとめました。

Hackerたちの意見

これはかなり質の低い投稿だね。中身が全然ない。ただの空虚な言葉。OpenClawが設計・実装したソフトウェアで見たのはmoltbookだけなんだけど、moltbookよりひどいものを作るのは難しいと思う。もし誰かがOpenClawでまともなものを作れたら、OpenClawの信頼性が少しは上がるかもね。

OpenClawを使って、Notion APIと連携するためのスクリプト(Python)を作ったよ。これで作業項目を作成して、均等に分配して、カレンダーに締切を設定できるんだ。

AIは全部見せかけだね。

投稿を読んでて、同じように表面的だなって感じた。正直、人間が書いたとは思えないよ。

以前の投稿が「Rabbit R1には世界を変える可能性がある」と言ってたから、ここでの批判的な評価はあまり期待できないな。

完全に私のワークフローを変えた。個人プロジェクトでも商業プロジェクトでも。 > 本当に生産性が解放されて、以前は進められなかったアイデアをたくさん追求できるようになった。 もしブログ記事でAIがあなたの人生を変えたとか、素晴らしいプロジェクトをたくさん作れるようになったって書いてるなら、そのプロジェクトへのリンクを貼るべきだよ。なぜか90%の投稿は、著者がAIで作った素晴らしいプロジェクトにリンクしてないんだよね。

経験豊富なコーダーたちが、グリーンフィールドプロジェクトでバイブコーディングを試みると、実際にうまくいくことがある。でも最初の約10klocまでなんだよね。その後は、AIがどんなにうまくプロンプトを与えても、既存の機能を偶然壊したり、コードに不要な複雑なロジックを加えたり、デッドコードを残したり、"後方互換性のため"にランダムなトレースを追加したり、"リファクタリングが大きすぎる"として正しいことを避けたりする。開発用データベースが本番用データベースじゃないことも理解してないし、マイグレーションも避ける。そんな感じだね。10年以上のコーディング経験があるし、AIの支持者だけど、バイブコーディングには賛成できない。AIは退屈な部分を手伝うための素晴らしいツールだけど、ファイルの初期化やさまざまなアプローチを考える手助け、初回のコードレビュー、設定の手伝いなどにはうまく機能する。でも、コーダーを完全に置き換えるにはまだまだ遠い。もっと大きな改善が必要だね。

セットアップの具体的な内容を教えて。プロジェクトの具体的な内容も。お金を見せて!!!

なぜか90%の投稿は、著者がAIで作った素晴らしいプロジェクトにリンクしてない。 もしかしたら、また半端な動作のJavaScriptの数独ソルバーや、誰も使わない半端なAIツールを共有したくないのかもね?たぶん、自分が成し遂げたことに驚いてるけど、世間は同じようには感じないと思ってるのかも。

AIは素晴らしいよね、ハーネスなんて関係ない(私はCodexを使ってるだけ)。最新のモデルを使おう。GPT-5.2が私のWiFiドライバーの問題を解決してくれたよ。

公平に言うと、AIは短いプロンプトからブログ投稿を書いたんだろうね。それが詳細がない理由を説明してる。

彼のGitHubを見れば、彼が雰囲気に流され始めた最初の週にいるのがわかるよ。最初の週は、いつもその人が生産性について absurd な主張をすることになるから。

これ、めっちゃ曖昧で時間の無駄だった。どんなコード?どんなツール?どんな設定?どのメッセージアプリ?どんなプロジェクト?これらの質問には全然答えてない。

これはAIのクズそのものだね。AI好きな人は結局、AIに自分の主張を書かせることになるのは避けられないみたい。人間が書く価値がないなら、人間が読む価値もないってことで、その投稿のリンクをAIに読ませるだけだよ。

コードもツールも設定もプロジェクトもない。これはおそらく、chatgpt.comに行って「[何か]を次の技術革命として盛り上げるブログ記事を書いて」と入力して生成されたAIの投稿だね。最近のテックブログの内容はほとんどそんな感じだし。そんなものは存在しなかったんだ、AIがリクエストに応えるために作り上げたんだよ。

ちょっと心配なのは、これがプログラマーにとってのAI精神病の瞬間かもしれないってこと。

そういえば、前の投稿はRabbit R1がどれだけ素晴らしいかについてだったよね…

まるでブロックチェーンが革命的だと装った記事みたいだね。それに、この記事自体もAIの適当な内容に見える。

うん、具体的なことが書いてないと、段落か二つ読んだらもう読むのやめちゃう。『うまくいく!』/『いや、うまくいかない』みたいなジャンルは、一般的なことばっかりで飽和状態だよ。見せてくれ、言うだけじゃなくて。そうじゃないと、何も見せられないって思っちゃうよ。

そもそも、プロジェクトはちゃんと立ち上がったの?壊れたものはちゃんと直せたの?実際の実行やフォローアップなしに、この技術への前向きな評価が多すぎるのが本当にイライラする。まるで、進捗の指標として無限に出力を印刷する端末の魔法にかかってしまったみたいだ。

それって重要?

その通り。 「すごい結果が出た」って言ってる投稿は、ただの広告だよね。何をやってるのか、具体的に教えてほしい。ワークフローやツール、どんなプロジェクトを作ったのか。 >「過去1年、開発のためにClaude Codeを積極的に使ってきた。多くの人がAIがプログラミングを助けてくれると信じていて、プログラマーを置き換えるかのように見えるけど、私には仕事のやり方に革命的な変化をもたらすとは感じなかった。面白いことに、先月はHNがClaude Codeのおかげでデスクから離れられる、プログラマーを確実に置き換える、そして「携帯でチャットしながらコーディングできる」っていうブログ投稿で溢れてた。バスに乗りながら携帯でコーディングできるってのが、データセンターの価値を決定づける魔法の境界線みたいだね。」

多くのエンジニアがマネージャーになりたいという執着的な夢を理解できない。単に収入が増えることだけが理由じゃないみたいだね。本当に「細かいことにこだわるのを逃れたい」とか「高レベルの抽象的な仕事に集中したい」というOPの言葉を引用するなら、そういうことなのかな?私はエンジニアリングは常に具体的な問題を扱うことと、問題解決の喜びだと思ってたけど。私の推測では、権力への欲求があるんじゃないかな。それは考えてみれば自然なことだよね。科学や学術界も同じような病に悩まされてるし。

画像キャッシュを十分に書いたら、もっと大きなプロジェクトの高レベルなアーキテクチャに進む準備ができてることが多いと思う。多くの場合、アーキテクチャが素晴らしいアイデアを台無しにすることもあるから、経験豊富な開発者はそういう問題を解決する方向に進むべきだね。

キャリアの天井があって、年齢差別が迫ってるって感じだね。管理職の方が高レベルのICよりもずっと多いし、何十年も、年配のエンジニアが若いエンジニアに置き換えられるって考えがあったけど、最近の大手テック企業のレイオフでそれが本当かどうか疑問に思うようになった。管理職に移った人を何人も知ってるけど、彼らはそれに熱心だったわけじゃなくて、キャリアのためにそれが最善の道だったからだよ。

数年かけてシステムパラダイム(例えば、さまざまなホスティングシステム)やプログラミング言語(例えば、Perl)、フレームワーク(好きなJSフレームワークを選んで)を学び、上級者になったり専門家になったりするのに、数年後には完全に時代遅れになってしまうのって、退屈じゃない?それから面接で、自分の知識をアピールしようとしたら、25歳の子が3年前から使ってるYに対して、あなたはXの専門家だって言っても、相手にされないこともあるよね?そして、既存の会社にいて、時代遅れのXに縛られているのに、最新のYを使っている人たちは別の部署にいて、Yプロジェクトへのアクセスを嫉妬深く守ってるなんてことも。面接に行くとき、Yだけでなく、15年前のLeetcodeも知っていなきゃいけないってどうなの?だから、もしかしたら「力が必要だ、管理職に行く理由はそれしかない」っていう代わりに、もう一つの選択肢を提案したかもしれない。もっと穏やかな理由として、大きなものを構築したいなら、多くの人を巻き込む必要があるから、管理職にいる必要があるってこと。レンガを積んだり、ドアの角度を計算したりするのが好き?それならエンジニアだね。エンジニアを雇って、プロジェクトマネージャーと一緒に働き、予算を評価しながら承認を心配するのが好き?それは違う仕事で、「力」っていうのはあなたが言ってるようなものじゃない。自律性や意思決定権が、エンジニアがしばしば得られない「力」なんだよ(運が良かったり、非常に賢かったり、小さなスタートアップのような環境にいない限り)。

正直、人を管理するのはあまりやりたくないんだよね。エンジニアとしての役割はリーダーシップが求められるけど、重なる部分もあるし。でも、5年以上シニアデベロッパーをやってきて、役に立つアイデアを出す能力が、そのアイデアを実現するための時間を大幅に上回ってるってことを痛感してる。経験上、アカデミックな世界でも同じことがよくあるし。仕事では、手を動かし続けるか、マネージャーっぽくなって他の人にやらせるかの選択肢があるけど、後者は自分のビジョンとは違う形で進むことが多いから、正直イライラする。サイドプロジェクトに関してはもっとひどい。ほとんどできないから、選択肢すらないんだよね。

実際、著者は本当のマネージャーになりたいわけじゃなくて、NPCを動かして何かをするゲームをやりたいんじゃないかな。リアルなマネージャーは、コーチングやオーナーシップ、感情、政治、コミュニケーション、コンセンサス構築とかを扱うからね。得意な人は、他の人を成功させるのが好きなんだよ。

私にとって、マネジメントに入るのは、具体的なことに悩まされるというより、コントロールが欲しいからだったんだ(主に上の方に向けて)。悪いマネージャーや従わなきゃいけない悪い決定を経験したことがある人なら、私がマネジメントに足を踏み入れた理由がわかるかも。ICとしていた時、上からのリーダーシップが悪くて、日々の仕事が本当に非効率で辛いことがあった。自分のICとしての立場からその決定を変えられたらいいなと思ってたけど、現実はその希望とはほとんど合わなかった。実は細かいところが好きなんだけど、最近はマイクロマネジメントしたくないから、あまり深く入り込まないようにしてる。でも、今はマネージャーになったおかげで、チームのことにもっと意見を言えるようになったと感じてる。

問題解決の喜びは、私に喜びをもたらすフロンティアの探求だ。もしクランカーが何かできるなら、それは解決された問題だ。私は解決された問題のフロンティアを押し進めるために、手元にあるすべてのツールを使う。車輪を再発明するために時間を無駄にするのは、私にとって喜びとは真逆のことだ。

似たような話だけど、「高レベルの抽象化」って言葉をこんなに聞いたことないよ。どこを見ても高レベルの抽象化ばっかり。もう反応しちゃうフレーズになってる。昔は「抽象化」ってもっと意味があったのに…。

エンジニアとして、ここ数年の complacency を考えると、システムに自分の代わりにコードを書かせるなんて無理だよ。いつも自分のデザインの決定や変数名にこだわりがあるし、それがNプロジェクトにわたって記憶に残る、共感できる、再現可能なんだ。もちろん、これをコンテキストに入れられるって言う人もいるけど、ほとんどのモデルは幻覚を見たり、余計に不透明で複雑にしたりすることが多い。結局、そのゴチャゴチャを片付けるのに時間を使わなきゃいけなくなる。OPは電話でモデルに指示を出せばそれができるって言ってるけど、私は自分のプロダクト開発のワークフローでそんな成功を収めたことはないよ。もしこのレベルの自律性が今のAIで実現できるなら、ちょっと良すぎる気がする。

ある人たちは、自分でやるよりもその物事が終わることを望んでる。それは搾取的な寄生行動の極端な例に至るけど、もっと控えめなスケールでもそうだよね。自分のプログラミング言語の標準ライブラリを使ったことある?多分、あるよね。それは無限の不条理にまで広がる。自分で食べ物を育てたり、鉱石を掘ったり、道具を作ったりしてるわけじゃないでしょ?結局、自分がやりたくない部分を外部のツールや抽象化に頼るかどうかの問題なんだよ。

昨晩、あるウェブサイトをデバッグしてたんだけど、ユーザーが一度しかサインアップしてないのに「サインアップしすぎ」とメッセージが出ることがあったんだ。いくつかのポイントでLLMを使ってデバッグしようとしたけど、悪いアイデアに行き着いてばかりだった。正しいヒントを与えたのにね。根本的な原因は、DockerネットワークでIPv6が有効になってなかったことだったけど、ウェブサイトのDNSでは有効だった。だから、IPv6で接続した人たちのIPが同じ内部Docker IPに変換されて、IPごとのスロットリングアルゴリズムに渡されてた。ログにIPv6のIPがないことに気づいたけど、LLMは期待されるものがないことに気づかず、間違った結論を導いてた。だから、複雑なものを作るためにOpenClawを使うつもりはないよ。

OpenClawを自分のシステムで信頼しないと、たくさんの0-dayや10/10 CVEを逃しちゃうよ!

スキルの問題だね。

最近、このサイトにはプロ・アンソロピックなアストロターフィングがたくさんある気がする。おそらく、誠実な人々からの本物の熱意がほとんどだろうけど。それでも、アンソロピックに関する記事がたくさんあって、そのコメントの中には、流行のClaudeモデルを使ったエージェント的な方法でエンジニアリングすることの優位性を強く主張する人が必ずいる。もし彼らが本当に正しいなら、彼らのように布教する必要はないと思う。証拠は結果にあるからね。つまり、もしあなたの選択が本当にソフトウェアを生産する最良かつ最速の方法なら、市場や業界もそれを反映するはず。だけど、彼らは結果に語らせることを望んでないみたいで、主張を常に盛り上げて、人々に押し付けようとしてる感じがする。

最近、投票数にも少し疑いを持ってる。プロAI系の投稿が800票とか普通に集まってるし。Codexの発表は1500票?何が起こってるんだろう。

OpenClawのDiscordをチェックすると、「Opusを使わないと動かない」という意見が多いね。今のところ、これが実際の状況みたい。Grok 4 Fastから聞いたんだけど、内部システムのプロンプトには自律的な操作を禁止するルールがあるらしい。それが関係してるかも。でも、私はそれなりに良い結果が出てるよ。

その中には本物のものもあると思う。コーディングしない人(管理職など)にとって、0から大企業のような見た目のランディングページを作れるようになるのは奇跡だよね。もっと複雑なことになると、コードはコンパイルできるかもしれないけど、論理エラーや仕様を実装できないことが積み重なっていくことを理解できないんだ。

これを書いたのは、同じ人だよ。[1] [1] https://reorx.com/blog/rabbit-r1-the-upgraded-replacement-fo...

AIに対する私の不満は、既に自動化されているものや簡単に自動化できるものを加速させるだけで、政府サービスや金融サービス、学校、医療サービスなど、あまり自動化されていない分野には手を出せないこと。実際の問題には触れずに、自分たちのランチを食い尽くしてる感じ。私にとっての痛点は、ITに詳しくない人や企業との関係。彼らは電話や対面のアポイントメントに慣れてるから、一般的に私よりも発言権がある。Openclawは私のために電話をかけたり、アポイントを取ったりできるの?家事を手伝ってくれるの?契約者と会ってくれるの?どれもできないよね。メモを作ってくれるけど(ほとんどのメモは役に立たないから無駄だし)。ウェブサイトをスクレイピングしてくれるけど(そんなに知識を集めたいわけじゃないし)。既にエンドポイントがあるものは自動化できるかもしれないけど、自分のプロジェクトのためにコードを書くのは気にしない。なぜ誰かが自分の個人的なプロジェクトの大部分をAIに書かせたがるのか、理解できない。早く売りたいのなら別だけど。私はただのフラストレーションを抱えた年寄りなんだろうね。

電話をかけたり受けたりすることはできるけど、通話の内容や必要なデータ、収集方法について指示が必要だよ。通話の結果をAPI経由で出力することもできる。最近、MasterworksのAIエージェントがこの技術を使って私に電話をかけてきたよ。[0] https://vapi.ai/

AIに対する私の不満は、すでに自動化されているものや簡単に自動化できるものを加速させるだけだということだ・・・ > ただのイライラしたおじさんなんだと思う。これは、今のテック業界の人たちが抱えているビジョンの失敗をうまくまとめていると思う。 > すでにエンドポイントがあるものを自動化すること、Facebookが以前持っていたAPI、Redditが以前持っていたAPI、Amazonが以前持っていたAPI、全部なくなった。エンシティフィケーションやダークパターンが支配している。「ねえ、オープンクロー、サービスxxxをキャンセルして」って、XXXは17ステップもあって、キャンセルするのがわざと難しくなってるからお金を取られ続ける。AIツールがウェブサイトに行って広告を剥がして、テキストだけを返してくれるようになったらどうなるんだろう?カスタマイズされたニュースフィードがFacebookよりもHNっぽくなったらどうなる?RSSの死で失った機能を取り戻しているだけじゃない?消費者はAIの過剰な宣伝に怒ってるけど、もしそれが私たちが邪魔しているクソを切り抜けられるようになったら、ビジネスモデルが崩壊することになる。適応するか、死ぬかの選択になる。自分の「AI」ツールに、低リスクで基本的で面倒なタスクをやらせるように頼んでみて。たくさんあるからね。それが1/4でも終わらせてくれたら、自分の時間がたくさん空くよ。

こういう投稿には奇妙な傾向があって、著者がLLMコーディングツールによってワークフローに変革があったと主張する一方で、実際には何も成果を示せていないことが多い。最近のChatGPT Codex(「Extra High」推論の5.3)を使ってみると、これらのツールが繰り返しやローカルなタスクをこなすのは驚くほど上手だけど、実際のソフトウェア開発で難しいことに直面するとすぐに崩れるのが明らかだ。正しい結果を出すにはかなりの指導やサポートが必要だし、これはまだ役に立つかもしれないけど、今のオンラインの議論とはかけ離れていると思う。実際の例として、今の仕事でClaude CodeとChatGPT Codexを評価するように言われたんだけど、上司がそれらについて聞いたから、私たちの業務にどんな影響があるか知りたかったみたい。私たちの主な環境はC#とTypescriptのモノレポで、2つの製品を開発中なんだけど、かなり広範なテストスイートとほぼ100行の「AGENTS.md」ファイルがあっても、試したモデルは基本的にほとんどのタスクで失敗するか、ショートカットを試みるんだ。「プランモード」を使って計画を立てる時間を与えても、ほとんど効果がない。公平に言うと、非常に詳細な指示を与えて「思考」出力を監視し、何か間違っているのを見つけたら止めて修正することで、かなりうまく動かすことができたけど、その時には自分でやるのではなく、ボットを運転するためにこんなに努力するのは馬鹿らしいと感じた。これって、みんなが認めたくない「オープンシークレット」みたいな気がする。もし本当に多くの人が言っているほど良いなら、高品質なプロジェクトや製品が大量に開発されているはずだし。軽視しているつもりはないけど、本当に頭がおかしくなりそうだよ。

話したほとんどのソフトウェアエンジニアは、君とほぼ同じように見ていて、「ここがLLMの価値が落ちるラインだ」っていうのは人それぞれ微妙に違うけどね。企業のプロパガンダやソーシャルネットワークの影響で溢れていると思う。「特定のことには良いけど、他のことには微妙」っていうのはあまり広まらないよね。

これにはアストロターフィングがあるに違いない。関係者やお金の額を考えるとね。

君はおかしくなってないよ。私もそう感じてる。でも、以下のことには価値があると思う:- 自分でやるのではなく、LLMを使うこと。 - 時々、活性化エネルギーが足りない時にLLMはいつでも準備ができてるから、スタートを切るのに役立つ。 - 普段知らないことをやること。Claudeが何をするかを見て、コマンドラインツールやトラックの使い方をたくさん学んだ。短いスクリプトを書くのはすごく役立つよ。もちろん、ここでの落とし穴は、知らないことがあると上手く使えないってこと。だから、孤立して使う必要がある。 - 代替ソリューションを探ること。定義上、知らないことに挑戦すること。もちろん、うまくいかないこともあるけど、視野が広がる。 - 不慣れなコードベースを探ること。大量のデータを取り込めるから、探索が早くなる。(でも、自分で完全にやるよりは網羅的ではないけど) - 変更の一貫性を保つこと。これは人間よりも優れていると思う。2か所か3か所で変更が必要な場合、忘れちゃうことが多いから。LLMは細部の一貫性を保つのが得意だけど、大局的なことには興味深いことに弱い。

自分の経験と結構合ってるな。実際の会話でよく聞く意見だし。ネット上では魔法のような発見ばっかり目にするけど、ほんとにたくさんあるよね。

仕事で新卒やインターンの面接をたくさんやってるんだけど、ここ4年間ずっと続けてる。面接の時は、候補者に自分のプロジェクトや学校、他のインターンでの経験を画面共有して話してもらうようにしてる。ここ数ヶ月で、学生たちが達成できるプロジェクトの質や規模に明らかな違いを感じてる。彼らが見せるプロジェクトやウェブサイトはどれも洗練されてて、ほとんどがAI以前のフルスタートアップMVPになりそうなものばかり。明らかに基準がすごく高くなってるよ、AIのおかげで。

... でも、何も見せられないように見える これ、めっちゃ同意。ほんとに馬鹿らしいと思う。誰かが盛り上げるときって、「毎朝彼女におはようってメッセージ送るんだ!」とか、「自分のパソコンのすべてのドキュメントを分析して詩を書いてくれた!」みたいなことが多いよね。

今、ハイプサイクルの頂点にいると思う。来年には落ち着いて、みんながツールをどう使ってるかの全体像が見えてくるんじゃないかな。たとえそれが完全にアストロターフィングじゃなくても、人々は驚いて興奮してるだけで、冷静に分析できてないと思う。

これって、人間同士で相関があることが、LLMではそうでもないっていう、すごく異質な感じがする。人間が得意だと思ってる2つのことが、AIでは全然違う結果になることがあるんだよね。AIを使うスキルにもかなりのばらつきがあるみたいだし(自分は特に得意じゃないと思ってるから、秘訣を隠そうとしてるわけじゃないよ)。また、AIが人間にとって同じ難易度の問題を解く能力にもばらつきがあるように感じる。

主要なことは、これらはすべて新しいプロジェクトってことだね。(元の著者がプロジェクトのアイデアを実行することについて話してるのに注意。)

それ、信じられないな。どんなUIの下でも同じモデルが動いてるだけだし。忘れたり、細かいところを見逃したりするのも同じモデルだよね。それなのに、CLIツールやインターフェースが増えたら急に10倍のAIになるの? 実際に反発する人たちと接する仕事をしてるマネージャーにはそう感じるかもしれないけど、私が頼んだ機能に直接関係ないテストを回避するのは止まると思えない。