世界を動かす技術を、日本語で。

AI時代の最初の40ヶ月

概要

  • ChatGPT 登場以降40ヶ月間のAIとの関わりを振り返り
  • AIによるコーディング支援 や日常活用の進化体験
  • Claude Code など最新AIツールの実用性と課題
  • AI生成コンテンツ に対する個人的評価と葛藤
  • AI時代の現状と今後 への率直な考察

ChatGPT登場からのAI体験の変化

  • ChatGPT の2022年11月リリース直後、従来のチャットボット(Cleverbot等)と比較して圧倒的な進化を実感
  • 詩やDungeons and Dragonsの設定、ファンタジー世界の創作など、文章生成能力の高さに驚嘆
  • ただし 無難すぎる文体や表現 という限界も明確に認識
  • Linus Tech Tips WAN Show でプログラム生成事例を知り、実際に「Hello World」など簡単なコード生成で有用性を実感
  • Stack Overflow等での調査の代替 となる場面も増加

AIによるコーディング支援の実際

  • MTGコレクション管理アプリ の開発にClaudeを活用
    • カード情報API取得、QRコード生成、印刷用レイアウト作成まで一括生成
    • 追加プロンプトによる改良は限界があり、最終的には自身の手で仕上げ
    • AI生成コードの最終利用率は低下、時間短縮効果の有無に疑問
  • AIコーディング支援の進化 は感じるが、実用性には常に再考が必要

Claude Codeのレビューと利用感

  • Claude Proサブスクリプション を初購入し、Claude Codeを導入
    • 自然言語でPC操作 できる新しい体験として高評価
    • 明確な指示を与えれば、期待通りの動作を実現
    • コーディング補助ツールとしての完成度 に満足
    • ローカルLLMの普及 にも期待
  • Claude Codeによるvibe coding も再挑戦
    • 小規模プロジェクトでは一発で良い結果を得られる
    • 反復的なプロンプト による改善が以前より効率的
    • 文脈保持やバグ発見能力 に驚きつつも、長期プロジェクトでは一貫性維持に苦労

AIとビジネス起業

  • ITサービス会社の立ち上げ支援 としてClaudeをエグゼクティブアシスタント的に活用
    • 事業計画作成や進捗管理で 自信と行動力を獲得
    • 実際の顧客獲得は未達だが、AIによる「glazing(やる気の喚起)」効果を肯定的に評価

AIの有用性と限界への考察

  • 生産性向上 は確かに感じるが、どこまで本質的な改善かは不透明
  • AIを使うことでプロジェクトのスコープが拡大 していないか自己分析
  • 「時短」だけを指標にせず、付加価値や完成度向上も評価軸とすべき と考察
  • Claude Proの継続利用 は今後のローカルLLM進化やレート制限の噂次第

AI生成コンテンツの創作・消費体験

  • 自サイトにはAI生成文章を一切未掲載
    • 完璧な文法やスペルにも関わらず、 AI文章の無個性さ・魅力のなさ が大きな障壁
    • 本質的に「自分の文章」ではないことが最大の理由
  • AI生成コンテンツの読者体験
    • 「アンキャニーバレー」的な違和感で即座に興味を失う
    • 人間的な温度や個性の欠如 が最大の課題
  • 理想的なAI活用法模索
    • チーム開発や創作支援での活用可能性には期待を残す
    • 熟練者による絶妙なAI活用 が今後の鍵と予想

AI時代の現状と今後

  • 2026年初頭時点でのAI観
    • AIの進化と課題を冷静に評価
    • 意見や感想の共有を歓迎 (メールやSNSで連絡可能)

連絡先

  • メール: mail@lzon.ca
  • SNSリンク: ホームページ参照

Hackerたちの意見

どのくらいの範囲を広げたのかというと、AIを使えばもっとできるって分かってたからなんだよね。最近、職場で誰かがこれを「クロード・クリープ」って呼んでた。生成するのが簡単だから、ついついもっと進めたくなるけど、実際にはそれがどんどん仕事を増やすことになるんだよね。

そして、こうして新しい言葉が生まれた。

私がほぼ無料でやった範囲の拡大は、主にUXの磨きやアクセシビリティに関することが多い。エージェントがなかったら、CLIツールのヘルプを完全にやり直すなんて、絶対に1時間以上かけなかっただろうな。効率や質を測るのは本当に難しいけど、うまく使えばエージェントは両方にとって大きな利点になると自信を持ってる。逆に、下手に使うと、ただの雑なものをすごく早く作るだけになる。

いや、これについてずっと考えてたんだ!伝統的な方法で構築するコストを内面化するのが、ちょっとおかしくなっちゃったと思う。これらのClaudeみたいなものを使うと、「範囲が広すぎる」っていう感覚があまりわからないから、複雑さを過大評価したり過小評価したりしやすいんだよね。時にはLLMが一見難しそうなリファクタリングを超簡単にしてくれることもあれば、逆に簡単そうなことが永遠にかかることもある…で、実際にどうなるかの「直感」があるんだ。だから最近は、明確な終点を設定するのではなく、時間を区切ることに決めたんだ。「終点」っていうのは「今日は終わり」ってことだし、正直言うと「このプロジェクトは終わり」ってことかも。わからないけど、「Claude Creep」っていう言葉には共感できる。あれは、最初はドキュメントを引っ張り込むだけだったのに、最終的にはファイルシステムを完全に再構成する羽目になるからね。笑。

もしあなたが仕事を25%早く終わらせられる社員なのに、4日間勤務制が導入されないなら、何が「クリープ」を導入しないインセンティブになるの?

普通の質のものをただ書いているのか、それとも書くものの質を向上させているのかってことだね。質を上げるための要素はいろいろあるけど、時間がかかるものも多い。Claude Codeがそれを手伝ってくれるよ。最近やったことの一つは、ユニットテストや機能テストのスイートを見直して、初期化の標準化を求めたり、ボイラープレートを最小限に抑えるための合理的なヘルパーメソッドを作ったりしたこと。どんな開発者でも、1週間あればできるし、将来的なコード変更が楽になるよ。Claudeの場合、1時間で-8000行のPRを作成して、すべてのテストとアサーションを維持したんだ。これはコードベースから必要なものを見つけるためにみんなが必要としていることだよ。私たちの通常の品質管理は、安定性を失わずに変更するための最大安全速度を埋め込んでいる。LLMを使って変更を早くしようとすると、問題の数を一定に保ちたいなら、品質管理を改善する必要がある。テストを改善したり、LLMにログを見せてバグを早く見つけさせたりすることで、品質の予算を増やす必要があるんだ。

AI生成コンテンツについてのいい観察だね。> 社会的な観点から見ると、整形手術みたいに、やりすぎや下手にやると変に見えるって考えてたんだ。

それを言うと面白いね。唯一の違いは、時々配管工事をせずに機能が必要なことだよね。結局、必要な出力が得られれば、プロセスは関係ない。面白いアナロジーだけど、検査官が別の専門家の開発者でないと成り立たないね。

比較の重要な側面は、誰もあなたの手術が目立つとか、悪く見えるとは言わないってことだよ。友達や家族、パートナー、同僚は何も言わないし、カジュアルに会う人たちもそうだし、サービス業の人たちも、あなたの鼻の手術について真実を教えようとはしない。AIコンテンツにも同じような社会的タブーが移らないことを願ってる。私たちはAI生成コンテンツを、全体または部分的に人間の創作と一緒に使った場合でも、正直に批評すべきだと思う。AIコンテンツがあなたの記事を台無しにしたなら、それを言うのは社会的に受け入れられるべきだよ。ここHNでもそういうのを見たことがある。AIコンテンツがここに提出されると、LLM生成だと明言するのは社会的にタブーだったし、LLM生成のコメントも同様だった。どんなに明らかでもね。コメントがAIだと言うことは社会的に禁じられていて、指を振られたもんだ。最終的に、AI疲れがコミュニティをショーHNのエントリーや提出、コメントを軽視させる原因になって、信号対ノイズ比は無視できなくなった。今はshowdeadをオンにしてみて。ユーザーが本気で作ったかのようにやり取りすることを期待されていた同じコメントが、すべての提出のコメント欄に散らばってる。これらのコメントは議論を客観的に妨害してるから、影で禁止されてるのは良いことだと思う。文化的には、AIコンテンツ、コードを含めて、批評が批判者をヘイターやラッダイト、さらにはそれ以上のものとしてレッテルを貼らないようなポイントに達することを願ってる。コミュニティが本当に大切にしていることや望んでいることについての会話が抑圧されないように。

書くことも動画と同じだよね。今では、実際にAIかどうかわからない動画がある。悪いときだけAIだとわかる。うまくできていると、AIだって気づかない。だから、人々はAIを偽物や悪いものとしか結びつけなくなっちゃう。良いものは、全くAIとは結びつけられないんだ。

これは良い自己評価だね。「行動に移すためにぼんやりしている」って部分、共感できる。人間のモチベーションや暗示に関する深い何かがこの概念には隠れていると思う。> AIが生成する文章は、せいぜい退屈で、最悪の場合は本当に魅力がない。理論的にはうまくいくはずなのに、常に誘惑されてる。AIは完璧なスペルと文法を持っていて、記事の長さのコンテンツを作るのに十分なコンテキストがあるし、私が何時間もかかることを数秒でやってのける。私には仮説があるんだ…人間の精神には、LLMが観察したり再現したりできないような摩擦を楽しむ何かがあるって。

人間の精神には、LLMが観察したり再現したりできないような摩擦を楽しむ根本的な何かがある。何が起ころうとも、私たちはマキシム機関銃を持っていて、彼らは持っていない。

出力は一貫していたけど、その「スタイル」はすごく退屈で、あからさまに無難だった。それが技術の明らかな限界だったんだ。スタイルは技術の限界じゃなくて、OpenAIやAnthropicのロボトミーされたモデルの限界だよ。オープンソースコミュニティには、クリエイティブライティングが得意なモデルがたくさんある。

オープンソースコミュニティには、クリエイティブライティングが得意なモデルがたくさんあるよ。いくつか例を教えてもらえる?

確かにこの技術が生産性の向上をもたらしているのは間違いないけど、実際にどれくらいの改善があるのかは本当に(イライラするくらい)わからないんだよね。LLMにかけられた努力やお金のほんの一部を、もっと良いAPIドキュメントや従来のコーディングツールに使ったら、どれだけ生産的になれるかよく考える。多くの場合、現在のAPIの使い方を頭に入れるのが間に合わなくてAIに頼ることが多いんだけど、ドキュメントが存在しなかったり、古かったり、散らばっていて整理しづらかったりするからね。

うん、俺もそんな印象を持ってる。AIは、過剰で悪くデザインされたフレームワークや、要素が多すぎる技術スタックを隠している感じがするし、本当に表現力のある言語を作ったり推奨したりする人が減ってきてるよね。実用的ではあるけど、ここで椅子のタワーを作るよりも、ちゃんとしたエンジニアリング分野のように梯子を作るべきだと思う。

最近のプロジェクトでは、ユーザー向けのドキュメントよりもClaudeのスキルやMCPに良いドキュメントがあることが一番好きだな。

幅広い活動をしている者としては、色々なことを超加速させてくれるよ。ただ、批判的な目を持つことが必要だけどね。基本的なコーディングタスクでは40%から60%の改善が見込めると思う。大規模なコードベースは持ち込まないけど。

Googleの検索結果がここ2年でめちゃくちゃ悪化した気がする。今や何か有用なものを見つけるにはAI検索を使わなきゃいけないみたい。もちろん、それはサイトへのトラフィックを減らして、最初に探しているコンテンツを作るインセンティブも減らしちゃうよね :(

ほんとそれ。エージェントスキルをリポジトリに直接入れる話(Markdownで!)はイライラするよね。「ドキュメントをコードとして扱う話が出たとき、みんなどこにいたの?」って感じ。NotebookLMsのことを考えると、さらにイライラする。彼らは大きな分野の知識の単一のソースになりつつあって、それ自体は素晴らしいんだけど(でも、ソースを読むことができないのは「聖書を読んであげるよ」みたいな感じ)、昔だったらこの知識はSharePointやSlack、Google Drive、Confluenceなんかに散らばってたはずだよ。

もしLLMに注ぎ込まれている努力やお金のほんの一部が、より良いAPIドキュメントや従来のコーディングツールに使われていたら、どれだけ生産性が上がるだろうってよく考えるよ。たぶん微々たるものだろうけど。お金を注ぎ込んでも解決できる問題じゃない。証拠:設定ファイルのフォーマット。YAMLを書くのが好きなプログラマーなんて見たことないし、コメントなしの純粋なJSONは人間が書くべきフォーマットじゃないよ。でも、私の知る限り、金持ちの会社でもこれらのフォーマットはまだ一般的なんだよね。置き換えるはずだったXMLの設定も、金持ちの会社によって普及したし…!

より良いAPIドキュメントと従来のコーディングツールに同意するけど、言語によるんだろうね。私はC++開発者で、テンプレートを使い始めると、真の構文エラーや「正しそうだけど標準がサポートしてない」エラーでコンパイラーが出すエラーが本当にイライラする。LLMはその標準を「ただ知ってる」から(まあ、2000ページ全部)、大抵のエラーを私よりずっと早く見つけて直してくれるんだ。実際、私が好んで使う方法の一つは、Codexをコンパイラーの出力に向けて、テンプレートエラーを直すだけに使うこと。たとえばKotlinは、IDEの中で正しさをチェックしてくれるから、コンパイラーを呼び出す前にかなり目立つし、言語仕様もずっとスリムで、C++とは違って未定義動作が少ない(ない?)。

そして面白いことに、最悪なのはAIフレームワークそのものなんだよね。数ヶ月前、クライアントのために「エージェント的」なものを構築する手伝いをしてて、OpenAI AgentsライブラリからAgnoに切り替えたんだけど、Agentsは結構ごちゃごちゃしてて、自分のenumを一貫して使ってないこともあるし、Agnoに切り替えると、まさに自分たちのドッグフードを食べてる感じがする。何度も、あるオブジェクトのAPIが見つからなくて、もちろん彼らのドキュメントページは「クソみたいなドキュメントチャットボットとチャットしろ」って押し付けてくるし、古い関数のシグネチャを吐き出してくるんだよね。

LLMにAPIドキュメントを書かせることはできないの?

君の効率についてはわからないけど、僕の場合はツールを作る方が、既存のものを探して使い方を学ぶよりも簡単になってることが多いよ。レーザーカッター用のパラメータ化されたSVGテンプレート作成ツールを一発で作れたし、40時間集中しても同じことはできなかったと思う。

ClaudeとClaude Codeの有用性には同意するよ。Claudeはまるで自分のエグゼクティブアシスタントや営業チーム、IT部門みたいだ。これにClaude Codeを組み合わせれば、すごいものが作れるよ。俺の例を挙げると、ビジネスを始めたりMVPを作ったりするのにClaudeを使ったんだ。数週間の調整を経て、Claudeなしでは絶対にできなかったものを作ることができた。これは間違いなくゲームチェンジャーだね。

プログラミングを知らない友達がAIエージェントを使ってゲームや音楽ソフトを作ってるんだけど、彼らがやってることは俺には全く理解できない。プログラマーであることが逆に足かせになってる気がする。コードが何をしているのか、専門的な知識(例えば、音声処理や効果音に関する数学)を理解する必要があるからね。一方で、友達は「シンセにフェイザーエフェクトを追加して」って言うだけで、あっさりやってくれるんだ。

もし営業がうまくいってたら、契約した会社は今頃繁盛してるはずだよ。競合より約500倍速い製品を持ってて、その分野で最も一般的な活動のためのUXも良くて、リアルタイムで動作する結果分析ツールもずっと優れてるのに(競合のソフトウェアにはできないこと)。確かに、人口統計的には大きな市場じゃないけど、リアルな営業マンなら持ってるもので成功すると思う。営業に何か本当におかしなことが起きてるけど、それはLLMを使っても解決できてないみたい。私はこの会社がLLMを使ってるのを知ってる。なぜなら、共同創業者の一人が、明日がないかのように過剰なClaude Codeの出力をリポジトリにスパムしてるプロジェクトに関わってるから。これ、コード生成がクソだし、他のことでもたぶんクソだと思うけど、みんな知らないことについては良いと思い込んでることが多いんだよね。

新しいツールよりも、上司を納得させる新しい方法が一番のプラスだと思う。少人数の地元チームが、無限にいる低コストの「開発者」よりもずっと多くのことを成し遂げられるっていつも感じるよ。低コストの開発者のスキルが低いからだけじゃなくて、大きなチームになると仕事の構造が悪化するし、分散チームだとさらに悪化する。スキルが多様なチームでも同じことが言える。インドのような人気のある場所の文化的な欠陥については言うまでもない。だから、役割や低スキル・低信頼の「開発者」を管理するためのビジネス構造によって、1人の地元の人とAIを組み合わせる方が、20〜100人のインド人よりもいいって主張できるようになったんだ。近い将来、完全に国内に戻す計画を立ててる。経理部門も喜んでるし、仕事の質も上がってきてるよ。

そうそう、これに加えてAPIもね!LLMがAPIを必要とするおかげで、GUIの背後にあったものがプログラム的に使えるようになったのはいいことだよね。情報セキュリティの懸念もあって両刃の剣だけど、個人の生産性を自動化するにはいい感じ。

でも、インド人3人 + AIってことは、君たちが全く必要ないってことだよ。これは長期的にはうまくいかないだろうね。

低コストと低能力を混同してるよ。一部のインドやブラジルの開発者はアメリカの開発者の4分の1のコストだけど、同じくらい有能な場合もあるからね。確かに、参入障壁が低くて文化的な違いがあるから平均は低いけど、コストと能力は分けて考えるべきだよ。カリフォルニアに住んでるからって、インドのスーパー開発者と比べて高額な詐欺師を雇う必要はないんだから。

だから、ローカル+AIを追加する方が、約20〜100人のインド人よりも良いって主張できるようになったんだよね。それを何もないかのように言うのはどうかと思う。ITで働いているたくさんのインド人に対するリスペクトが欠けてるよ。僕は彼らと一緒に働く機会があったから、特にそう感じる。

AIコンテンツを生成するのはつまらないし、AIコンテンツを消費するのもつまらない。でも、それを同じループで組み合わせると、めっちゃ中毒性がある。AIコンテンツのプロシューミングは最高だよ。LLMのおかげで、面白そうな動画を見つけたら、そのトランスクリプトを取ってLLMに入れて、要約していくつか質問するんだ。12分の動画を基にした5フレーズのニュースに戻すこともできる。リクエストを生成する側になると、より個人的に感じるんだよね。ほとんどのLLMは、直接話しかけると普通の人みたいに応答するのに、「コンテンツを作成して」って言うと、急に面倒なブログの話し方になるのが面白い。

12分の動画を基にした5フレーズのニュースに戻すこともできる。なんで元のニュースを読まないの? まあ、広告やトラッキング、1記事だけ読みたいのにサブスクリプションを払わなきゃいけないこと、単純に退屈だから、などいろんな理由があるよね。あなたを責めるつもりはなかったんだ、もっと社会全体への質問だったんだ。なぜ「コンテンツクリエイター」が5フレーズのニュースを12分の動画にして、LLMがそれを元に戻す方が、5フレーズを読むより魅力的になったの?

問題を探している解決策 マーケティング担当者は潜在的な問題のリストを提示する 最小の成功事例が将来の成功の指標としてマーケティングされるけど、これを検証するには未来が来るのをじっと待たなきゃいけない。

LLMが書いたコードを押し進めている同僚たちは、みんな同じ特徴を持ってる。彼らは品質にあまり関心がないんだよね。最近では、誰も彼らのコードやドキュメントをレビューしたがらない。だって、ただ痛いだけだから。自分たちの書いたものすらレビューしてないし。著者が理解していない変更が何十もあるPR?そんなの触りたくもないよ。著者が一行も書いてない30ページのRFC?それも読みたくない。しかも、壊れないMDファイルを何百も書いてるけど、責任感が全然ないね。