世界を動かす技術を、日本語で。

二種類のAIユーザーが登場している

概要

AIユーザーの間には 大きな格差 が存在。 企業のAI導入状況は 組織規模やIT方針 で大きく異なる。 大企業では Microsoft Copilot のようなツールの使い勝手が課題。 小規模企業は Claude Code などを活用し生産性向上。 将来的には API連携と安全なエージェント活用 が鍵。

AIユーザーの二極化

  • AIユーザーは 「パワーユーザー」「一般ユーザー」 に分かれる傾向

    • パワーユーザーは Claude Code やMCPs、スキル活用
    • 意外にも 非技術系職種 が多く、特にファイナンス分野で活躍
    • 一般ユーザーは ChatGPT などのチャット利用が中心
  • Microsoft Copilot の現状

    • エンタープライズ市場での Copilot普及率は高い が、機能面で不満多数
    • 「エージェント」機能はCLIエージェントと比較し 著しく劣る
    • Microsoft内部でも Claude Code 導入が進行
  • Copilot以外のAIツール導入が 企業ポリシーで制限

    • Copilotの パフォーマンスや制約 が生産性向上を阻害
    • コード実行機能の リソース制限 で大規模ファイル処理が困難

エンタープライズITポリシーの課題

  • 厳しいIT管理環境 によるAI活用の阻害

    • ローカルでの スクリプト実行不可、VBAすら制限されるケース
    • レガシーソフト に依存し、内部APIが未整備
    • 技術部門の分断や外部委託 で社内開発力が低下
  • セキュリティ面の懸念

    • 無制限なエージェント利用による リスク
    • 安全なサンドボックス構築が難しく、 内部インフラ整備が進まない

小規模企業のAI活用

  • 小規模企業は柔軟なAI導入

    • レガシーの制約が少なく、 Claude Code 等を積極活用
    • 非技術系役員でも Python による業務効率化が可能
    • 複雑なExcelモデルの Python化 でデータサイエンス活用が容易
  • 生産性格差の拡大

    • 小規模企業は 大企業を凌駕する生産性 を獲得
    • 従来は大企業のリソースが羨望の的だったが、 逆転現象 が発生

未来のワークスタイル

  • 現場主導のAI活用

    • トップダウンよりも 現場の自発的導入 が成果を生む
    • 業務プロセスを熟知した小規模チームがAIワークフロー構築
  • API連携の重要性

    • 内部システムの API化 でAIエージェント活用が加速
    • データウェアハウス等への アクセス性 が鍵
  • 安全なAI実行環境の必要性

    • ホスト型VM+ネットワーク制限 によるサンドボックス運用
    • 非技術系ユーザー向けの 安全なエージェント実行モデル は今後の課題
  • レガシーSaaSの課題

    • APIファーストでない旧製品 は生産性向上のボトルネック
    • 小規模企業は API連携に優れた新興サービス を活用
  • AIエージェント+API連携の威力

    • Bashサンドボックス+プログラミング言語+APIアクセス で非技術者も高度な業務自動化
    • ほぼすべての 従来型生産性アプリの代替 が可能

結論:知識労働の未来と企業間格差

  • AI活用の二極化 は今後さらに拡大
  • 少数精鋭チームが大企業を凌駕 する時代の到来
  • CISOやIT部門 は安全なAI活用基盤の整備が急務
  • API連携・エージェント活用 が知識労働の本質的な進化ポイント

Hackerたちの意見

AIを使って金融モデルを作ってる人たちが、そのモデルが期待通りに動くか確認するスキルを持ってないのは怖いよね。

その横にエクセルシートがあって、それと照らし合わせてテストできるんだよ。何かおかしいと思ったら質問もできるし、コードの説明もしてくれる。

AIによって大きなクラッシュが一回起これば、資本家たちがビビるだろうね。そしたら、ホワイトカラーの俺たちも少しは息ができるかもしれない(少なくとも数年、もしくは10年くらいは)。

全然怖くないよ。失敗するところもあれば成功するところもあるし、全体的には私たちにとっては何も変わらないと思う。

PythonからRustを学ぼうとしてるんだけど(楽しみでね)。Python用のいろんなLLMを使ってるけど、たまに躓くことがある。AIを信じすぎると、どれだけ自分が知らないか、どれだけ多くの人がそのことを理解していないかを実感するのは美しい体験だよ。自分のレベルでAIを使ってRustプロジェクトを展開するのは、ちょっと怖いな。

いつも通りのビジネスだね。

もし彼らがExcelモデルを検証するスキルを持っているなら、AIが生成したモデルの数字にも同じアプローチを適用できるはずだよ。直接検査できなくてもね。私の経験では、多くのExcelモデルは実際にはあまりテストされていなくて、ちょっとチェックして正しいと見なされるだけなんだ。

医療に移行すると、少し怖さが減るだろうね。

「アップサイド」の説明だけど、技術的じゃない役員がClaude Codeを理解して、ローカルでPythonを動かせるっていう状況があるんだ。最近、30シートもある超複雑なエクセルの金融モデルをClaude Codeでほぼ一発でPythonに変換するのを手伝ったよ。モデルがPythonに入ったら、Claude Codeを使ってデータサイエンスチームをポケットに持ってるようなもんだ。モンテカルロシミュレーションを簡単に実行したり、外部データソースを入力として引っ張ってきたり、ウェブダッシュボードを作ったりして、モデルやビジネスの弱点を本当に統合するためにClaude Codeと一緒に作業できる。誰かがエクセルで何時間も苦労しなくても、指先でこんなにパワーを持ってることに気づくのを見るのは、ほんとに魔法みたいな体験だよ。ちょっと気持ち悪くなるくらい。俺は地球物理学に応用した数学のバックグラウンドがあるけど、正直この言葉だけで「30シートの超複雑なエクセル金融モデル」って聞くとゾッとするし、逃げ出したくなる。でも、Claude Codeで30シートのエクセル金融モデルをPythonに変換するのが、元のものより大幅に悪くなるとは思わないけどね。

俺は、かなり悪化すると思う。エクセルシートは、長年にわたってその動作を理解していた人たちによって調整されてきたし、無数のバグも直されてきたからね。Claude Codeのコピーは、同じように動くかもしれないけど、エッジケースを間違える可能性が高い。30シートのエクセルを考えると、そういう鋭い部分がたくさんあるんだ。

こういう「コードに近い」分野の一つのダーティな秘密は、テストがほとんどないってこと。データサイエンスチームがシミュレーションで何かを間違ってモデル化したら、それを誰が見つけるの?普通は誰も気づかないよ。遅すぎるまでね。「これ、信じられない」って出力に対して言える?それとも「データドリブンじゃない」って怒られるのが怖くて言えないかな。もし役員がインターンや派遣に「それをvibecodeして」って言ったら、プロセスを人間の言葉で説明したものが正しくシミュレーションに変換されたか確認するチェックポイントは絶対にないよ。でも、コーディングとは違って、誰かがクリックしたりリクエストを送ったりして確認できるユーザー向けの製品がないからね。巨大なエクセルドキュメントにテストスイートはあるのかな?多分ないと思うけど、間違ってるかもしれない。金融モデルみたいに、白黒の検証や正確性が少ない分野で働く人には、すごく難しいことになりそうだね。

お約束のxkcd: https://xkcd.com/1667/

ところが、AIを使うときは、自分でやるんじゃなくて、やってもらってる感じだよね。AIはツールじゃなくてサービスなんだ。昔、IBMが「エグゼクティブデータターミナル」を設計・構築したことがあったけど、私たちが理解するコンピュータターミナルとはちょっと違った。実際には、ビデオと双方向オーディオのフィードがあって、部下たちがいる部屋に接続されていて、エグゼクティブはビジネスデータや分析を頼むことができたんだ。それをコンピュータのディスプレイで呼び出して、エグゼクティブのオフィスにもルーティングされていた。この仕組みで、エグゼクティブは質問をして、情報に基づいた意思決定ができた。だから、エグゼクティブは何かをやってもらうのに慣れているから、AIがこの設定で「部下のチーム」を置き換えるのは理解できる。実際、もし私がそのCEOの椅子に座っていたら、LLMが言うことを信じる前に二度考えるし、その結果をダブルチェックするだろうね。たぶん、私の部下たちと一緒にね。Hackernewsで議論されているよ: https://news.ycombinator.com/item?id=42405462 IEEEの記事: https://spectrum.ieee.org/ibm-demo

「悪いエクセルシートが不況を引き起こした」から「悪い雰囲気の金融システムが不況を引き起こした」に変わってきてるね。

それでも、30シートのExcelファイナンシャルモデルをPythonに変換するClaude Codeは、元のものより大幅に悪くなることはないだろうね。笑わせてもらったよ。 :)

最近、30シートもある超複雑なエクセルの金融モデルをClaude Codeでほぼ一発でPythonに変換するのを手伝ったよ。Claude Codeがその変換を喜んで一発でやってくれると思うけど、元のロジックの重要な部分を台無しにする可能性が高いね。

エクセルがどれだけ簡単にテストできるかによるね。ClaudeがエクセルとPythonを異なる入力で実行して、出力をチェックできるなら、ほぼ一発でできる可能性が高いよ。

401kがLLMを使って金融モデリングツールをいじってるアナリストに管理されてるって考えると、夜も眠れないって感じじゃない?

公平に言うと、彼はほぼワンショットと言ったんだ。まるで、ほぼ100%信頼できるCPUみたいで… それは、100万クロックサイクルごとに一度だけ失敗するってこと。

グリーンフィールドプロジェクトとブラウンフィールドプロジェクトでのAIの使われ方に大きなギャップを感じてる。グリーンフィールドプロジェクトの初日は、一週間分の仕事ができちゃう。でも二日目には数日分の仕事しかできない。最初の週の終わりには20%の生産性向上を実感してる。AIがみんなにイノベーターのジレンマをスピードランさせてる感じ。誰でも小さなバージョンを作れるけど、大きな組織は以前のように素早く動くのが難しい。面白いのは、AIがその小さなシステムを大きくて複雑なものに育てるのに使われるかどうかだね。エッジケースを考慮したり、すべての要件を満たしたり、必要に応じてスケールさせたりするのは人間には難しいし、特に動きながらだとね。今のところ、AIからはa) 大きな複雑なシステムへの非常に指向された小さな変更、またはb) よく定義されたレールに沿ったプラグインや拡張以外は見たことがないな。

そうだね、私の普段の仕事では、多分20%くらいの生産性向上があるかな、正直言うと10%に近いかも。チーム全体の生産性には何も影響してない気がする。上司たちは小さな生産性向上を使ってPRの問題を直したり(何か見逃したときは本番でね)。でも先週は、実際の仕事がない日が二日あったから、組織を助けるCLIツールを作ったり、整理整頓をしたりしたんだ。AIのおかげで生産性が少なくとも200%、下手したら500%は上がったと思う。

企業ITの化石みたいなもんだけど、この視点と著者の意見に賛成だね。Hashicorp Packerのビルドファイルを急いで作る必要があったとき、VaultやTerraformのちょっとした経験しかなかったけど、ローカルAIがあれば一瞬で80%まで進められた。読んだり、編集したり、テストしたりできて、Packerの薄っぺらい「はじめに」ガイドよりもずっと早く進めたよ。結果的に、全くの前知識から1週間以内に堅牢なOSイメージと再現可能なパイプラインを作れた。逆に、チャットボットにGPOについて聞いたり、ネットワークファイアウォールやセグメンテーションルールを変更させたりするのは絶対に無理だね。企業の基盤である脆弱なシステムの中で自由に動かすなんて、絶対にダメだ。何かが存在すればするほど、チャットボットがそれを壊す可能性が高くなる。彼らはパターンマッチングと予測で訓練されているから、インフラが老朽化するのとは真逆なんだ。LLMがあってもそれは変わらないと思う。LLMは中小企業のITにおける私の一人軍団のセールスポイントには本当に革命的だね。

AIは、問題を考えすぎているときや、やらなきゃいけないことに着手するのが面倒なときに、すごく役立つと思う。解決策が、私の自然な過剰設計の傾向を抑えるのにも助けてくれるしね。ChatGPTにクイズを出してもらうのも楽しいよ。

約5000行のコードまでは素晴らしいけど、それを超えるともっと多くのガイダンスや注意深い監視、懐疑心、積極的なコンテキスト管理が必要になるね。気をつけて使えば、完全に脱線するのはたまにだけど、そのダメージは1時間か2時間のロスだけだよ。全体的には、まだ4倍の生産性向上があるから、月20ドルで文句はないかな。特に複雑なCの部分を管理するのが得意だから、シンボルのもつれよりも大きな視点に集中できるのがいいね。

これはどんなグリーンフィールドプロジェクトにも当てはまるんじゃない?生成モデルの有無に関わらず。最初の数日は驚くほど生産的だけど、その後は機能や修正がどんどん遅くなっていく。最初のアーキテクチャが現実の要件の変化に耐えられるかどうかで、自分がどれだけ優れたエンジニアかがわかるよね。そして、何かを出荷するまでに持ちこたえてくれることを願う。「それは週末に作れるよ」「プロジェクトの最初の80%は80%の時間がかかり、残りの20%は他の80%の時間がかかる」

誰でも何かの小さなバージョンを作れる そうだね。ソフトウェアを設計する時の一番の問題は、システムアーキテクチャやインフラの設計だね。AWSに全部押し込んで終わりっていうのには反対だよ。そこからは何も学べないし、クラウドのパフォーマンスは多くのことに対してイマイチだし、何かのインスタンスをうっかり動かしっぱなしにして、30万円の請求書が来るのは避けたいからね。AIは、怠け者の開発者のための解決策としてクラウドがあるから、シナリオXに最適なインフラを判断するのが苦手だよ。自己ホスティングの方法を勧めさせようとしたけど、それは一般的にセキュリティの危険があるだけだね。

私はこれを「day50問題」と呼んでいて、約1年前に名付けたんだ。それに対処するためのツールを作ってきた。7ヶ月前に日常の仕事を辞めて、フルタイムでやってるよ。https://github.com/day50-dev/ ブログを立ち上げようと思ってたんだけど… 本質的には、人間がやることとコンピュータが生み出すものの間にギャップがあるんだ。クラシックなコンパイラの設定では、これは開発ライフサイクル全体を通じて知られている安定した量なんだけど、AIコーディングの世界ではこの距離が増えていく。いろんな障壁があって、「コードデット」みたいなラベルがついてるところでラインが交差することがある。今は三つの緩和策がある。ラインを近づけて始める(PRDが今の流行の方法)、誰かがどれだけ気にするかのフロンティアを押し出す(これがTDDエージェントの方法)、曲線を曲げてあまり飛び出さないようにする(これが同僚の方法)。残念ながら、私は一人でやってるから、私が先に進んでいて、これを説明するためのモデルがあることには報酬がないんだ。だって、良いソフトウェアを作るのは難しいから… SFのイベントでこれを説明したことがあって(たぶん40〜50回くらい)、これを読んでる人の中には私から聞いたことがある人もいるかも… もしそうなら、こんにちは、もう一度ここにあるよ。

このスピードランは、コンテキストウィンドウで壁にぶつかる。プロジェクトが20万トークンに収まる限りは順調だけど、それを超えると生産性は20%下がるどころか、ゼロになる。エージェントに他のファイルで何を変えたかを説明するのに何時間もかかるようになる。大規模な組織が長期的に勝つのは、単一の脳、たとえ電子のものであっても、その記憶に依存しないプロセスに頼っているからだ。

ちょっとした反論だけど、新しいモデルやエージェントフレームワークを試すときは、古いオープンソースのGitリポジトリをコピーして、昔のプロジェクトや実験をやってる。で、新しいインフラが古いコードのリファクタリングやクリーンアップにどれだけ効果的かを見てるんだ。テストの後は古いプロジェクトを更新して、家の春掃除をしたときみたいな温かい気持ちになるよ。ゼロからグリーンフィールドのコードベースを作るのも好きだな。

ここでエンジニアリングのプラクティスが役立つんだ。私のチームの1.5年のデータに基づくと、成熟したシステム(約9年のコードベース)で約30%のパフォーマンス向上が見られるよ。面白いのは、LLMはレバレッジで、エンジニアが優れれば優れるほどLLMからの恩恵が大きくなるってこと。

1980年代中頃に書かれていたらこうなってたかもって少し編集してみたよ。「本当の飛躍は、トップダウンの[デスクトップPC]戦略からではなく、従業員によって有機的に生まれている。実際の生産性向上は、小さなチームがプロセスのために[Lotus 123]を使ったワークフローを構築しようと決めたところに見られる。彼らはそのプロセスを熟知しているから、すごく良い結果が出せるんだ。逆に、[メインフレーム]のソフトウェアエンジニアリングチームは、そのプロセスを自動化するのに全く経験がないからね。」埋め込まれた「パワーユーザー」が道を示し、その後にCIO向けのパッケージソフトがずっと後に続くんだ。

力は尾にある。

数年前、会議に参加してとても興味深い講演を聞いたことがある。講演のタイトルは覚えていないけど、印象に残ったのは「もはや大きいものが小さいものを打ち負かすのではなく、速いものが遅いものを打ち負かす」ということだった。この講演はAIの盛り上がりの前だったけど、大企業で働いている私としては、これが今まで以上に真実だと思う。問題は、どうやって速さを保つかだね。

それに加えて、いつスピードを落とすべきかも大事だよね。大企業で働いた経験から言うと、「セキュリティやコンプライアンスを損なわずにどうやって早くなるか」っていう質問にシフトすると思う。

これは一般的なスタートアップのアドバイスだね(真実じゃないってわけじゃないけど)。遅い方が早いっていう例を見つけると、少しレベルアップするよね(例:Teams vs Slack)。

2種類のユーザーがいると思う。* ツールとして使っていて、その限界を理解し、基本的にはインターンや退屈なタスクの実行者として扱っている人(コードの雛形を作ったり、企業のメールを短縮したりする場合)、または自分が深く掘り下げるためのトピックの要約を得るためのツールとして使っている人。* 考えることやスキル全体をアウトソーシングしている人 - 彼らはそのトピックについてほとんど理解していなくて、結果だけに興味があって、トピックについてもっと知りたいとかスキルを磨きたいとは思っていない。この2番目のグループは、チャットボットと話すことで上級開発者が置き換えられると思っている人たちだね。

同じ人がトピックや時間帯によって、両方のタイプのユーザーになることもあるよね。

会社が考えるエンジニアを求めていない、またはそれを負担できないってはっきり言ったから、仕事で考えることをアウトソーシングし始めたんだ。考えるには時間がかかるし、彼らは早く届けたいからね。だから、PMが設定した現実的な締切に合わせて動いてるんだよね。面白いことに、顧客によると機能はすぐに実装しなきゃいけないけど、顧客のフィードバックは、納品から6ヶ月後に新機能を使い始めるから、6ヶ月もかかる。もう気にしなくなったよ。学ぶ部分は休みの時にやるけど、業界全体に疲れてきたから、最低限の努力で請求書を払うだけ。だから、仕事で考えることをアウトソーシングしてるって感じだね。

考えることやスキル全体をアウトソーシングしている人 - 彼らはそのトピックについてほとんど理解していなくて、結果だけに興味があって、トピックについてもっと知りたいとかスキルを磨きたいとは思っていない それが特定のケースでは問題ないこともあるよね。僕はドイツ語を学んでいて、リスニングの理解力は微妙なんだ。練習テストを受けたら、15〜30秒の音声を聞いてから質問に答えるっていうのがあった。ひどい結果だったけど、練習には良さそうだった。Claude Codeを使って、短い音声(ElevenLabs経由)ダイアログと質問のセットを生成する小さなアプリを作ったんだ。結果をドイツ語の先生に見せたら、彼は感心してた。限界は理解してるよ:音声がイマイチなこともあるし(電話番号を間違えることが多い)、ドイツ語を学ぶための作業の一部にしかならないとかね。重要なのは、僕がコーディングできたけど、もっと重要なプロジェクトがあるってこと。コードについて学べなかったことは気にしてない。気にしてるのは、ドイツ語が上達してることなんだ。

第二のグループは、チャットボットと話すことでシニア開発者が置き換わると思ってるんだよね。一方、最初のグループは、これらのツールが開発者チーム全体を置き換えることができると考えてる。

まあ、あなたの分類の中で第二のグループはあまり真剣じゃないよね。AIツールを使って楽しむのは全然いいと思うし、その周りには数十億ドル規模のエンタメ産業ができるだろうね。私の経験から言うと、このグループに属していて、真剣なビジネスの決定をこういう方法でやろうとしてた人たちは、現実を見始めてる。私の視点では、違いは供給側にあって、AIツールには二つの世代がある。最初の世代は、ウェブUIでチャットボットと話すだけで、今でも使い道はある。チャットしながら文脈を作っていく感じで、トレーニングデータにかなり依存してる。多分、一つのファイルを読んでるだけ。第二の世代はRAGやエージェント機能に寄ってる(もし検索ができるなら、おめでとう、あなたはRAG戦略のv1を持ってる)。ここでGeminiは、私たちのGoogle Workspace内のドキュメントをスキャンして、以前書いた提案書に似たものを作成する。もうドキュメントテンプレートは必要ないのかな?新しいプログラミングプロジェクトを始めると、Claudeがすべてのボイラープレートを書いて、数分でベアボーンのテストスイートをセットアップしてくれる。こういうツールは新しい能力を与えてくれるし、場合によってはchatgpt.comにただおしゃべりするよりもずっと時間を節約できる。これが、まともなユーザーによる生産性の報告に大きな違いをもたらしてると思う。私は「第2世代」のアプリケーションを発見する前は、AIの生産性向上にはあまり熱心じゃなかった。

他の「ただのツール」じゃない代替案: * 検索エンジンの代わりに使う人たち。 * 医者やセラピスト、信頼できる相手として使う人たち。リサーチのためじゃなくて、実践者として。 他にも: * マンページやドキュメントの代わりに使う人たち。 * よく理解していないけど「なんとなく」短いスクリプトを書くために使う人たち。

第二のグループは、予算を持ち、5年計画を立てるような経営の意思決定者が多い。彼らを過小評価したり、嘲笑したりしないで。結局、私たち全員にとって不利益になるから。

一つ見落としてると思うよ。開発者が全体のシステムを作り上げて、出力についても理解しているっていうユーザーがいるんだ。開発者はアーキテクチャやコードの質、機能の質なんかをコントロールしてる。こういう人たちはまだまだ珍しいけど、実際に見たことがあるよ。彼らは新しい10倍の開発者だね。

これはシャドウAIの誕生で、2000年代のシャドウITよりも大きくなるだろうね。当時は、従業員が仕事を早く終わらせるためにExcelマクロやDropboxをこっそりインストールしてた。今は、公式のCopilotがCSVをちゃんと作れないから、ターミナルでClaude Codeを静かに動かしてる。CISOたちは今、恐れてるし、それは理解できる。ルートアクセスを持つ非技術者とコードを書くエージェントはセキュリティの悪夢だ。でも、これを完全に禁止しようとすると、最も効果的な従業員が「飛べる」場所に移ってしまうだけだよ。

本当の分かれ目は技術的か非技術的かじゃなくて、新しい問題を抱えてる人たちと古い解決策を維持してる人たちの違いだよ。AIは何でも初稿を生成するのが得意だけど、既存のものがなぜそうなっているのかを理解するのは苦手だね。

これは合理的に思えるけど、結論は私たちがすでに知っていることを言ってるんじゃないかな。このツールは本当に強力だけど、大きな痛みを引き起こす可能性があるから、組織が適応する必要があるんだ。それによって最大限に活用できるようになるけど、これはセキュリティの問題が多い。AIは技術的な問題に見えるけど、実際にはほとんどの小規模ビジネスにとっては調達と変更管理の問題だよね。それと(著者のメッセージには感謝だけど…)「ファイナンス側のExcelは、Pythonのような完全なプログラミングエコシステムの力に慣れてくると、かなり制約がある」っていうのもある。ラムダを追加すれば、Excelの数式はチューリング完全になるから、(ほぼ)関数型環境ではVBAはもう必要ないよ。この点についても、Excel用のClaudeはかなり改善が必要だし、金融モデルを扱うツールはどれも同じだね。もし本気で使ったことがあるなら、非技術的なファイナンスマネージャーと一緒に使うのはしばらく無理だと思うよ…。