世界を動かす技術を、日本語で。

アマゾンの従業員がAIツールの使用圧力により「トークンマキシング」を行っている

2026年5月13日原文(arstechnica.com)

概要

  • Amazonのe-commerce部門でAI利用統計の公開範囲が制限
  • Meta社員による「tokenmaxxing」現象も発生
  • MeshClawはOpenClawに触発されて開発
  • MeshClawは多様な業務自動化が可能
  • セキュリティリスクに対する社員の懸念

Amazon社内AI利用統計と制限

  • Amazonのe-commerce部門 では、スタッフによる AI利用統計 をチーム全体で共有していたが、最近では 本人とマネージャーのみ閲覧可能 に制限
  • マネージャー によるトークン使用量を 業績評価の指標に使うことは推奨されていない との内部関係者の証言
  • Meta社員 も内部リーダーボードでの順位向上を狙い、 「tokenmaxxing」 と呼ばれる現象に参加

MeshClawツールの特徴と背景

  • 一部社員が MeshClaw というツールを利用し、AI利用統計の向上を図る動き
    • MeshClawは OpenClaw から着想を得て開発
    • OpenClawは2024年2月にバイラル化したプロジェクトで、 ユーザー自身のPCやラップトップ上でエージェントを動作 させることが可能
  • AmazonのMeshClaw は以下の機能を持つ
    • コードデプロイの実行
    • メールのトリアージ
    • Slackなどのアプリとの連携
  • Amazonの声明によると、「 数千人のAmazoniansが日々の反復作業を自動化 している」とし、チームのAI実験・導入推進の一例と位置付け

MeshClaw開発体制と機能

  • 社内文書 によれば、MeshClawの開発には 36人以上のAmazon社員が参加
  • 内部メモでは以下のように記載
    • 夜間に学習内容を統合し、会議中もデプロイを監視、朝にはメールを整理

セキュリティリスクと社員の懸念

  • 複数のAmazon社員が ユーザー代理で動作するAIツールのセキュリティリスク に懸念
    • エージェントが 誤動作や意図しない行動を起こすリスク
    • デフォルトのセキュリティ設定が非常に不安」との声
    • 自由に動作させるのは危険」という慎重な意見

まとめ

  • Amazonおよび他社での AI活用推進業務効率化
  • 一方で、 セキュリティや評価指標のあり方 への課題が浮上

Hackerたちの意見

最近これについて考えてたんだけど、AIを低コンテキストで動かすことが多いんだ。ドキュメントには高コンテキストの使用は劣化するって書いてあるからね。でもLinkedInには、コンテキストをバックアップしたり、失いたくないって言ってる人がたくさんいる。これってシステムの使い方を間違ってる気がする。高コンテキストの使用はトークンも多く使うし、密度のある詳細なコンテキストよりも悪い(遅い)出力になると思うんだ。

すぐに曖昧になる二つの動機があると思う。a) 特定のコンテキストがうまく機能するのを見つけて、その一部を保存したり、説明を繰り返さなくて済むようにしたい b) セッションを続けて、最初からコンテキストを再構築しなくて済むようにしたい。Aはプロンプトライブラリや特定のエージェントファイルの一部として保存するのが合理的だと思う。Bは長期間続けると問題が起きやすいけど、比喩的なオレンジから最後の一滴を絞り出すのには役立つかも。私がやってしまったアンチパターンは、異なるタスクや役割のために異なる復元コンテキストを切り替えること。そうなると、必要ならもっと耐久性のあるドキュメントに変換するか、「全体のコンテキストを復元する」以上に特定のキュレーションをするべきだと思う。

もっと擬人化すると、「でも最初からやり直したくない、このインスタンスはもう重要なことを全部知ってるから」って感じになるよね。もしすべてのやり取りが独立したクエリ/レスポンスとして扱われるなら、要らない部分を省いて自分の要約と組み合わせることで集中しやすくなるんだ。

数週間前にHNでこれについて冗談を言ったんだけど、もうここまで来ちゃったのが面白いね。グッドハートの法則が実際に働いてる。

マネジメントがAIの使用をトークンの使用で測ることにサインしたってことは、彼らがどれだけ無能かを示してるよね。アマゾンみたいな技術系の会社でもね。トークンマキシングは予想通りの合理的な反応だった。要するに、従業員をバカな方法で測れば、バカな行動が返ってくるってことだよ。

マネジメントは数字が好きだよね。X > Yで客観的に比較できる唯一のものだから。きれいなグラフや推計、予測が作れるし、数字が特に正確じゃなくても関係ない。データ収集のステップが正当化できればそれでOK。数字を大きくすることが良いことなら、なおさらボーナスポイントだね(例えば、重大な問題の数を追跡するのとは対照的に)。

何をインセンティブにしようとしているかによるね。パフォーマンスを測るのではなく、単にトークン消費を増やしてバブルとハイプを育てようとしている可能性もある。さらに、プレッシャーを感じた従業員がAIの新しいユニークな使い方を見つけるかもしれない。インフレが目標なら、たくさんのお金を配って、使われさえすれば目標達成って感じだね。

グッドハートの法則が実際に働いてるね。

これに賛成する意見も聞いたことがあるんだけど、経営陣はこれが副作用になることを知ってたけど、AIとできることを探るためにできるだけ人を巻き込むことが大事だと思ってるんだよね。結局、役に立つことを学べるかもしれないって期待して、意図的にお金を無駄にしてるってことだね。

今の仕事も全く同じことやってるよ。マネージャーがトークンの使用状況や関連メトリクスを示すツールを見せてくれた。

これがマット・ガーマン、究極のMBAだね。ボーナスは四半期ごとのトークンに結びついてるし、2026年にはエンジニアをコードの行数で測るのと同じことになる…だからAWSは何年も優秀なエンジニアを失ってるんだよね。残ってるのは、マクドネル合併後のボーイングみたいになってきてる…ドキュメントページの限られたスペースの4分の1を削除して、誰も求めてないAIの短いドキュメントを入れて、無効にできない。

最近、いろんなデータをいじってみたんだけど、全部をコンテキストに放り込んで、クロードにデータを分析させることもできるんだ。でも、トークンをたくさん消費しちゃう。データをディスクに保存して、クロードにデータを処理・分析するスクリプトを書かせる方が賢いよ。ずっと速いし、結果も良くなるし、トークンも節約できる。でも、アマゾンは最初のアプローチを好むんだろうね。

Hacker Newsで議論の続きを見る