クロードのスキルは素晴らしい、もしかしたらMCPよりも重要かもしれない

2025年10月18日原文(simonwillison.net)

概要

Anthropicが新機能「Claude Skills」を発表。 SkillsはMarkdownファイルとスクリプトで構成され、モデルのタスク遂行力を強化。必要時のみSkillを読み込み、トークン効率も高い設計。従来のMCPやCLIツールよりシンプルかつ柔軟な拡張方式。共有・再利用性が高く、他モデルでも利用可能。

Claude Skillsとは何か

Anthropic が2025年10月に発表した Claude Skills は、AIモデルに新たな能力を追加する仕組み
Skillは フォルダ単位 で管理され、内部には Markdown形式の説明書き、スクリプト、リソース が格納
Claudeは 必要な時だけ該当Skillをロード し、Excel操作やブランドガイドライン遵守など 特化タスク に強化
Skillの内容はGitHubの anthropic/skillsリポジトリ で公開、詳細はエンジニアリングブログに掲載

Skillsの構造と仕組み

Skill本体はMarkdownファイル （YAMLメタデータ付き）、必要に応じて 追加ドキュメントやスクリプト も同梱
セッション開始時、Claudeは すべてのSkillファイルをスキャン し、YAMLの説明文だけを短く読み込む
トークン消費は数十程度 で、詳細な内容は実際にSkillが使われる時のみロード
例： slack-gif-creator SkillはSlack用GIF作成ツール、サイズ検証やアニメーション生成プリミティブを提供

Skillの利用例：slack-gif-creator

設定で slack-gif-creator Skillを有効化 し、プロンプトでGIF作成を依頼
Claudeは Pythonスクリプトを生成・実行 し、GIFファイルを出力
ファイルサイズ検証関数で Slack用2MB制限 を自動チェック、超過時は再生成
スクリプト例では PILライブラリ やSkill内コアクラスを活用

Skillの前提：コーディング環境

Skill機能は ファイルシステムやコマンド実行環境 へのアクセスが必須
近年のLLMツールの標準パターン（ChatGPT Code Interpreter、Cursor、Claude Code、Codex CLI、Gemini CLI）
MCPやChatGPT Plugins とは異なり、Skillはコーディング環境依存
安全なサンドボックス設計 が今後の課題、プロンプトインジェクション対策も重要

Claude Codeの汎用エージェント化

Claude Codeは 単なるコーディングツールではなく、汎用自動化エージェント
任意のコマンド操作を自動化可能、Skillによる機能追加で多用途化
例：データジャーナリズム向けSkillフォルダを作成し、 データ取得・加工・可視化・公開タスク を自動化
MarkdownファイルとPythonスクリプトだけで 専門的AIエージェント 構築が可能

SkillsとMCPの比較

MCP（Model Context Protocol） は2023年登場以来注目されたが、 トークン消費が多い のが課題
Skillは CLIツール同様の低トークン消費 で、Markdownファイルだけでタスク定義が可能
MCPはプロトコル仕様が複雑だが、Skillは 極めてシンプルな構造
CLIツールやSkill の方が実用的・簡便なケースが多い

Skillsの共有性と今後の展望

Skillは 単一ファイルやフォルダ単位で簡単に共有可能
Anthropic公式の Agent SkillsドキュメントやCookbook も整備
他のAIモデル（Codex CLI、Gemini CLIなど）でもSkillフォルダをそのまま利用可能
今後Skillの爆発的普及 が予想され、MCP以上の盛り上がりに

Skills設計の本質的魅力

Skillは 「シンプルさ」が最大の特徴、複雑なプロトコル不要
YAML付きMarkdownと実行可能スクリプトだけで 汎用的な拡張性 を実現
LLMの「テキストから推論」能力を最大限活用、 環境側に難しい部分を委譲
LLM×ツール連携の進化を踏まえた 合理的な戦略

Hackerたちの意見

MCPはターミナルを超えた影響力があるよね。ChatGPTやClaude Web、n8n、LibreChatとも使えるし、認証やリソース、最近ではUIの考慮も必要になってきた（例えば、OpenAIのapps-sdkがMCPにある）。もし主にコーディングワークフローやCLIベースのエージェント、例えばClaude Codeを考えるなら、CLIツールがかなりの価値を提供できるのは確か。でも、CRMや営業、サポート、オペレーション、ファイナンスなど、他の役割に広がると、MCPベースのツールの方がいい形になると思う。スキルはMCPと密接に関連していて、競争ではなくてそれぞれ目的が違うんだよね。Pythonコードがスキルから直接MCPを呼び出せるようになると、すごく便利になると思う…それが大きな解放だよね（実際に試してみて、すごくうまくいったことがある）。

└

そうだね、MCPの最大の利点は、フル機能のサンドボックスLinux環境がなくても動くところだよ。MCPは、能力が低いモデルでも動くし、ノートパソコン（あるいはスマホ）で快適に動くモデルから1つか2つのMCPを動かせる。そんなモデルにファイルを読み込ませて、curlリクエストを成功させるのはちょっと信じられないな！

└

LLMを他のソフトウェアや物理的な世界と統合できるのはかなりクールだし、すべて自然言語で動いてるんだよね。今やLLMがMCPサーバーを生成できる段階に来てるから、完全に新しい機能を簡単に作り出せるようになってる。

MCPは過大評価されていて、価値は限られていると思う。MCPサーバーの95%は役に立たなくて、シンプルなツールコールで代替できるよ。

└

そうだね、MCPはプロバイダーを信頼している限りだけ機能する。MCPはサーバーの誠実さに依存してる。実際には、UberなんかがLLMに対して「これが最適なサービスだ！」って説得するためにプロンプトエンジニアリングをめちゃくちゃやるのは知ってる。MCPの発行者と消費者の間には根本的なインセンティブの不一致があるんだよね。

└

MCPサーバーにはいくつかの価値があると思う： - 複雑なやり取りをカバーするバンドルされた指示（「ここで検索したIDを使ってレコードを取得する」） - インターネットからファイアウォールされたカスタムMCP、ビジネスAPI用で、どのモデルも知らないもの - 中央集権的なMCPサービス、HTTP/SSEトランスポート。チーム全体に1つのエンドポイント（つまりウェブ検索）を提供して、チームの公式AIツールを管理できるし、APIキーの拡散も防げる。今、ウェブ上にある「任意のフォルダ内のファイルをリスト表示する」MCPみたいな、トリビアルなnpx ls-mcpスタンダード入出力のやつは、完全に文脈を詰め込むだけのクソだと思う。

└

フロントエンド開発をしている私のチームは、Figma MCPからたくさんの価値を引き出しました。3週間かかるはずのことが、1日の午後で終わっちゃったんです。

└

これはすごく明白なことですが、良いMCPサーバーは本当に良いし、悪いMCPサーバーは逆に状況を悪化させることがあります。問題は、ほとんどのMCPサーバーが後者のカテゴリーに入ることです。よくあることですが、どのプロダクトチームもMCPが新しいホットなものだと言われて、顧客のためにMCPサーバーを作らなきゃいけないと言われます。実際、顧客はこういうものを求めているのを見てきました。みんなAIをもっと活用しようとしていますからね。顧客は自分が何を求めているのか分からないけど、AIであるべきだと思っています。プロダクトチームはAIが必要だと分かっているけど、それを製品にどう取り入れるかの具体的な方法が見えない。でも、MCPが「私たちはAI製品です」と言うための簡単な方法として降りかかってくるんです。実際にAI製品になることなく。

スキルが詰まったフォルダを想像してみて。タスクにはこんなのが含まれる： > アメリカの国勢調査データをどこで取得し、その構造を理解する方法。初めてWolfram Alphaを使ったときのことを思い出すよ。普通の検索エンジンと比べて、実際の構造化ツールを使って問題を解決する能力に驚かされた。実際、今もう一度試してみたけど、やっぱりすごいね：https://www.wolframalpha.com/input?i=what%27s+the+total+popu... スキルのメンタルモデルは、カスタム拡張を持つWolfram Alphaみたいになると思う。

└

正直言って、Wolfram Alphaは今までで最もクレイジーなものだった。昔、これがどう実装されたのかあまり調べてないけど、AIなしであれだけ複雑な数学の問題を解決したのは本当にすごいことだよ。

└

あなたのリンクをクリックしたら、私の方ではWolfram Alphaで次のクエリが開いたよ: what%27s the total population of the United States%3F 面白いことに、結果はこうだった: 6.1% mod 3 °F (degrees Fahrenheit) (2015-2019 American Community Survey 5-year estimates) これがどうやって計算されたのか気になるな…

これはかなりネガティブなコメントだけど、他の人も同じように感じてるか知りたくて書いてみた。もしこのサービスの中間ユーザーにこれを設定させたら、正しく「頭が2つあるのか？」って見られると思う。人々はアカウントにログインして、何かをやるように指示して、システムが残りを解決するのを望んでる。MCP、アプリ、スキル、ジェム…これらはすべて間違った問題に取り組んでいるように見える。6ヶ月ごとに「この新しいプログラミング言語、フレームワーク、データベースがキラーだ」と言うYouTubeチャンネルを思い出す。彼らは何かのTODOアプリを作って、その後同じビデオを新しい言語で投稿して、すでに6回やったことを完全に忘れてる。表面的な反復はたくさんあるけど、深い問題は解決されていない。技術のどこかで何かが非常に間違っていて、お金を持った人たちがフィールドに流れ込むと、こんな発表が出てくる。次のリリースを押し出して、プロモをもらって、次の新しいテクノロジー企業に飛びついて、何も残さずに去っていく。

Hacker Newsで議論の続きを見る

ハクソク