世界を動かす技術を、日本語で。

クロードのスキルは素晴らしい、もしかしたらMCPよりも重要かもしれない

概要

Anthropicが新機能「Claude Skills」を発表。 SkillsはMarkdownファイルとスクリプトで構成され、モデルのタスク遂行力を強化。 必要時のみSkillを読み込み、トークン効率も高い設計。 従来のMCPやCLIツールよりシンプルかつ柔軟な拡張方式。 共有・再利用性が高く、他モデルでも利用可能。

Claude Skillsとは何か

  • Anthropic が2025年10月に発表した Claude Skills は、AIモデルに新たな能力を追加する仕組み
  • Skillは フォルダ単位 で管理され、内部には Markdown形式の説明書き、スクリプト、リソース が格納
  • Claudeは 必要な時だけ該当Skillをロード し、Excel操作やブランドガイドライン遵守など 特化タスク に強化
  • Skillの内容はGitHubの anthropic/skillsリポジトリ で公開、詳細はエンジニアリングブログに掲載

Skillsの構造と仕組み

  • Skill本体はMarkdownファイル (YAMLメタデータ付き)、必要に応じて 追加ドキュメントやスクリプト も同梱
  • セッション開始時、Claudeは すべてのSkillファイルをスキャン し、YAMLの説明文だけを短く読み込む
  • トークン消費は数十程度 で、詳細な内容は実際にSkillが使われる時のみロード
  • 例: slack-gif-creator SkillはSlack用GIF作成ツール、サイズ検証やアニメーション生成プリミティブを提供

Skillの利用例:slack-gif-creator

  • 設定で slack-gif-creator Skillを有効化 し、プロンプトでGIF作成を依頼
  • Claudeは Pythonスクリプトを生成・実行 し、GIFファイルを出力
  • ファイルサイズ検証関数で Slack用2MB制限 を自動チェック、超過時は再生成
  • スクリプト例では PILライブラリ やSkill内コアクラスを活用

Skillの前提:コーディング環境

  • Skill機能は ファイルシステムやコマンド実行環境 へのアクセスが必須
  • 近年のLLMツールの標準パターン(ChatGPT Code Interpreter、Cursor、Claude Code、Codex CLI、Gemini CLI)
  • MCPやChatGPT Plugins とは異なり、Skillはコーディング環境依存
  • 安全なサンドボックス設計 が今後の課題、プロンプトインジェクション対策も重要

Claude Codeの汎用エージェント化

  • Claude Codeは 単なるコーディングツールではなく、汎用自動化エージェント
  • 任意のコマンド操作を自動化可能、Skillによる機能追加で多用途化
  • 例:データジャーナリズム向けSkillフォルダを作成し、 データ取得・加工・可視化・公開タスク を自動化
  • MarkdownファイルとPythonスクリプトだけで 専門的AIエージェント 構築が可能

SkillsとMCPの比較

  • MCP(Model Context Protocol) は2023年登場以来注目されたが、 トークン消費が多い のが課題
  • Skillは CLIツール同様の低トークン消費 で、Markdownファイルだけでタスク定義が可能
  • MCPはプロトコル仕様が複雑だが、Skillは 極めてシンプルな構造
  • CLIツールやSkill の方が実用的・簡便なケースが多い

Skillsの共有性と今後の展望

  • Skillは 単一ファイルやフォルダ単位で簡単に共有可能
  • Anthropic公式の Agent SkillsドキュメントやCookbook も整備
  • 他のAIモデル(Codex CLI、Gemini CLIなど)でもSkillフォルダをそのまま利用可能
  • 今後Skillの爆発的普及 が予想され、MCP以上の盛り上がりに

Skills設計の本質的魅力

  • Skillは 「シンプルさ」が最大の特徴、複雑なプロトコル不要
  • YAML付きMarkdownと実行可能スクリプトだけで 汎用的な拡張性 を実現
  • LLMの「テキストから推論」能力を最大限活用、 環境側に難しい部分を委譲
  • LLM×ツール連携の進化を踏まえた 合理的な戦略

Hackerたちの意見

MCPはターミナルを超えた影響力があるよね。ChatGPTやClaude Web、n8n、LibreChatとも使えるし、認証やリソース、最近ではUIの考慮も必要になってきた(例えば、OpenAIのapps-sdkがMCPにある)。もし主にコーディングワークフローやCLIベースのエージェント、例えばClaude Codeを考えるなら、CLIツールがかなりの価値を提供できるのは確か。でも、CRMや営業、サポート、オペレーション、ファイナンスなど、他の役割に広がると、MCPベースのツールの方がいい形になると思う。スキルはMCPと密接に関連していて、競争ではなくてそれぞれ目的が違うんだよね。Pythonコードがスキルから直接MCPを呼び出せるようになると、すごく便利になると思う…それが大きな解放だよね(実際に試してみて、すごくうまくいったことがある)。

そうだね、MCPの最大の利点は、フル機能のサンドボックスLinux環境がなくても動くところだよ。MCPは、能力が低いモデルでも動くし、ノートパソコン(あるいはスマホ)で快適に動くモデルから1つか2つのMCPを動かせる。そんなモデルにファイルを読み込ませて、curlリクエストを成功させるのはちょっと信じられないな!

LLMを他のソフトウェアや物理的な世界と統合できるのはかなりクールだし、すべて自然言語で動いてるんだよね。今やLLMがMCPサーバーを生成できる段階に来てるから、完全に新しい機能を簡単に作り出せるようになってる。

MCPは過大評価されていて、価値は限られていると思う。MCPサーバーの95%は役に立たなくて、シンプルなツールコールで代替できるよ。

そうだね、MCPはプロバイダーを信頼している限りだけ機能する。MCPはサーバーの誠実さに依存してる。実際には、UberなんかがLLMに対して「これが最適なサービスだ!」って説得するためにプロンプトエンジニアリングをめちゃくちゃやるのは知ってる。MCPの発行者と消費者の間には根本的なインセンティブの不一致があるんだよね。

MCPサーバーにはいくつかの価値があると思う: - 複雑なやり取りをカバーするバンドルされた指示(「ここで検索したIDを使ってレコードを取得する」) - インターネットからファイアウォールされたカスタムMCP、ビジネスAPI用で、どのモデルも知らないもの - 中央集権的なMCPサービス、HTTP/SSEトランスポート。チーム全体に1つのエンドポイント(つまりウェブ検索)を提供して、チームの公式AIツールを管理できるし、APIキーの拡散も防げる。今、ウェブ上にある「任意のフォルダ内のファイルをリスト表示する」MCPみたいな、トリビアルなnpx ls-mcpスタンダード入出力のやつは、完全に文脈を詰め込むだけのクソだと思う。

フロントエンド開発をしている私のチームは、Figma MCPからたくさんの価値を引き出しました。3週間かかるはずのことが、1日の午後で終わっちゃったんです。

これはすごく明白なことですが、良いMCPサーバーは本当に良いし、悪いMCPサーバーは逆に状況を悪化させることがあります。問題は、ほとんどのMCPサーバーが後者のカテゴリーに入ることです。よくあることですが、どのプロダクトチームもMCPが新しいホットなものだと言われて、顧客のためにMCPサーバーを作らなきゃいけないと言われます。実際、顧客はこういうものを求めているのを見てきました。みんなAIをもっと活用しようとしていますからね。顧客は自分が何を求めているのか分からないけど、AIであるべきだと思っています。プロダクトチームはAIが必要だと分かっているけど、それを製品にどう取り入れるかの具体的な方法が見えない。でも、MCPが「私たちはAI製品です」と言うための簡単な方法として降りかかってくるんです。実際にAI製品になることなく。

スキルが詰まったフォルダを想像してみて。タスクにはこんなのが含まれる: > アメリカの国勢調査データをどこで取得し、その構造を理解する方法。初めてWolfram Alphaを使ったときのことを思い出すよ。普通の検索エンジンと比べて、実際の構造化ツールを使って問題を解決する能力に驚かされた。実際、今もう一度試してみたけど、やっぱりすごいね:https://www.wolframalpha.com/input?i=what%27s+the+total+popu... スキルのメンタルモデルは、カスタム拡張を持つWolfram Alphaみたいになると思う。

正直言って、Wolfram Alphaは今までで最もクレイジーなものだった。昔、これがどう実装されたのかあまり調べてないけど、AIなしであれだけ複雑な数学の問題を解決したのは本当にすごいことだよ。

あなたのリンクをクリックしたら、私の方ではWolfram Alphaで次のクエリが開いたよ: what%27s the total population of the United States%3F 面白いことに、結果はこうだった: 6.1% mod 3 °F (degrees Fahrenheit) (2015-2019 American Community Survey 5-year estimates) これがどうやって計算されたのか気になるな…

これはかなりネガティブなコメントだけど、他の人も同じように感じてるか知りたくて書いてみた。もしこのサービスの中間ユーザーにこれを設定させたら、正しく「頭が2つあるのか?」って見られると思う。人々はアカウントにログインして、何かをやるように指示して、システムが残りを解決するのを望んでる。MCP、アプリ、スキル、ジェム…これらはすべて間違った問題に取り組んでいるように見える。6ヶ月ごとに「この新しいプログラミング言語、フレームワーク、データベースがキラーだ」と言うYouTubeチャンネルを思い出す。彼らは何かのTODOアプリを作って、その後同じビデオを新しい言語で投稿して、すでに6回やったことを完全に忘れてる。表面的な反復はたくさんあるけど、深い問題は解決されていない。技術のどこかで何かが非常に間違っていて、お金を持った人たちがフィールドに流れ込むと、こんな発表が出てくる。次のリリースを押し出して、プロモをもらって、次の新しいテクノロジー企業に飛びついて、何も残さずに去っていく。

それが本当なら、なぜリーダーシップやVC、さらには買収する会社や公開市場がそれに引っかかり続けるんでしょうね?古いことわざにあるように、「プレイヤーを憎むな、ゲームを憎め」ってやつですか?実際に言うと、これは中央値のユーザー向けじゃないんです。これは1%のユーザーが中央値のユーザーに売るための便利なツールをセットアップするためのものです。

人々はアカウントにログインして、何かをやってくれと言って、システムが残りを解決するのを望んでいます。消費者にとってはそうですね。B2Bのシナリオでは、もっと複雑なのが普通です。

まだ始まったばかりで、何がうまくいくか分からないですね。表面的かもしれませんが、今のところ最先端です。

でも深い問題は解決されていない そもそも解決すべき問題がないんです。最近では、解決策は解決しようとしている問題を含むパッケージとして提供されます。パッケージを開けると、今度はパッケージから飛び出してきた問題が目の前に現れます。解決策がパッケージから出てきて、その問題を追いかけ回すんです。これであなたは技術的に進化した人間になったわけです。

MCP、アプリ、スキル、ジェム - これらはすべて間違った問題に取り組んでいるように見えます。私のかなりネガティブな見解は、私たちがもっとドキュメントを書いたり、APIを作ったりして、AIを機能させるためにたくさんの作業をしているということです。それは最初から人々のためにやっていたら同じ結果が得られたはずです。私の人生の半分は、そういうものがない複雑なシステムの問題をデバッグするのに費やされてきました。

彼らは何かのTodoアプリを作って、その後、まったく新しい言語で同じ動画を投稿するんだけど、もうこれを6回もやってるのを忘れてるみたい。これが悪いとは思えないんだよね。テクノロジーは時間とともに繰り返し、少しずつ改善していくものだから。明日、誰かが「すごい新しいフロントエンドフレームワークがある!」って動画を出すかもしれないけど、それはNext.jsやReact、Angular、jQuery、PHP、HTMLについての動画と全く同じかもしれない。 >テクノロジーのどこかで何かが非常に間違ってしまった。お金を持った人たちがこの分野に押し寄せると、こういう発表が出てくる。もしAIに巨額のお金が注がれていなかったら、私たちはGPT-3やClaude 2のままだっただろうね。確かに、ツールの分野ではいくつかの失敗作も出てるけど(でも、スキルは実際に良いと思う)、君が言ったような体系的な腐敗の診断には値しないと思う。

そうだね、みんなこれを基にアプリケーションを作るべきだよ。

何を言いたいのかよくわからないな。「本当の問題」って何?アプリ開発をもっと生産的にするために、彼らはmcpサーバーやスキル、カスタムプロンプトなどで実際の問題を解決してるんだよ。問題は、文脈の希薄化、ツールの使い方、LLMモデルの外での認識だよ。

「深い問題」って何?2023年、ChatGPTが主流になる前に、こういう「深い問題」にどのくらいの頻度で取り組んでいたの?

私は同じ意見じゃないな。これ、使いやすそうで役に立ちそうだよ。すべての問題が「深い問題」である必要はないと思う。人々はアカウントにログインして、何かをやらせるだけで、システムが残りを解決してくれるのが求められてるんだよね。一見すると、私が普段やることに基づいてパーソナライズされたプロンプトスタックを構築するための実用的なアプローチに見える。ワクワクしてるよ。

MCPサーバーが公開できるリソースやプロンプトとの比較が本当に混乱しています。それを使っている人はいないのは分かりますが、これってただの再hashじゃないですか? https://modelcontextprotocol.io/specification/2025-06-18/ser... https://modelcontextprotocol.io/specification/2025-06-18/ser...

スキルはMCPリソースやプロンプトよりも理解しやすくて実装もしやすいよね。

ここでの大きな話は、みんながMCPに超集中して、道に依存してしまったことだと思う。実際に面白いのは「ツールコール」なんだよ。ツールコールは本当に興味深くて役立つ。MCPはその目的のための一つの手段に過ぎないし、あまり良い手段ではないと思う。

MCPの大きな普及は主にタイミングによるものだと思う。ツールコールはMCPの前からあったけど、モデルはあまり上手くできてなかった。MCPは、モデルがツールコールに十分に良くなったタイミングとほぼ一致している。だから、そうだね、MCPの興奮の大部分は、LLMがツールを呼び出して他のシステムとやり取りできることを学んだ人たちによるものだと思う。

10時間前に投稿したコメントを再投稿するね。今MCPを調べている者として、これらの分野での経験がある人たちの意見を聞きたいな。私の第一印象は、MCPにはいくつかの利点があるってこと。- 長い間存在していて、勢いがある - 効果的になるためにコンピュータに開発環境が必要ない - ベンダー間のサポートがある - 複雑なユースケースに対する洗練さ(OAuthサポートのおかげで企業の権限を重ねることができる) - 複数のトランスポートレイヤーが柔軟性を与える スキルにももちろん利点があると思う。- シンプル - 繰り返しやすい - 文脈の使用が少ない 他のベンダーがスキルに従って進んで、すべてのコンピュータが開発環境にアクセスできるようになれば、スキルが勝つかもしれない。HTMLはXMLに勝ち、RESTはSOAPに勝ったから、シンプルなものがしばしば勝つんだよね。でも、MCPの最大の欠点である文脈ウィンドウの過剰使用は、主エージェントを使ってやり取りするMCP特有のサブエージェントを持つことで改善できると思う。

そうそう、MCPの利点についてはその通りだと思うよ。特に、MCPは完全にサンドボックス化されたLinux環境にアクセスする必要がないのがいいよね!自分の製品の一つにはMCPを使って広いエコシステムと連携させる予定だけど、エンドユーザーとしては引き続きClaude Codeをメインで使うつもりだよ。

ツール呼び出しが原始的じゃない理由がわからないな。「スキル」はエージェントが自分の計算空間で構築して実行できるツールであってもよかったはずだよ。なんでRCPの形が二つも必要なのか全然理解できない。

これらは全然違うものだよ。MCPは外部サービスを使ってoauthとかを扱うことも含まれてるし。スキルは実質的にはCLIツールとプロンプトの組み合わせ。全く異なるアプリケーションだから、そんな簡単には比較できないよ。ちなみに、MCPが登場する前に、私たちはSkillsetっていう独自のシステムを考案したんだ。今ではそれがMCPとスキルのいいとこ取りみたいになってるね。

MCPとスキルは異なる二つの問題を解決していて、お互いにうまく補完し合ってるように思う。MCPは外部システムやサービスの統合に関するもので、スキルはコンテキスト管理、つまり必要に応じてコンテキストを提供することに関するものだよ。サイモンが言ってるように、MCPの一つの問題はトークンの使用なんだ。スキルはその問題を管理するシンプルな方法に見えるね: 必要になるまでトークンを使わないスキルの中にMCPツールリストを入れればいいんだ。