原著者: モハメド・エルセイディ
原文翻訳: TechFlow
導入
昨日、SolanaのAI関連トークン「$Dark」がBinance Alphaでローンチされ、その時価総額は現在までに約4,000万ドルに達しています。
最新の暗号 AI の物語では、$Dark は「MCP」(モデル コンテキスト プロトコル) と密接に関連しており、これは Google などの Web2 テクノロジー企業が最近注目し、調査している分野でもあります。
しかし、現状では、MCP の概念と物語的影響を明確に説明できる論文は多くありません。
以下は、Alliance DAO 研究者 Mohamed ElSeidy による MCP プロトコルに関する詳細な記事です。 MCP の原理と位置づけを非常にわかりやすい言葉で説明しており、最新の情報を素早く理解するのに役立ちます。
TechFlow が記事全文をまとめました。
Alliance に在籍していた数年間、私は数え切れないほどの創業者が独自の専用ツールやデータ統合を構築し、それを AI エージェントやワークフローに組み込むのを見てきました。ただし、これらのアルゴリズム、形式化、および固有のデータセットはカスタム統合によってロックされており、ほとんど使用されません。
これは、モデルコンテキストプロトコル (MCP) の出現により急速に変化しています。 MCP は、アプリケーションが大規模言語モデル (LLM) と通信してコンテキストを提供する方法を標準化するオープン プロトコルとして定義されています。私が本当に気に入っている比喩は、「AI アプリケーションの場合、MCP はハードウェアにおける USB-C のようなものだ」というものです。標準化され、プラグアンドプレイで、汎用性が高く、変革的です。
MCP を選ぶ理由
大規模言語モデル (Claude、OpenAI、LLAMA など) は非常に強力ですが、現在アクセスできる情報によって制限されています。つまり、多くの場合、知識の限界があり、独立して Web を閲覧することはできず、何らかの統合がない限り、個人ファイルや特殊なツールに直接アクセスすることもできません。
特に、開発者はこれまで、LLM を外部データやツールに接続する際に、主に次の 3 つの課題に直面してきました。
統合の複雑さ: 各プラットフォーム (Claude、ChatGPT など) ごとに個別の統合を構築するには、作業の重複と複数のコード ベースの維持が必要になります。
ツールの断片化: 各ツールの機能 (ファイル アクセス、API 接続など) には、専用の統合コードと権限モデルが必要です。
配布の制限: 独自のツールは特定のプラットフォームに制限されているため、その範囲と影響は制限されます。
MCP は、あらゆる LLM が共通のプロトコルを通じて外部ツールやデータ ソースに安全にアクセスするための標準化された方法を提供することで、これらの問題を解決します。 MCP の機能について理解できたので、次は MCP を使用して何を構築しているかを見てみましょう。
MCP で何を構築しているのでしょうか?
MCP エコシステムは現在、イノベーションの爆発的な成長期にあります。以下は、Twitter で見つけた、開発者が自分の作品を披露している最近の例です。
AI 駆動型ストーリーボード: MCP 統合により、Claude は ChatGPT-4 を制御して、人間の介入なしにジブリ スタイルの完全なストーリーボードを自動的に生成できるようになります。
ElevenLabs 音声統合: シンプルなテキスト プロンプトを通じて、Claude と Cursor が AI オーディオ プラットフォーム全体にアクセスできるようにする MCP サーバー。この統合は、発信通話を行うことができる音声エージェントを作成できるほど強力です。これは、MCP が現在の AI ツールをオーディオ領域に拡張する方法を示しています。
Playwright によるブラウザ自動化: スクリーンショットやビジュアル モデルを必要とせずに AI エージェントが Web ブラウザを制御できるようにする MCP サーバー。これにより、LLM が標準化された方法でブラウザのインタラクションを直接制御できるようになり、Web 自動化の新たな可能性が生まれます。
個人用 WhatsApp 統合: 個人の WhatsApp アカウントに接続するサーバー。これにより、Claude はメッセージや連絡先を検索したり、新しいメッセージを送信したりできます。
Airbnb 検索ツール: MCP のシンプルさと、Web サービスと対話する便利なアプリケーションを作成する機能を示す Airbnb アパートメント検索ツール。
ロボット制御システム:ロボット用のMCPコントローラ。この例は、LLM と物理ハードウェア間のギャップを埋め、IoT アプリケーションとロボット工学における MCP の可能性を示しています。
Google マップとローカル検索: Claude を Google マップ データに接続して、コーヒー ショップなどの地元のビジネスを検索して推奨できるシステムを作成します。この拡張機能により、AI アシスタントは位置情報ベースのサービスを提供できるようになります。
ブロックチェーン統合: Lyra MCP プロジェクトは、StoryProtocol やその他の Web3 プラットフォームに MCP 機能をもたらします。これにより、ブロックチェーン データやスマート コントラクトとのやり取りが可能になり、AI によって強化された分散型アプリケーションの新たな可能性が開かれます。
これらの例で特に印象的なのは、その多様性です。 MCP がリリースされてからわずかの間に、開発者はクリエイティブ メディア制作、通信プラットフォーム、ハードウェア制御、位置情報サービス、ブロックチェーン テクノロジーを網羅した統合を実現しました。これらのさまざまなアプリケーションは同じ標準化されたプロトコルに従っており、MCP の汎用性と AI ツール統合の普遍的な標準になる可能性を示しています。
MCP サーバーの包括的なコレクションを確認したい場合は、GitHub の公式 MCP サーバー リポジトリにアクセスしてください。 MCP サーバーを使用する前に免責事項をよく読んで、実行および承認する内容に注意してください。
約束と誇大宣伝
他の新しいテクノロジーと同様に、次の質問をしてみる価値はあります。MCP は本当に変革をもたらすものなのでしょうか、それとも、最終的には衰退する、過大評価されたツールの 1 つに過ぎないのでしょうか。
多くのスタートアップを観察した結果、MCP は AI 開発における真の転換点となると私は信じています。革命を約束しながらも漸進的な変化しかもたらさない多くのトレンドとは異なり、MCP は、エコシステム全体を阻害するインフラストラクチャの問題を解決し、生産性を向上させます。
特別なのは、既存の AI モデルを置き換えたり競合したりするのではなく、必要な外部ツールやデータに接続することで、AI モデルをより便利なものにすることです。
それでも、安全性と標準化に関する正当な懸念は残ります。初期段階にあるあらゆるプロトコルと同様に、コミュニティが監査、権限、認証、およびサーバー検証に関するベストプラクティスを模索する中で、成長痛が見られる可能性があります。開発者は、これらの MCP サーバーの機能を信頼する必要があり、特にサーバーが普及するにつれて、盲目的に信頼するべきではありません。この記事では、ローカルで実行している場合でも、慎重にレビューされていない MCP サーバーを盲目的に使用することで明らかになった最近の脆弱性について説明します。
AIの未来は文脈化にある
最も強力な AI アプリケーションは、スタンドアロン モデルではなく、MCP などの標準化されたプロトコルを介して接続された特殊な機能のエコシステムになります。スタートアップ企業にとって、MCP は、成長を続けるエコシステムに適合する特殊なコンポーネントを構築する機会となります。これは、基盤となるモデルへの多額の投資から利益を得ながら、独自の知識と能力を活用する機会です。
将来的には、HTTP が Web にとって基本的なコンポーネントであるのと同様に、MCP が AI インフラストラクチャの基本的なコンポーネントになると予想されます。プロトコルが成熟し、採用が拡大するにつれて、専用の MCP サーバーの市場が出現し、AI システムが考えられるほぼすべての機能やデータ ソースを活用できるようになるでしょう。
あなたのスタートアップは MCP の実装を試みましたか?コメント欄で皆さんの体験談を聞かせて頂ければ嬉しいです。この分野で何か興味深いものを作ったことがある方は、ぜひ @alliancedao までご連絡の上、ご応募ください。
付録
MCP が実際にどのように機能するかを理解したい人のために、次の付録では、そのアーキテクチャ、ワークフロー、実装の技術的な詳細を示します。
MCPの舞台裏
HTTP が Web が外部データ ソースや情報にアクセスする方法を標準化したのと同様に、MCP は AI フレームワークに対して同じことを行い、さまざまな AI システムがシームレスに通信できるようにする共通言語を作成します。それがどのように行われるかを見てみましょう。
MCPのアーキテクチャとプロセス
主なアーキテクチャは、次の 4 つの主要コンポーネントが連携して動作するクライアント サーバー モデルに従います。
MCP ホスト: Claude や ChatGPT などのデスクトップ AI アプリケーション、cursorAI や VSCode などの IDE、外部データや関数にアクセスする必要があるその他の AI ツールが含まれます。
MCP クライアント: ホスト コンピュータに組み込まれ、MCP サーバーとの 1 対 1 接続を維持するプロトコル プロセッサ。
MCP サーバー: 標準化されたプロトコルを通じて特定の機能を公開する軽量プログラム。
データ ソース: これには、MCP サーバーが安全にアクセスできるファイル、データベース、API、およびサービスが含まれます。
これらのコンポーネントについて説明したので、次に、一般的なワークフローでそれらがどのように相互作用するかを見てみましょう。
ユーザーインタラクション: ユーザーは、MCP ホスト (Claude Desktop など) で質問したり、リクエストを送信したりします。
LLM 分析: LLM は要求を分析し、完全な応答を提供するために外部の情報またはツールが必要であることを判断します。
ツールの検出: MCP クライアントは、接続された MCP サーバーにクエリを実行して、使用可能なツールを検出します。
ツールの選択: LLM は、リクエストと利用可能な機能に基づいて、使用するツールを決定します。
権限要求: ホストは、透明性とセキュリティを確保するために、選択したツールを実行するための権限をユーザーに要求します。
ツールの実行: 承認後、MCP クライアントは適切な MCP サーバーにリクエストを送信し、MCP サーバーはデータ ソースへの特殊なアクセスを使用して操作を実行します。
結果処理: サーバーは結果をクライアントに返し、クライアントは結果を LLM で使用できるようにフォーマットします。
応答生成: LLM は外部情報を包括的な応答に統合します。
ユーザープレゼンテーション: 最後に、応答がエンドユーザーに表示されます。
このアーキテクチャの強みは、各 MCP サーバーが特定の領域に特化しながらも、標準化された通信プロトコルを使用していることです。これにより、開発者はプラットフォームごとに統合を再構築する必要がなくなり、AI エコシステム全体に対応するツールを 1 回開発できるようになります。
最初のMCPサーバーを構築する方法
ここで、MCP SDK を使用して、数行のコードでシンプルな MCP サーバーを実装する方法を見てみましょう。
この簡単な例では、Claude Desktop の機能を拡張して、「セントラル パークの近くにあるコーヒー ショップは何ですか?」などの質問に答えられるようにします。 Google マップの情報を使用します。この機能を簡単に拡張して、レビューや評価を取得できます。しかし今のところ、私たちは MCP ツール find_nearby_places に焦点を当てています。これにより、Claude は Google マップから直接この情報を取得し、会話形式で結果を提示できるようになります。
ご覧のとおり、コードは非常にシンプルです。まず、クエリを Google Maps API 検索に変換し、上位の結果を構造化された形式で返します。このようにして、情報は LLM に返され、さらなる意思決定に役立てられます。
ここで、このツールを Claude Desktop に認識させる必要があるため、次のように構成ファイルに登録します。
macOS パス: ~/Library/Application Support/Claude/claude_desktop_config.json Windows パス: %APPDATA%\Claude\claude_desktop_config.json
これで完了です!これで、Claude の機能が拡張され、Google マップからリアルタイムで場所を検索できるようになりました。