Nhà nghiên cứu Alliance DAO: Một sự hiểu biết đơn giản và sâu sắc về khái niệm MCP đằng sau sự phổ biến của DARK-web3资讯-ODAILY

Tác giả gốc: Mohamed ElSeidy

Bản dịch gốc: TechFlow

Giới thiệu

Hôm qua, token liên quan đến AI của Solana là $Dark đã được ra mắt trên Binance Alpha và giá trị thị trường của nó cho đến nay đã đạt khoảng 40 triệu đô la Mỹ.

Trong câu chuyện AI tiền điện tử mới nhất, $Dark có liên quan chặt chẽ đến MCP (Giao thức ngữ cảnh mô hình), đây cũng là một lĩnh vực mà các công ty công nghệ Web2 như Google đang chú ý và khám phá gần đây.

Tuy nhiên, hiện nay chưa có nhiều bài viết có thể giải thích rõ ràng về khái niệm và tác động tường thuật của MCP.

Sau đây là bài viết chuyên sâu về giao thức MCP của nhà nghiên cứu Mohamed ElSeidy thuộc Alliance DAO. Nó giải thích các nguyên tắc và vị trí của MCP bằng ngôn ngữ rất phổ biến, có thể giúp chúng ta hiểu nhanh những thông tin mới nhất.

TechFlow đã biên soạn toàn bộ bài viết.

Trong những năm làm việc tại Alliance, tôi đã chứng kiến vô số nhà sáng lập xây dựng các công cụ chuyên biệt và tích hợp dữ liệu của riêng họ, được nhúng vào quy trình làm việc và tác nhân AI của họ. Tuy nhiên, các thuật toán, hình thức hóa và tập dữ liệu duy nhất này bị khóa sau các tích hợp tùy chỉnh và hiếm khi được sử dụng.

Điều này đang thay đổi nhanh chóng với sự ra đời của Giao thức bối cảnh mô hình (MCP). MCP được định nghĩa là một giao thức mở chuẩn hóa cách thức các ứng dụng giao tiếp với Mô hình ngôn ngữ lớn (LLM) và cung cấp ngữ cảnh. Một phép ẩn dụ mà tôi thực sự thích là “đối với các ứng dụng AI, MCP giống như USB-C trong phần cứng”; Nó được chuẩn hóa, cắm và chạy, linh hoạt và có khả năng biến đổi.

Tại sao nên chọn MCP?

Các mô hình ngôn ngữ lớn (như Claude, OpenAI, LLAMA, v.v.) rất mạnh mẽ, nhưng chúng bị giới hạn bởi lượng thông tin mà chúng hiện có thể truy cập. Điều này có nghĩa là chúng thường có giới hạn kiến thức và không thể duyệt web một cách độc lập, cũng như không thể truy cập trực tiếp vào các tệp cá nhân hoặc công cụ chuyên dụng của bạn trừ khi có một số hình thức tích hợp.

Đặc biệt, các nhà phát triển trước đây đã phải đối mặt với ba thách thức chính khi kết nối LLM với dữ liệu và công cụ bên ngoài:

Độ phức tạp của tích hợp: Việc xây dựng các tích hợp riêng biệt cho từng nền tảng (như Claude, ChatGPT, v.v.) đòi hỏi phải nỗ lực nhiều lần và duy trì nhiều cơ sở mã.
Phân mảnh công cụ: Mỗi chức năng của công cụ (ví dụ: truy cập tệp, kết nối API, v.v.) đều yêu cầu mã tích hợp và mô hình cấp phép chuyên dụng riêng.
Phân phối hạn chế: Các công cụ độc quyền bị giới hạn ở các nền tảng cụ thể, hạn chế phạm vi tiếp cận và tác động của chúng.
MCP giải quyết những vấn đề này bằng cách cung cấp một phương pháp chuẩn hóa cho bất kỳ LLM nào để truy cập an toàn vào các công cụ và nguồn dữ liệu bên ngoài thông qua một giao thức chung. Bây giờ chúng ta đã hiểu MCP hoạt động như thế nào, hãy cùng xem mọi người đang xây dựng những gì bằng nó.
Mọi người đang xây dựng những gì bằng MCP?
Hệ sinh thái MCP hiện đang trong giai đoạn bùng nổ đổi mới. Sau đây là một số ví dụ gần đây tôi tìm thấy trên Twitter về các nhà phát triển đang khoe tác phẩm của họ:
Bảng phân cảnh do AI điều khiển: Tích hợp MCP cho phép Claude điều khiển ChatGPT-4 để tự động tạo ra các bảng phân cảnh hoàn chỉnh theo phong cách Ghibli mà không cần bất kỳ sự can thiệp nào của con người.
Tích hợp giọng nói ElevenLabs: Máy chủ MCP cung cấp cho Claude và Cursor quyền truy cập vào toàn bộ Nền tảng âm thanh AI thông qua lời nhắc văn bản đơn giản. Sự tích hợp này đủ mạnh để tạo ra một tác nhân giọng nói có thể thực hiện cuộc gọi đi. Điều này chứng minh cách MCP có thể mở rộng các công cụ AI hiện tại sang lĩnh vực âm thanh.
Tự động hóa trình duyệt với Playwright: Máy chủ MCP cho phép các tác nhân AI điều khiển trình duyệt web mà không cần ảnh chụp màn hình hoặc mô hình trực quan. Điều này tạo ra những khả năng mới cho việc tự động hóa web bằng cách cho phép LLM kiểm soát trực tiếp các tương tác của trình duyệt theo cách chuẩn hóa.
Tích hợp WhatsApp cá nhân: Máy chủ kết nối với tài khoản WhatsApp cá nhân, cho phép Claude tìm kiếm tin nhắn và danh bạ, cũng như gửi tin nhắn mới.
Công cụ tìm kiếm Airbnb: Công cụ tìm kiếm căn hộ Airbnb chứng minh tính đơn giản của MCP và khả năng tạo ra các ứng dụng hữu ích tương tác với các dịch vụ web.
Hệ thống điều khiển robot: Bộ điều khiển MCP dành cho robot. Ví dụ này thu hẹp khoảng cách giữa LLM và phần cứng vật lý, chứng minh tiềm năng của MCP trong các ứng dụng IoT và robot.
Google Maps và Tìm kiếm địa phương: Kết nối Claude với dữ liệu Google Maps để tạo ra hệ thống có thể tìm và đề xuất các doanh nghiệp địa phương, chẳng hạn như quán cà phê. Tiện ích mở rộng này cho phép trợ lý AI cung cấp các dịch vụ dựa trên vị trí.
Tích hợp Blockchain: Dự án Lyra MCP mang chức năng MCP đến StoryProtocol và các nền tảng web3 khác. Điều này cho phép tương tác với dữ liệu blockchain và hợp đồng thông minh, mở ra những khả năng mới cho các ứng dụng phi tập trung được tăng cường bởi AI.

Điều đặc biệt nổi bật về những ví dụ này là tính đa dạng của chúng. Trong thời gian ngắn kể từ khi MCP ra mắt, các nhà phát triển đã tạo ra các tích hợp bao gồm sản xuất phương tiện truyền thông sáng tạo, nền tảng truyền thông, kiểm soát phần cứng, dịch vụ định vị và công nghệ blockchain. Những ứng dụng khác nhau này tuân theo cùng một giao thức chuẩn hóa, chứng minh tính linh hoạt của MCP và tiềm năng trở thành tiêu chuẩn chung cho tích hợp công cụ AI.

Nếu bạn muốn xem bộ sưu tập đầy đủ các máy chủ MCP, bạn có thể truy cập kho lưu trữ máy chủ MCP chính thức trên GitHub. Vui lòng đọc kỹ tuyên bố từ chối trách nhiệm trước khi sử dụng bất kỳ máy chủ MCP nào và thận trọng về những gì bạn chạy và ủy quyền.

Hứa hẹn và thổi phồng

Như với bất kỳ công nghệ mới nào, điều đáng để đặt câu hỏi là: MCP có thực sự mang tính cải tiến hay chỉ là một công cụ được thổi phồng quá mức rồi sẽ lỗi thời?

Sau khi quan sát nhiều công ty khởi nghiệp, tôi tin rằng MCP đại diện cho bước ngoặt thực sự trong quá trình phát triển AI. Không giống như nhiều xu hướng hứa hẹn mang lại cuộc cách mạng nhưng chỉ mang lại thay đổi gia tăng, MCP là động lực thúc đẩy năng suất, giải quyết các vấn đề về cơ sở hạ tầng kìm hãm toàn bộ hệ sinh thái.

Điều đặc biệt là nó không cố gắng thay thế hoặc cạnh tranh với các mô hình AI hiện có mà thay vào đó, làm cho chúng hữu ích hơn bằng cách kết nối chúng với các công cụ và dữ liệu bên ngoài mà chúng cần.

Tuy nhiên, vẫn còn những lo ngại chính đáng về vấn đề an toàn và tiêu chuẩn hóa. Giống như bất kỳ giao thức nào trong giai đoạn đầu, chúng ta có thể thấy những khó khăn khi cộng đồng khám phá các phương pháp hay nhất xung quanh việc kiểm tra, cấp quyền, xác thực và xác thực máy chủ. Các nhà phát triển cần tin tưởng vào khả năng của các máy chủ MCP này và không nên tin tưởng chúng một cách mù quáng, đặc biệt là khi chúng ngày càng trở nên phổ biến. Bài viết này thảo luận về một số lỗ hổng bảo mật gần đây bị phát hiện do sử dụng máy chủ MCP một cách tùy tiện mà không được xem xét cẩn thận, ngay cả khi chạy cục bộ.

Tương lai của AI là ngữ cảnh hóa

Các ứng dụng AI mạnh mẽ nhất sẽ không còn là các mô hình độc lập nữa mà là hệ sinh thái các khả năng chuyên biệt được kết nối thông qua các giao thức chuẩn hóa như MCP. Đối với các công ty khởi nghiệp, MCP là cơ hội để xây dựng các thành phần chuyên biệt phù hợp với các hệ sinh thái đang phát triển này. Đây là cơ hội để tận dụng kiến thức và khả năng độc đáo của bạn đồng thời được hưởng lợi từ khoản đầu tư đáng kể vào mô hình cơ bản.

Nhìn về phía trước, chúng ta có thể mong đợi MCP sẽ trở thành một thành phần cơ bản của cơ sở hạ tầng AI, giống như HTTP đối với web. Khi giao thức ngày càng hoàn thiện và được áp dụng rộng rãi, chúng ta có thể sẽ thấy thị trường máy chủ MCP chuyên dụng xuất hiện, cho phép các hệ thống AI tận dụng gần như mọi khả năng hoặc nguồn dữ liệu có thể tưởng tượng được.

Công ty khởi nghiệp của bạn đã thử triển khai MCP chưa? Tôi rất muốn nghe về trải nghiệm của bạn trong phần bình luận. Nếu bạn đã xây dựng được điều gì đó thú vị trong lĩnh vực này, vui lòng liên hệ với chúng tôi theo địa chỉ @alliancedao và nộp đơn.

phụ lục

Đối với những ai muốn hiểu cách thức hoạt động thực sự của MCP, phần phụ lục sau đây cung cấp thông tin phân tích kỹ thuật về kiến trúc, quy trình làm việc và cách triển khai của MCP.

Hậu trường của MCP

Tương tự như cách HTTP chuẩn hóa cách web truy cập các nguồn dữ liệu và thông tin bên ngoài, MCP cũng thực hiện tương tự đối với các khuôn khổ AI, tạo ra một ngôn ngữ chung cho phép các hệ thống AI khác nhau giao tiếp liền mạch. Hãy cùng khám phá cách thực hiện nhé.

Kiến trúc và quy trình MCP

Nhà nghiên cứu Alliance DAO: Một sự hiểu biết đơn giản và sâu sắc về khái niệm MCP đằng sau sự phổ biến của DARK

Kiến trúc chính theo mô hình máy khách-máy chủ với bốn thành phần chính hoạt động cùng nhau:

Máy chủ MCP: bao gồm các ứng dụng AI trên máy tính để bàn như Claude hoặc ChatGPT, các IDE như cursorAI hoặc VSCode hoặc các công cụ AI khác cần truy cập dữ liệu và chức năng bên ngoài.
Máy khách MCP: Bộ xử lý giao thức được nhúng trong máy chủ, duy trì kết nối một-một với Máy chủ MCP.
Máy chủ MCP: Một chương trình nhẹ cung cấp chức năng cụ thể thông qua một giao thức chuẩn hóa.
Nguồn dữ liệu: Bao gồm các tệp, cơ sở dữ liệu, API và dịch vụ mà máy chủ MCP có thể truy cập một cách an toàn.

Bây giờ chúng ta đã thảo luận về các thành phần này, hãy cùng xem cách chúng tương tác trong quy trình làm việc thông thường:

Tương tác của người dùng: Người dùng đặt câu hỏi hoặc đưa ra yêu cầu trên máy chủ MCP (ví dụ: Claude Desktop).
Phân tích LLM: LLM phân tích yêu cầu và xác định xem có cần thông tin hoặc công cụ bên ngoài để cung cấp phản hồi đầy đủ hay không.
Khám phá công cụ: Máy khách MCP truy vấn Máy chủ MCP được kết nối để khám phá các công cụ khả dụng.
Lựa chọn công cụ: LLM quyết định sử dụng công cụ nào dựa trên yêu cầu và chức năng có sẵn.
Yêu cầu cấp quyền: Máy chủ yêu cầu người dùng cấp quyền để thực thi công cụ đã chọn nhằm đảm bảo tính minh bạch và bảo mật.
Thực hiện công cụ: Sau khi được chấp thuận, máy khách MCP sẽ gửi yêu cầu đến máy chủ MCP thích hợp, máy chủ này sử dụng quyền truy cập chuyên biệt vào nguồn dữ liệu để thực hiện thao tác.
Xử lý kết quả: Máy chủ trả về kết quả cho máy khách, sau đó định dạng chúng để LLM sử dụng.
Tạo phản hồi: LLM tích hợp thông tin bên ngoài thành một phản hồi toàn diện.
Trình bày cho người dùng: Cuối cùng, phản hồi được trình bày cho người dùng cuối.

Điểm mạnh của kiến trúc này là mỗi máy chủ MCP chuyên về một lĩnh vực cụ thể nhưng sử dụng một giao thức truyền thông chuẩn hóa. Theo cách này, các nhà phát triển không cần phải xây dựng lại tích hợp cho từng nền tảng mà có thể phát triển các công cụ một lần để phục vụ toàn bộ hệ sinh thái AI.

Cách xây dựng máy chủ MCP đầu tiên của bạn

Bây giờ chúng ta hãy xem cách triển khai một máy chủ MCP đơn giản chỉ bằng vài dòng mã bằng cách sử dụng MCP SDK.

Trong ví dụ đơn giản này, chúng tôi muốn mở rộng khả năng của Claude Desktop để có thể trả lời những câu hỏi như Những quán cà phê nào ở gần Công viên Trung tâm? sử dụng thông tin từ Google Maps. Bạn có thể dễ dàng mở rộng chức năng này để nhận được đánh giá hoặc xếp hạng. Nhưng hiện tại, chúng tôi đang tập trung vào công cụ MCP find_nearby_places, cho phép Claude lấy thông tin này trực tiếp từ Google Maps và trình bày kết quả theo cách đàm thoại.

Nhà nghiên cứu Alliance DAO: Một sự hiểu biết đơn giản và sâu sắc về khái niệm MCP đằng sau sự phổ biến của DARK

Như bạn thấy, mã này rất đơn giản. Đầu tiên, nó chuyển đổi truy vấn thành tìm kiếm Google Maps API và sau đó trả về kết quả hàng đầu theo định dạng có cấu trúc. Theo cách này, thông tin được chuyển lại cho LLM để đưa ra quyết định tiếp theo.

Bây giờ chúng ta cần thông báo công cụ này cho Claude Desktop, vì vậy chúng ta hãy đăng ký nó trong tệp cấu hình như sau:

Đường dẫn macOS: ~/Library/Application Support/Claude/claude_desktop_config.json Đường dẫn Windows: %APPDATA%\Claude\claude_desktop_config.json

Nhà nghiên cứu Alliance DAO: Một sự hiểu biết đơn giản và sâu sắc về khái niệm MCP đằng sau sự phổ biến của DARK

Vậy là xong! Bây giờ bạn đã mở rộng thành công chức năng của Claude để tra cứu vị trí từ Google Maps theo thời gian thực.