Bắt đầu từ Manus và MCP: Cuộc khám phá xuyên biên giới của AI Agent về Web3-web3资讯-ODAILY

Vào ngày 6 tháng 3, Manus, sản phẩm AI Agent tổng hợp đầu tiên trên thế giới do công ty khởi nghiệp Monica của Trung Quốc phát hành, đã xuất hiện trên khắp các phương tiện truyền thông công nghệ và mạng xã hội trong nước. Vào ngày đầu tiên ra mắt, mã mời rất khó kiếm trên toàn bộ mạng lưới. Ngay cả mã mời trên Xianyu cũng có giá 50.000 nhân dân tệ. Tuy nhiên, nhiều KOL trong ngành vẫn nhận được mã mời trước và sau đó là hàng loạt bài viết chia sẻ kinh nghiệm.

Bắt đầu từ Manus và MCP: Cuộc khám phá xuyên biên giới của AI Agent về Web3

Là một sản phẩm AI Agent tổng quát, Manus có khả năng tự động hoàn thành các nhiệm vụ từ khâu lập kế hoạch đến thực hiện, chẳng hạn như viết báo cáo và lập bảng. Nó không chỉ tạo ra ý tưởng mà còn suy nghĩ độc lập và hành động. Với khả năng suy nghĩ độc lập, lập kế hoạch và thực hiện các nhiệm vụ phức tạp, nó trực tiếp mang lại kết quả hoàn chỉnh, chứng minh tính linh hoạt và khả năng thực hiện chưa từng có.

Sự phổ biến của Manus không chỉ thu hút sự chú ý trong ngành mà còn mang lại những ý tưởng sản phẩm có giá trị và cảm hứng thiết kế cho việc phát triển nhiều tác nhân AI khác nhau. Với sự phát triển nhanh chóng của công nghệ AI, AI Agent, một nhánh quan trọng của lĩnh vực trí tuệ nhân tạo, đang dần chuyển từ khái niệm thành hiện thực và đã cho thấy tiềm năng ứng dụng to lớn trong mọi lĩnh vực của đời sống, bao gồm cả ngành công nghiệp Web3.

Lý lịch

AI Agent, hay tác nhân trí tuệ nhân tạo, là một chương trình máy tính có khả năng tự động đưa ra quyết định và thực hiện nhiệm vụ dựa trên môi trường, dữ liệu đầu vào và các mục tiêu được xác định trước. Các thành phần cốt lõi của một tác nhân AI bao gồm một mô hình ngôn ngữ lớn (LLM) như là “bộ não” cho phép nó xử lý thông tin, học hỏi từ các tương tác, đưa ra quyết định và thực hiện hành động; cơ chế quan sát và nhận thức cho phép nó nhận thức được môi trường; quá trình suy nghĩ lý luận liên quan đến việc phân tích các quan sát và nội dung bộ nhớ và xem xét các hành động có thể xảy ra; thực hiện hành động như một phản ứng rõ ràng đối với suy nghĩ và quan sát; và trí nhớ và khả năng lưu trữ những kinh nghiệm trong quá khứ để sử dụng trong học tập.

Mẫu thiết kế của AI Agent bắt đầu từ ReAct và có hai lộ trình phát triển: một là tập trung nhiều hơn vào khả năng lập kế hoạch của AI Agent, bao gồm REWOO, Plan Execute và LLM Compiler. Phương pháp còn lại tập trung nhiều hơn vào khả năng phản xạ, bao gồm Phản xạ cơ bản, Phản xạ suy nghĩ, Khám phá bản thân và LATS.

Bắt đầu từ Manus và MCP: Cuộc khám phá xuyên biên giới của AI Agent về Web3

Trong số đó, chế độ ReAct là chế độ thiết kế AI Agent sớm nhất và hiện đang được sử dụng rộng rãi nhất, vì vậy bài viết này chủ yếu giới thiệu khái niệm ReAct. ReAct là phương pháp giải quyết nhiều nhiệm vụ lý luận và ra quyết định bằng ngôn ngữ bằng cách kết hợp lý luận và hành động theo mô hình ngôn ngữ. Quá trình điển hình của nó được thể hiện trong hình bên dưới, có thể được mô tả bằng một chu kỳ thú vị: Suy nghĩ → Hành động → Quan sát, được gọi là chu kỳ TAO.

Suy nghĩ: Khi đối mặt với một vấn đề, chúng ta cần phải suy nghĩ sâu sắc. Quá trình suy nghĩ này là về cách xác định vấn đề và xác định thông tin chính cùng các bước lý luận cần thiết để giải quyết vấn đề.
Hành động: Sau khi xác định hướng suy nghĩ, bước tiếp theo là hành động. Dựa trên suy nghĩ của mình, chúng ta thực hiện các biện pháp tương ứng hoặc nhiệm vụ cụ thể với hy vọng tìm ra giải pháp cho vấn đề.
Quan sát: Sau khi thực hiện hành động, chúng ta phải quan sát cẩn thận kết quả. Bước này nhằm kiểm tra xem hành động của chúng ta có hiệu quả không và liệu chúng ta có gần tìm ra câu trả lời cho vấn đề hay không.
Lặp lại vòng lặp

AI Agent có thể được chia thành Single Agent và Multi Agent tùy theo số lượng tác nhân thông minh. Cốt lõi của Single Agent nằm ở sự phối hợp giữa LLM và các công cụ, và trong quá trình hoàn thành nhiệm vụ, Agent có thể có nhiều vòng tương tác với người dùng. Multi Agent chỉ định các vai trò khác nhau cho các Agent khác nhau và hoàn thành các nhiệm vụ phức tạp thông qua sự hợp tác giữa các Agent. Tuy nhiên, trong quá trình hoàn thành nhiệm vụ, so với Single Agent, sẽ có ít sự tương tác với người dùng hơn. Hiện nay, hầu hết các khuôn khổ đều tập trung vào các tình huống Tác nhân đơn lẻ.

Bắt đầu từ Manus và MCP: Cuộc khám phá xuyên biên giới của AI Agent về Web3

Giao thức bối cảnh mô hình (MCP) là giao thức nguồn mở được Anthropic ra mắt vào ngày 25 tháng 11 năm 2024, nhằm mục đích giải quyết các vấn đề kết nối và tương tác giữa LLM và các nguồn dữ liệu bên ngoài. LLM có thể được so sánh với hệ điều hành và MCP có thể được so sánh với giao diện USB, hỗ trợ chèn dữ liệu và công cụ bên ngoài một cách linh hoạt, sau đó người dùng có thể đọc và sử dụng dữ liệu và công cụ bên ngoài này.

MCP cung cấp ba khả năng để mở rộng LLM: Tài nguyên (mở rộng kiến thức), Công cụ (thực thi chức năng, gọi hệ thống bên ngoài) và Lời nhắc (mẫu lời nhắc được viết sẵn). Giao thức MCP áp dụng kiến trúc Máy khách-Máy chủ và quá trình truyền tải cơ bản sử dụng giao thức JSON-RPC. Bất kỳ ai cũng có thể phát triển và lưu trữ MCP Server và có thể tắt dịch vụ bất kỳ lúc nào.

Bắt đầu từ Manus và MCP: Cuộc khám phá xuyên biên giới của AI Agent về Web3

Trạng thái hiện tại của các tác nhân AI trong Web3

Trong ngành Web3, mức độ phổ biến của AI Agent đã giảm đáng kể kể từ khi đạt đỉnh vào tháng 1 năm nay và giá trị thị trường chung đã giảm hơn 90%. Hiện tại, các cuộc khám phá Web3 phổ biến và có vốn hóa thị trường nhất vẫn tập trung vào khuôn khổ AI Agent, cụ thể là mô hình nền tảng khởi chạy đại diện bởi Virtuals Protocol, mô hình DAO đại diện bởi ElizaOS và mô hình công ty thương mại đại diện bởi Swarms.

Nền tảng ra mắt là nền tảng cho phép người dùng tạo, triển khai và kiếm tiền từ AI Agent, tương tự như pump.fun trong Meme, nhưng dành cho AI Agent. Virtuals Protocol hiện là nền tảng ra mắt lớn nhất, với hơn 100.000 Agent được phát hành trên đó. KOL tiền điện tử phổ biến AIXBT được tạo ra dựa trên Virtuals. Virtuals Protocol bao gồm một khuôn khổ Agent dạng mô-đun gọi là GAME. Mục tiêu cốt lõi của GAME là cung cấp cho các nhà phát triển một khuôn khổ hiệu quả và mở, giúp việc phát triển và ra mắt AI Agent trở nên dễ dàng như xây dựng một trang web WordPress.

Bắt đầu từ Manus và MCP: Cuộc khám phá xuyên biên giới của AI Agent về Web3

DAO là viết tắt của Tổ chức tự trị phi tập trung. ElizaOS (trước đây là ai16z) được thành lập bởi @shawmakesmagic trên nền tảng daos.fun. Ý tưởng ban đầu là sử dụng các mô hình AI để mô phỏng các quyết định đầu tư của công ty đầu tư mạo hiểm nổi tiếng a16z và người đồng sáng lập Marc Andreessen, và đầu tư dựa trên lời khuyên của các thành viên DAO. Sau đó, nó phát triển thành DAO dành cho các nhà phát triển AI Agent với nền tảng Eliza làm cốt lõi. Được xây dựng bằng TypeScript, khung Eliza cung cấp một nền tảng linh hoạt và có thể mở rộng để phát triển các tác nhân AI có thể tương tác trên nhiều nền tảng trong khi vẫn duy trì tính cách và kiến thức nhất quán.

Swarms được khởi xướng bởi @KyeGomezB, 20 tuổi vào năm 2022. Đây là một khuôn khổ Đa tác nhân cấp doanh nghiệp. Thông qua sự phối hợp thông minh và cộng tác hiệu quả, Swarms cho phép nhiều tác nhân AI làm việc cùng nhau như một nhóm để giải quyết các nhu cầu hoạt động kinh doanh phức tạp. Lúc đầu, Swarms chỉ là một dự án Web2 AI Agent. Theo người sáng lập, Swarms có hơn 45 triệu tác nhân hoạt động trong môi trường sản xuất, cung cấp dịch vụ cho các tổ chức tài chính, bảo hiểm và y tế lớn nhất thế giới. Hệ thống sẽ chính thức chuyển từ Web2 sang Web3 sau khi phát hành token $SWARMS vào tháng 12 năm 2024.

Chỉ xét về góc độ mô hình kinh tế, hiện nay chỉ có nền tảng phóng mới có thể đạt được vòng khép kín kinh tế tự cung tự cấp. Lấy Virtuals làm ví dụ:

Tạo tác nhân: Người tạo ra sẽ ra mắt một tác nhân AI mới trên nền tảng Virtuals;
Thiết lập đường cong liên kết: Người tạo trả 100 token $VIRTUAL, một đường cong liên kết sẽ được tạo cho token mới được môi giới và ghép nối với $VIRTUAL.
Tạo nhóm thanh khoản: Khi đạt đến giới hạn đường cong liên kết, proxy sẽ “tốt nghiệp” và tạo nhóm thanh khoản, trong đó token proxy được ghép nối với token $VIRTUAL, tuân thủ nguyên tắc ra mắt công bằng mà không có người trong cuộc: không khai thác trước hoặc phân bổ nội bộ, tổng nguồn cung cố định và khóa thanh khoản trong thời gian dài hơn.

Ngoài việc tính phí khởi chạy AI Agent, Virtuals còn tính phí giao dịch cho mỗi giao dịch token agent và phí suy luận cho AI Agent truy cập LLM thông qua API của Virtuals. Hiện tại ElizaOS và Swarms đang có kế hoạch xây dựng nền tảng phóng riêng của mình.

Tất nhiên, cũng có vấn đề với bệ phóng. Loại phát hành tài sản này đòi hỏi bản thân tài sản được phát hành phải hấp dẫn để hình thành bánh đà dương. Hiện nay, hầu hết các tác nhân AI được tung ra về cơ bản đều là meme, không có giá trị hỗ trợ nội tại. Một khi họ mất đi sự chú ý của thị trường, họ sẽ nhanh chóng trở về con số không. Trong bối cảnh thị trường lạnh giá hiện nay, các nền tảng ra mắt thậm chí còn không thể thu hút được người sáng tạo, do đó về cơ bản mô hình kinh tế này không hiệu quả.

Khám phá Web3 của MCP

Sự xuất hiện của MCP đã mang đến những hướng khám phá mới cho Web3 AI Agent hiện tại. Những hướng dẫn trực quan nhất là:

Triển khai MCP Server vào mạng blockchain để giải quyết vấn đề điểm đơn của MCP Server và cung cấp khả năng chống kiểm duyệt;
MCP Server có chức năng tương tác với blockchain, chẳng hạn như thực hiện giao dịch DeFi và quản lý, hạ thấp ngưỡng kỹ thuật.

Hướng đầu tiên có yêu cầu cực kỳ cao về hệ thống lưu trữ, khả năng quản lý dữ liệu và khả năng tính toán không đồng bộ của blockchain cơ bản và bạn có thể chọn một blockchain như 0G. 0G là một blockchain AI dạng mô-đun với lớp DA có thể mở rộng và lập trình được, phù hợp với các ứng dụng phi tập trung AI. Công nghệ mô-đun của nó sẽ cho phép khả năng tương tác liền mạch giữa các chuỗi trong khi vẫn đảm bảo an ninh, loại bỏ sự phân mảnh và tối đa hóa khả năng kết nối để tạo ra một hệ sinh thái AI phi tập trung.

Bắt đầu từ Manus và MCP: Cuộc khám phá xuyên biên giới của AI Agent về Web3

Hướng thứ hai tương tự như một biến thể của DeFAI, nhưng hiện tại phần phụ trợ của DeFAI là một loạt các công cụ trong Function Call được đóng gói riêng. UnifAI tạo ra một Máy chủ MCP DeFAI thống nhất để tránh phải làm lại từ đầu. UnifAI là nền tảng cho phép các tác nhân AI tự động thực hiện các tác vụ trên chuỗi và ngoài chuỗi trong hệ sinh thái Web3. Nó có UniQ để tự động hóa tác vụ, một thị trường dịch vụ môi giới và cơ sở hạ tầng để khám phá công cụ.

Bắt đầu từ Manus và MCP: Cuộc khám phá xuyên biên giới của AI Agent về Web3

Ngoài hai hướng đi trên, @brucexu_eth, người sáng lập LXDAO và ETHPanda, đã đề xuất một kế hoạch xây dựng mạng lưới khuyến khích người sáng tạo OpenMCP.Network dựa trên Ethereum. Máy chủ MCP cần lưu trữ và cung cấp các dịch vụ ổn định. Người dùng trả tiền cho nhà cung cấp LLM và nhà cung cấp LLM phân phối các ưu đãi thực tế cho các Máy chủ MCP được gọi thông qua mạng để duy trì tính bền vững và ổn định của toàn bộ mạng và truyền cảm hứng cho những người sáng tạo MCP tiếp tục sáng tạo và cung cấp nội dung chất lượng cao. Mạng lưới này sẽ cần sử dụng các hợp đồng thông minh để tự động hóa các ưu đãi, minh bạch, đáng tin cậy và chống kiểm duyệt. Chữ ký, xác minh quyền và bảo vệ quyền riêng tư trong quá trình vận hành đều có thể thực hiện được bằng các công nghệ như ví Ethereum và ZK.

Bắt đầu từ Manus và MCP: Cuộc khám phá xuyên biên giới của AI Agent về Web3

Mặc dù về mặt lý thuyết, sự kết hợp giữa MCP và Web3 có thể đưa cơ chế tin cậy phi tập trung và lớp khuyến khích kinh tế vào các ứng dụng AI Agent, nhưng công nghệ bằng chứng không kiến thức (ZKP) hiện tại vẫn gây khó khăn cho việc xác minh tính xác thực của hành vi Agent và các mạng phi tập trung vẫn còn vấn đề về hiệu quả. Đây không phải là giải pháp thành công trong ngắn hạn.

Tóm tắt

Việc phát hành Manus đánh dấu một cột mốc quan trọng đối với các sản phẩm AI Agent nói chung. Thế giới Web3 cũng cần một sản phẩm mang tính đột phá để phá vỡ sự nghi ngờ của thế giới bên ngoài rằng Web3 không có tính thực tế và chỉ là sự cường điệu.

Sự xuất hiện của MCP đã mang đến những hướng khám phá mới cho Web3 AI Agent, bao gồm triển khai MCP Server lên mạng blockchain, cho phép MCP Server tương tác với blockchain hoặc xây dựng mạng lưới khuyến khích người sáng tạo MCP Server.

AI là câu chuyện vĩ đại nhất trong lịch sử. Đối với Web3, việc tích hợp với AI là điều tất yếu. Chúng ta vẫn cần phải kiên nhẫn, tự tin và tiếp tục khám phá.

Bài viết này được viết bởi pignard.eth (tài khoản X @pignard_web3 ) của Nhóm ZAN (tài khoản X @zan_team ).

Lưu ý: Bài viết này chỉ mang tính chia sẻ kỹ thuật và không phải là khuyến nghị hay gợi ý nào.