เมื่อวันที่ 6 มีนาคม Manus ผลิตภัณฑ์ AI Agent ทั่วไปตัวแรกของโลกที่เปิดตัวโดย Monica สตาร์ทอัพสัญชาติจีน ได้รับความสนใจอย่างกว้างขวางในสื่อเทคโนโลยีและเครือข่ายโซเชียลในประเทศ ในวันแรกของการเปิดตัว รหัสเชิญหาได้ยากจากเครือข่ายทั้งหมด แม้แต่รหัสเชิญบน Xianyu ก็มีราคา 50,000 หยวน อย่างไรก็ตาม KOL ในอุตสาหกรรมจำนวนมากยังคงได้รับรหัสเชิญล่วงหน้า และมีบทความตีความประสบการณ์มากมายตามมา
เนื่องจากเป็นผลิตภัณฑ์ AI Agent ทั่วไป Manus จึงมีความสามารถในการทำงานต่างๆ ให้เสร็จสมบูรณ์ได้โดยอัตโนมัติ ตั้งแต่การวางแผนไปจนถึงการดำเนินการ เช่น การเขียนรายงานและการสร้างตาราง ไม่เพียงแต่ก่อให้เกิดความคิด แต่ยังคิดด้วยตนเองและดำเนินการอีกด้วย ด้วยความสามารถที่แข็งแกร่งในการคิดอย่างอิสระ วางแผน และดำเนินการงานที่ซับซ้อน จึงมอบผลลัพธ์ที่สมบูรณ์โดยตรง แสดงถึงความคล่องตัวและความสามารถในการดำเนินการที่ไม่เคยมีมาก่อน
ความนิยมของ Manus ไม่เพียงแต่ดึงดูดความสนใจภายในอุตสาหกรรมเท่านั้น แต่ยังให้แนวคิดผลิตภัณฑ์อันทรงคุณค่าและแรงบันดาลใจในการออกแบบสำหรับการพัฒนาตัวแทน AI ต่างๆ อีกด้วย ด้วยการพัฒนาอย่างรวดเร็วของเทคโนโลยี AI AI Agent ซึ่งเป็นสาขาที่สำคัญของปัญญาประดิษฐ์ กำลังค่อยๆ เปลี่ยนจากแนวคิดมาสู่ความเป็นจริง และแสดงให้เห็นถึงศักยภาพในการนำไปประยุกต์ใช้อย่างยอดเยี่ยมในทุกภาคส่วน รวมถึงอุตสาหกรรม Web3 ด้วย
พื้นหลัง
AI Agent หรือตัวแทนปัญญาประดิษฐ์คือโปรแกรมคอมพิวเตอร์ที่สามารถตัดสินใจและดำเนินการงานต่างๆ โดยอัตโนมัติโดยอิงตามสภาพแวดล้อม ข้อมูลอินพุต และเป้าหมายที่กำหนดไว้ล่วงหน้า ส่วนประกอบหลักของ AI Agent ได้แก่ โมเดลภาษาขนาดใหญ่ (LLM) ซึ่งเป็น สมอง ที่ทำให้สามารถประมวลผลข้อมูล เรียนรู้จากการโต้ตอบ ตัดสินใจ และดำเนินการต่างๆ ได้ กลไกการสังเกตและการรับรู้ที่ทำให้สามารถรับรู้สภาพแวดล้อมได้ การใช้เหตุผลกระบวนการคิดที่เกี่ยวข้องกับการวิเคราะห์การสังเกตและเนื้อหาความจำ และการพิจารณาการกระทำที่เป็นไปได้ การดำเนินการเป็นการตอบสนองที่ชัดเจนต่อการคิดและการสังเกต และความจำและการดึงข้อมูลที่เก็บประสบการณ์ในอดีตเพื่อใช้ในการเรียนรู้
รูปแบบการออกแบบของ AI Agent เริ่มต้นจาก ReAct และมีสองเส้นทางการพัฒนา: เส้นทางหนึ่งมุ่งเน้นไปที่ความสามารถในการวางแผนของ AI Agent รวมถึง REWOO, Plan Execute และ LLM Compiler อีกวิธีหนึ่งจะมุ่งเน้นไปที่ความสามารถในการสะท้อนกลับ ซึ่งได้แก่ การสะท้อนพื้นฐาน การสะท้อนกลับ การค้นพบตนเอง และ LATS
โหมด ReAct ถือเป็นโหมดการออกแบบ AI Agent รุ่นแรกสุดและใช้งานแพร่หลายที่สุดในปัจจุบัน ดังนั้นบทความนี้จะแนะนำแนวคิดของ ReAct เป็นหลัก ReAct เป็นวิธีการแก้ปัญหาการใช้เหตุผลและการตัดสินใจทางภาษาที่หลากหลายด้วยการผสมผสานการใช้เหตุผลและการกระทำในรูปแบบภาษา กระบวนการทั่วไปแสดงไว้ในรูปด้านล่าง ซึ่งสามารถอธิบายได้ด้วยวงจรที่น่าสนใจ: ความคิด → การกระทำ → การสังเกต หรือเรียกอีกอย่างว่า วงจร TAO
การคิด: เมื่อเผชิญกับปัญหา เราต้องคิดอย่างลึกซึ้ง กระบวนการคิดนี้เป็นเกี่ยวกับวิธีการกำหนดปัญหาและการพิจารณาข้อมูลสำคัญและขั้นตอนการให้เหตุผลที่จำเป็นในการแก้ไขปัญหา
การกระทำ: หลังจากกำหนดทิศทางการคิดแล้ว ขั้นตอนถัดไปคือการดำเนินการ โดยอาศัยความคิดของเรา เราจะใช้มาตรการที่สอดคล้องกันหรือดำเนินการงานเฉพาะเจาะจง โดยหวังว่าจะผลักดันปัญหาไปสู่การแก้ไข
การสังเกต: หลังจากดำเนินการแล้ว เราจะต้องสังเกตผลลัพธ์อย่างระมัดระวัง ขั้นตอนนี้คือการทดสอบว่าการกระทำของเรามีประสิทธิผลหรือไม่ และเราใกล้เคียงกับคำตอบของปัญหาหรือไม่
การวนซ้ำแบบวนซ้ำ
AI Agent สามารถแบ่งได้เป็น Single Agent และ Multi Agent ตามจำนวนตัวแทนอัจฉริยะ หัวใจสำคัญของ Single Agent อยู่ที่การประสานงานระหว่าง LLM กับเครื่องมือ และในกระบวนการทำงานให้เสร็จสมบูรณ์ ตัวแทนอาจมีการโต้ตอบกับผู้ใช้หลายรอบ ตัวแทนหลายรายกำหนดบทบาทที่แตกต่างกันให้กับตัวแทนที่แตกต่างกันและดำเนินการงานที่ซับซ้อนผ่านการทำงานร่วมกันระหว่างตัวแทน อย่างไรก็ตาม ในกระบวนการทำงานให้เสร็จสิ้น เมื่อเปรียบเทียบกับ Single Agent จะมีการโต้ตอบกับผู้ใช้น้อยกว่า ในปัจจุบัน กรอบงานส่วนใหญ่มุ่งเน้นไปที่สถานการณ์ตัวแทนเดี่ยว
Model Context Protocol (MCP) เป็นโปรโตคอลโอเพ่นซอร์สที่เปิดตัวโดย Anthropic เมื่อวันที่ 25 พฤศจิกายน 2024 ซึ่งมีจุดมุ่งหมายเพื่อแก้ไขปัญหาการเชื่อมต่อและการโต้ตอบระหว่าง LLM และแหล่งข้อมูลภายนอก LLM สามารถนำไปเปรียบเทียบกับระบบปฏิบัติการ และ MCP สามารถนำไปเปรียบเทียบกับอินเทอร์เฟซ USB ซึ่งรองรับการแทรกข้อมูลและเครื่องมือภายนอกได้อย่างยืดหยุ่น จากนั้นผู้ใช้ก็สามารถอ่านและใช้ข้อมูลและเครื่องมือภายนอกเหล่านี้ได้
MCP มอบความสามารถสามประการในการขยาย LLM: ทรัพยากร (การขยายความรู้) เครื่องมือ (ดำเนินการฟังก์ชัน เรียกระบบภายนอก) และคำเตือน (เทมเพลตคำเตือนที่เขียนไว้ล่วงหน้า) โปรโตคอล MCP นำเอาสถาปัตยกรรมไคลเอ็นต์-เซิร์ฟเวอร์มาใช้ และการส่งข้อมูลพื้นฐานจะใช้โปรโตคอล JSON-RPC ใครก็ตามสามารถพัฒนาและโฮสต์เซิร์ฟเวอร์ MCP และสามารถปิดบริการได้ตลอดเวลา
สถานะปัจจุบันของตัวแทน AI ใน Web3
ในอุตสาหกรรม Web3 ความนิยมของ AI Agent ลดลงอย่างมากนับตั้งแต่ที่ได้รับความนิยมสูงสุดในเดือนมกราคมปีนี้ และมูลค่าตลาดโดยรวมก็หดตัวลงมากกว่า 90% ในปัจจุบัน การสำรวจ Web3 ที่เป็นที่นิยมและมีมูลค่าตามราคาตลาดสูงสุดยังคงมุ่งเน้นไปที่กรอบงาน AI Agent ได้แก่ โมเดลแพลตฟอร์มการเปิดตัวที่แสดงโดย Virtuals Protocol, โมเดล DAO ที่แสดงโดย ElizaOS และ โมเดลบริษัทเชิงพาณิชย์ที่แสดงโดย Swarms
แพลตฟอร์มการเปิดตัวเป็นแพลตฟอร์มที่ช่วยให้ผู้ใช้สามารถสร้าง ปรับใช้ และสร้างรายได้จาก AI Agents ได้ คล้ายกับ pump.fun ใน Meme แต่ใช้สำหรับ AI Agents เท่านั้น ปัจจุบัน Virtuals Protocol เป็นแพลตฟอร์มเปิดตัวที่ใหญ่ที่สุด โดยมีการออกเอเจนต์มากกว่า 100,000 รายการ สกุลเงินดิจิทัล KOL ยอดนิยมอย่าง AIXBT ได้รับการสร้างขึ้นบนพื้นฐานของ Virtuals Virtuals Protocol มีกรอบงานตัวแทนแบบโมดูลาร์ที่เรียกว่า GAME แกนหลักของ GAME คือการมอบกรอบงานที่เปิดกว้างและมีประสิทธิภาพให้กับนักพัฒนา ซึ่งทำให้การพัฒนาและเปิดตัว AI Agent ง่ายดายเหมือนกับการสร้างเว็บไซต์ WordPress
DAO ย่อมาจาก Decentralized Autonomous Organization ElizaOS (เดิมชื่อ ai16z) ก่อตั้งโดย @shawmakesmagic บนแพลตฟอร์ม daos.fun แนวคิดเดิมคือการใช้โมเดล AI เพื่อจำลองการตัดสินใจลงทุนของบริษัทเงินร่วมลงทุนชื่อดังอย่าง a16z และผู้ก่อตั้งร่วม Marc Andreessen และลงทุนตามคำแนะนำของสมาชิก DAO ต่อมาได้พัฒนาเป็น DAO สำหรับนักพัฒนา AI Agent โดยมีเฟรมเวิร์ก Eliza เป็นแกนหลัก เฟรมเวิร์ก Eliza ที่ถูกสร้างด้วย TypeScript มอบแพลตฟอร์มที่ยืดหยุ่นและขยายได้สำหรับการพัฒนาตัวแทน AI ที่สามารถโต้ตอบได้บนหลายแพลตฟอร์มในขณะที่ยังคงรักษาบุคลิกภาพและความรู้ที่สอดคล้องกัน
Swarms เริ่มต้นโดย @KyeGomezB วัย 20 ปีในปี 2022 ซึ่งเป็นกรอบงาน Multi Agent ระดับองค์กร ด้วยการประสานงานอย่างชาญฉลาดและการทำงานร่วมกันอย่างมีประสิทธิภาพ Swarms ช่วยให้ AI Agent หลายตัวทำงานร่วมกันเป็นทีมเพื่อแก้ไขความต้องการการดำเนินการทางธุรกิจที่ซับซ้อน ในตอนแรก Swarms เป็นเพียงโครงการ Web2 AI Agent เท่านั้น ตามที่ผู้ก่อตั้งกล่าวไว้ Swarms มีตัวแทนมากกว่า 45 ล้านรายการที่ทำงานอยู่ในสภาพแวดล้อมการผลิต โดยให้บริการแก่สถาบันการเงิน การประกันภัย และการแพทย์ที่ใหญ่ที่สุดในโลก จะมีการเปลี่ยนจาก Web2 ไปเป็น Web3 อย่างเป็นทางการหลังจากออกโทเค็น $SWARMS ในเดือนธันวาคม 2024
จากมุมมองของรูปแบบเศรษฐกิจเพียงอย่างเดียว ในปัจจุบันมีเพียงแพลตฟอร์มการเปิดตัวเท่านั้นที่สามารถบรรลุระบบวงจรปิดทางเศรษฐกิจที่สามารถพึ่งตนเองได้ ใช้ Virtuals เป็นตัวอย่าง:
การสร้างตัวแทน: ผู้สร้างเปิดตัวตัวแทน AI ใหม่บนแพลตฟอร์มเสมือน
การตั้งค่าเส้นโค้งการเชื่อมโยง: ผู้สร้างจ่าย 100 โทเค็น $VIRTUAL เส้นโค้งการเชื่อมโยงจะถูกสร้างขึ้นสำหรับโทเค็นที่เพิ่งสร้างใหม่และจับคู่กับ $VIRTUAL
การสร้างกลุ่มสภาพคล่อง: เมื่อถึงขีดจำกัดของเส้นโค้งการเชื่อมโยง พร็อกซีจะ “สำเร็จการศึกษา” และสร้างกลุ่มสภาพคล่องซึ่งโทเค็นพร็อกซีจะจับคู่กับโทเค็น $VIRTUAL โดยยึดตามหลักการของการเปิดตัวอย่างยุติธรรมโดยไม่มีบุคคลภายใน: ไม่มีการขุดล่วงหน้าหรือการจัดสรรภายใน อุปทานรวมคงที่ และการล็อกสภาพคล่องเป็นระยะเวลานานขึ้น
นอกเหนือจากการเรียกเก็บค่าธรรมเนียมการเปิดตัว AI Agent แล้ว Virtuals ยังเรียกเก็บค่าธรรมเนียมธุรกรรมสำหรับแต่ละธุรกรรมของโทเค็นตัวแทน และค่าธรรมเนียมการอนุมานสำหรับ AI Agent ที่เข้าถึง LLM ผ่านทาง Virtuals API อีกด้วย ปัจจุบัน ElizaOS และ Swarms กำลังวางแผนสร้างแพลตฟอร์มเปิดตัวของตนเอง
แน่นอนว่ายังมีปัญหาเกี่ยวกับแพลตฟอร์มเปิดตัวด้วย การออกสินทรัพย์ประเภทนี้จำเป็นต้องให้สินทรัพย์ที่ออกนั้นมีความ น่าดึงดูด ในตัวมันเองจึงจะสร้างวงจรเชิงบวกได้ ในปัจจุบันตัวแทน AI ส่วนใหญ่ที่เปิดตัวนั้นเป็นเพียงมีมโดยไม่มีการสนับสนุนมูลค่าภายใน เมื่อพวกเขาสูญเสียความสนใจจากตลาด พวกเขาจะกลับไปสู่ศูนย์อย่างรวดเร็ว ในสภาพแวดล้อมตลาดที่เย็นชาในปัจจุบัน แพลตฟอร์มเปิดตัวไม่สามารถดึงดูดผู้สร้างได้ ดังนั้นรูปแบบทางเศรษฐกิจจึงไม่สามารถใช้ได้ผล
การสำรวจ Web3 ของ MCP
การเกิดขึ้นของ MCP นำทิศทางการสำรวจใหม่มาสู่ Web3 AI Agent ในปัจจุบัน ทิศทางที่เข้าใจง่ายที่สุดคือ:
ปรับใช้เซิร์ฟเวอร์ MCP ให้กับเครือข่ายบล็อคเชนเพื่อแก้ไขปัญหาจุดเดียวของเซิร์ฟเวอร์ MCP และให้ความต้านทานต่อการเซ็นเซอร์
เซิร์ฟเวอร์ MCP มีฟังก์ชันการโต้ตอบกับบล็อคเชน เช่น การทำธุรกรรมและการจัดการ DeFi รวมไปถึงการลดเกณฑ์ทางเทคนิค
ทิศทางแรกมีข้อกำหนดที่สูงมากเกี่ยวกับระบบจัดเก็บข้อมูล ความสามารถในการจัดการข้อมูล และความสามารถในการประมวลผลแบบอะซิงโครนัสของบล็อคเชนพื้นฐาน และคุณสามารถเลือกบล็อคเชนเช่น 0G ได้ 0G เป็นบล็อคเชน AI แบบโมดูลาร์พร้อมเลเยอร์ DA ที่ปรับขนาดและตั้งโปรแกรมได้ เหมาะสำหรับ AI dapps เทคโนโลยีโมดูลาร์จะช่วยให้เกิดการทำงานร่วมกันอย่างราบรื่นระหว่างเครือข่ายในขณะเดียวกันก็มั่นใจในความปลอดภัย ขจัดการแยกส่วน และเพิ่มการเชื่อมต่อสูงสุดเพื่อสร้างระบบนิเวศ AI แบบกระจายอำนาจ
ทิศทางที่สองจะคล้ายกับรูปแบบหนึ่งของ DeFAI แต่ปัจจุบันแบ็กเอนด์ของ DeFAI เป็นชุดเครื่องมือในการเรียกฟังก์ชันที่ถูกรวมไว้ด้วยตัวเอง UnifAI สร้างเซิร์ฟเวอร์ DeFAI MCP ที่เป็นหนึ่งเดียวเพื่อหลีกเลี่ยงการประดิษฐ์ล้อขึ้นมาใหม่ UnifAI เป็นแพลตฟอร์มที่ช่วยให้ตัวแทน AI อัตโนมัติสามารถดำเนินการงานบนเชนและนอกเชนในระบบนิเวศ Web3 ได้ มี UniQ สำหรับการอัตโนมัติงาน ตลาดบริการนายหน้า และโครงสร้างพื้นฐานสำหรับการค้นหาเครื่องมือ
นอกเหนือจากสองทิศทางข้างต้นแล้ว @brucexu_eth ผู้ก่อตั้ง LXDAO และ ETHPanda ยังเสนอแผนในการสร้างเครือข่ายสร้างแรงจูงใจผู้สร้าง OpenMCP.Network บนพื้นฐานของ Ethereum อีกด้วย เซิร์ฟเวอร์ MCP จำเป็นต้องโฮสต์และให้บริการที่เสถียร ผู้ใช้ชำระเงินให้กับผู้ให้บริการ LLM และผู้ให้บริการ LLM จะแจกจ่ายแรงจูงใจจริงให้กับเซิร์ฟเวอร์ MCP ที่เรียกว่าผ่านทางเครือข่ายเพื่อรักษาความยั่งยืนและความเสถียรของเครือข่ายทั้งหมด และเป็นแรงบันดาลใจให้ผู้สร้าง MCP สร้างและจัดหาเนื้อหาคุณภาพสูงต่อไป เครือข่ายนี้จะต้องใช้สัญญาอัจฉริยะเพื่อสร้างแรงจูงใจให้เป็นไปโดยอัตโนมัติ โปร่งใส เชื่อถือได้ และป้องกันการเซ็นเซอร์ ลายเซ็น การยืนยันอนุญาต และการปกป้องความเป็นส่วนตัวระหว่างการดำเนินการสามารถทำได้ทั้งหมดโดยใช้เทคโนโลยีเช่นกระเป๋าเงิน Ethereum และ ZK
แม้ในทางทฤษฎี การผสมผสานระหว่าง MCP และ Web3 จะสามารถเพิ่มกลไกความน่าเชื่อถือแบบกระจายอำนาจและชั้นแรงจูงใจทางเศรษฐกิจลงในแอปพลิเคชัน AI Agent ได้ แต่เทคโนโลยีการพิสูจน์ความรู้เป็นศูนย์ (ZKP) ในปัจจุบันยังคงทำให้ยากต่อการตรวจสอบความถูกต้องของพฤติกรรมของ Agent และเครือข่ายแบบกระจายอำนาจยังคงมีปัญหาเรื่องประสิทธิภาพ นี่ไม่ใช่วิธีแก้ปัญหาที่ประสบความสำเร็จในระยะสั้น
สรุป
การเปิดตัว Manus ถือเป็นก้าวสำคัญสำหรับผลิตภัณฑ์ AI Agent ทั่วไป โลกของ Web3 ยังต้องการผลิตภัณฑ์ที่เป็นก้าวสำคัญที่จะมาทำลายข้อสงสัยของโลกภายนอกที่ว่า Web3 ไม่มีประโยชน์อะไรเลยและเป็นเพียงกระแสโฆษณาเท่านั้น
การเกิดขึ้นของ MCP นำมาซึ่งทิศทางการสำรวจใหม่ๆ สำหรับ Web3 AI Agent รวมถึงการปรับใช้ MCP Server ให้กับเครือข่ายบล็อคเชน การทำให้ MCP Server โต้ตอบกับบล็อคเชนได้ หรือการสร้างเครือข่ายสร้างแรงจูงใจให้กับผู้สร้าง MCP Server
AI คือเรื่องราวที่ยิ่งใหญ่ที่สุดในประวัติศาสตร์ สำหรับ Web3 การบูรณาการกับ AI เป็นสิ่งที่หลีกเลี่ยงไม่ได้ เรายังคงต้องคงความอดทนและความมั่นใจและสำรวจต่อไป
บทความนี้เขียนโดย pignard.eth (บัญชี X @pignard_web3 ) ของทีม ZAN (บัญชี X @zan_team )
หมายเหตุ: บทความนี้มีไว้เพื่อการแบ่งปันทางเทคนิคเท่านั้น และไม่ถือเป็นคำแนะนำหรือข้อเสนอแนะใดๆ