ผู้แต่งต้นฉบับ: Haotian (X: @@tme l0 211)
เมื่อฉันตื่นขึ้นมา เพื่อนๆ หลายคนขอให้ฉันอ่าน Manus ซึ่งว่ากันว่าเป็นตัวแทน AI สากลอย่างแท้จริงในโลก สามารถคิดได้อย่างอิสระ วางแผนและดำเนินการงานที่ซับซ้อน และให้ผลลัพธ์ที่ครบถ้วน ฟังดูเจ๋งมาก แต่ว่านอกเหนือจากเสียงวิตกกังวลของเพื่อนๆ หลายคนในกลุ่มเพื่อนเกี่ยวกับการตกงานแล้ว มันจะนำอะไรมาสู่การระเบิดของวงการ Web3 DeFai บ้าง? นี่คือความคิดของฉัน:
1) ประมาณหนึ่งเดือนที่ผ่านมา OpenAI ได้เปิดตัวผลิตภัณฑ์ที่คล้ายกัน ชื่อว่า Operator โดย AI สามารถทำงานต่างๆ ได้อย่างอิสระ เช่น การจองร้านอาหาร การช้อปปิ้ง การจองตั๋ว และการสั่งอาหารกลับบ้านผ่านเบราว์เซอร์ ผู้ใช้สามารถดูแลด้วยภาพและควบคุมได้ตลอดเวลา
ไม่ค่อยมีใครพูดถึงการเกิดขึ้นของตัวแทนนี้เนื่องจากเป็นกรอบงานขับเคลื่อนด้วยโมเดลเดียวที่เรียกใช้โดยเครื่องมือ เมื่อผู้ใช้คิดว่าการตัดสินใจที่สำคัญยังคงต้องมีการแทรกแซง พวกเขาจะสูญเสียความคิดที่จะพึ่งพามันในการดำเนินการงาน
2) Manus ดูเหมือนจะไม่ต่างจากระบบอื่นมากนักเมื่อมองเผินๆ ยกเว้นว่า Manus มีสถานการณ์การใช้งานที่หลากหลายกว่ามาก เช่น การคัดกรองประวัติย่อ การวิจัยหุ้น การซื้ออสังหาริมทรัพย์ เป็นต้น แต่ที่จริงแล้ว ความแตกต่างอยู่ที่กรอบงานและระบบการดำเนินการเบื้องหลัง Manus ขับเคลื่อนด้วยโมเดลขนาดใหญ่แบบหลายโหมดและใช้ระบบลายเซ็นหลายรูปแบบอย่างสร้างสรรค์
โดยสรุป AI จำเป็นต้องเลียนแบบวงจร PDCA ของการดำเนินการ (Plan-Do-Check-Act) ที่มนุษย์ดำเนินการ ซึ่งจะเสร็จสมบูรณ์ด้วยโมเดลขนาดใหญ่หลายตัวที่ทำงานร่วมกัน แต่ละโมเดลจะมุ่งเน้นไปที่การเชื่อมโยงเฉพาะ ซึ่งไม่เพียงแต่ลดความเสี่ยงในการตัดสินใจของโมเดลเดียวในการดำเนินการงานเท่านั้น แต่ยังปรับปรุงประสิทธิภาพการดำเนินการอีกด้วย สิ่งที่เรียกว่า ระบบลายเซ็นหลายรายการ แท้จริงแล้วเป็นกลไกการตรวจสอบการตัดสินใจสำหรับการทำงานร่วมกันของหลายโมเดล ซึ่งช่วยให้แน่ใจถึงความน่าเชื่อถือของการตัดสินใจและการดำเนินการโดยต้องได้รับการยืนยันร่วมกันจากโมเดลมืออาชีพหลายรายการ
3) การเปรียบเทียบนี้ทำให้เห็นข้อดีของการใช้งานอย่างชัดเจน เมื่อรวมกับประสบการณ์การใช้งานที่แสดงในวิดีโอสาธิต ผู้คนจะได้รับประสบการณ์ที่ไม่ธรรมดาอย่างแท้จริง แต่หากมองในเชิงวัตถุแล้ว นวัตกรรม Operator เชิงทำซ้ำของ Manus นั้นถือว่าเป็นเพียงจุดเริ่มต้นเท่านั้น และยังไม่ถึงระดับของการปฏิวัติอันยิ่งใหญ่
ประเด็นสำคัญอยู่ที่ความซับซ้อนของงานที่ดำเนินการ ตลอดจนการกำหนดความทนทานต่อข้อผิดพลาดและอัตราความสำเร็จของผลลัพธ์การส่งมอบของโมเดลขนาดใหญ่หลังจากป้อนคำแนะนำอินพุตของผู้ใช้มาตรฐานที่ไม่สม่ำเสมอ มิฉะนั้น หากปฏิบัติตามชุดนวัตกรรมเหล่านี้ สถานการณ์ DeFai ของ web3 สามารถนำไปใช้ได้อย่างสมบูรณ์ในทันทีหรือไม่ เห็นได้ชัดว่าสิ่งนี้เป็นไปไม่ได้:
ตัวอย่างเช่น ในสถานการณ์ DeFai สำหรับตัวแทนในการดำเนินการตัดสินใจธุรกรรม ตัวแทนระดับ Oracle จะต้องรวบรวมและตรวจสอบข้อมูลบนเชน ดำเนินการบูรณาการและวิเคราะห์ข้อมูล และตรวจสอบราคาบนเชนแบบเรียลไทม์เพื่อจับโอกาสในการทำธุรกรรม กระบวนการนี้ก่อให้เกิดความท้าทายครั้งใหญ่ต่อการวิเคราะห์แบบเรียลไทม์ เป็นไปได้ที่โอกาสในการทำธุรกรรมที่เคยมีประโยชน์เมื่อวินาทีก่อนจะไม่มีอยู่อีกต่อไปหลังจากที่ส่งแบบจำลองขนาดใหญ่ของ Oracle ไปยังตัวแทนการดำเนินการธุรกรรม (หน้าต่างการเก็งกำไร)
อันที่จริงแล้ว สิ่งนี้เผยให้เห็นจุดอ่อนที่ใหญ่ที่สุดของโมเดลขนาดใหญ่หลายโหมดประเภทนี้ในการตัดสินใจดำเนินการ นั่นก็คือ วิธีการเชื่อมต่ออินเทอร์เน็ต การเข้าถึงเครือข่ายเพื่อค้นหาและวิเคราะห์ข้อมูลระดับเรียลไทม์ การวิเคราะห์โอกาสในการซื้อขายจากข้อมูลดังกล่าว และการจับภาพธุรกรรม สภาพแวดล้อมอินเทอร์เน็ตนั้นไม่ได้แย่ขนาดนั้น ราคาสั่งซื้อของเว็บไซต์อีคอมเมิร์ซหลายแห่งไม่เปลี่ยนแปลงตามเวลาจริง ดังนั้นจึงไม่ใช่เรื่องง่ายที่จะก่อให้เกิดปัญหาสมดุลแบบไดนามิกครั้งใหญ่สำหรับการทำงานร่วมกันแบบมัลติโหมดทั้งหมด หากอยู่ในเครือข่าย ความท้าทายดังกล่าวจะเกิดขึ้นเกือบตลอดเวลา
4) ดังนั้นโดยรวมแล้ว การเกิดขึ้นของ manus จะก่อให้เกิดความวิตกกังวลในหมู่เพื่อนฝูงในสาขา web2 อย่างแน่นอน เพราะงานธุรการและการประมวลผลข้อมูลที่มีความจำเจซ้ำซากอาจเสี่ยงต่อการถูกแทนที่ด้วย AI แต่ปล่อยให้พวกเขากังวลเกี่ยวกับเรื่องของพวกเขาเอง
เราจำเป็นต้องเข้าใจบทบาทของ web3 ในการส่งเสริมสถานการณ์การใช้งาน DeFai อย่างเป็นกลาง:
เราต้องยอมรับว่าเรื่องนี้มีความสำคัญมาก เพราะแนวคิด LLM OS และ Less Structure ที่มีปัญญาประดิษฐ์มากขึ้นที่เสนอมา โดยเฉพาะระบบลายเซ็นหลายรายการ จะเป็นแรงบันดาลใจที่ดีสำหรับ web3 ในการขยายการผสมผสานระหว่าง DeFi และ AI
การดำเนินการดังกล่าวช่วยแก้ไขความเข้าใจผิดที่สำคัญของโปรเจ็กต์ DeFai ส่วนใหญ่ได้ อย่าพึ่งพาโมเดลขนาดใหญ่เพื่อบรรลุเป้าหมายที่ซับซ้อน เช่น การคิดแบบอัตโนมัติและการตัดสินใจของตัวแทน AI เพราะนั่นไม่สามารถทำได้จริงในสถานการณ์ทางการเงิน
การทำให้วิสัยทัศน์ DeFai เป็นจริงนั้นต้องอาศัยการแก้ไขปัญหาที่ซับซ้อน เช่น ขีดจำกัดสูงสุดของขีดความสามารถของโมเดล AI เดี่ยว การรับประกันความเป็นอะตอมของการทำงานร่วมกันแบบโต้ตอบหลายโหมด การกำหนดตารางทรัพยากรแบบรวมและการควบคุมของระบบหลายโหมด การทนทานต่อความผิดพลาดของระบบและกลไกการจัดการความผิดพลาด เป็นต้น
ตัวอย่าง: ตัวแทนชั้น Oracle มีหน้าที่รับผิดชอบในการรวบรวมและวิเคราะห์ข้อมูลบนเชนและตรวจสอบราคาเพื่อสร้างแหล่งข้อมูลที่มีประสิทธิภาพ
ตัวแทนการตัดสินใจวิเคราะห์และประเมินความเสี่ยงโดยอิงตามข้อมูลที่ Oracle ป้อน และกำหนดชุดการตัดสินใจและแผนปฏิบัติการ
ตัวแทนชั้นการดำเนินการจะดำเนินการตามโซลูชันต่างๆ ที่ได้รับจากชั้นการตัดสินใจ และคำนึงถึงสถานการณ์จริง รวมถึงการเพิ่มประสิทธิภาพค่าธรรมเนียมแก๊ส สถานะข้ามสายโซ่ การขัดแย้งในการเรียงลำดับธุรกรรม และอื่นๆ
เมื่อชุดตัวแทนเหล่านี้มีประสิทธิภาพพร้อมๆ กันและมีการสร้างกรอบระบบขนาดใหญ่ขึ้นเท่านั้น การปฏิวัติ DeFai ที่แท้จริงจึงจะเริ่มต้นขึ้น
ผลกระทบที่แท้จริงของ manus ต่ออุตสาหกรรม web3 คืออะไร? ไม่ใช่การบดขยี้เชิงเทคนิคแต่เป็นการโจมตีทั้งจิตวิญญาณและจิตวิญญาณ! จริงๆแล้ว ผมมีคำพูดบางคำที่อยู่ในใจมานาน จึงอยากใช้โอกาสนี้ในการถ่ายทอดออกมาดังนี้:
1) ในตอนแรก ฉันไม่เข้าใจผู้คนในอุตสาหกรรม web2 และมองดู Web3 AI Agent ในแง่ลบ แต่เมื่อ Web3 AI Agent อยู่ในภาวะที่ยุ่งเหยิง เมื่อมองดูนวัตกรรมทางเทคโนโลยีและแอปพลิเคชันที่ไม่มีที่สิ้นสุดในสาขา web2 ฉันต้องเผชิญกับข้อเท็จจริงข้อหนึ่ง วิสัยทัศน์ AI + Crypto ที่เรายึดมั่นนั้นไม่ผิด แต่ปัจจุบันสาขา web3 เต็มไปด้วยคนโง่ และยัง มีโครงการขยะมากมายที่ใช้ชื่อของ Builder ระยะยาวเพื่อเปิดตัว MEME และสร้างรายได้
2) เดิมที ฉันอยากจะบอกว่าเราต้องสร้างความมั่นใจให้กับตลาดมากขึ้น และนวัตกรรมใหม่ๆ ก็กำลังจะเกิดขึ้นอยู่เสมอ แต่เมื่อเวลาผ่านไป ฉันพบว่าหลังจากที่มีโครงการต่างๆ ออกมาจำนวนมาก ก็เกิดฟองสบู่มูลค่าหลายหมื่นล้านดอลลาร์ เมื่อฟองสบู่แตก ไม่เพียงแต่จะส่งผลกระทบต่อผู้ถือสกุลเงินในระยะยาวเท่านั้น แต่ยังส่งผลกระทบต่อผู้ปฏิบัติงานบางคนที่อาจยังมีแนวคิดในการสร้างผลงานท่ามกลางความโกลาหลนี้ด้วย การทิ้งอย่างต่อเนื่องกำลังทำลายความเชื่อมั่นของระดับล่างสุดของอุตสาหกรรม สิ่งที่กำลังถูกเคลียร์ออกไปไม่ใช่แค่ราคาเหรียญที่กลับมาเป็นศูนย์เท่านั้น แต่ยังมีทีมงานที่ยอดเยี่ยมจำนวนมากที่เคยมีความหลงใหลในการเริ่มต้นธุรกิจมาก่อน ด้วย ในสถานการณ์ที่เงินที่ไม่ดีขับไล่เงินที่ดีออกไป จะไม่มีผู้ชนะ!
3) เราอาจประเมินความสามารถในการสร้างสรรค์นวัตกรรมของ Web3 AI Agent สูงเกินไป ภายในเวลาอันสั้น เราได้ทำให้ความฝันเกี่ยวกับนวัตกรรม AI + Crypto กลายเป็นจริงได้ เช่น ความเป็นอิสระของ AI Agent การตัดสินใจธุรกรรมอิสระของ AI Agent การฝัง NPC ในเกม AI Agent การโต้ตอบการสร้างแบบจำลองเมตาเวิร์สของ AI Agent และอื่นๆ อีกมากมาย อย่างไรก็ตาม กลับกลายเป็นว่าแผนงานและวิสัยทัศน์ส่วนใหญ่เป็นเพียงอุดมคติและยกยอตัวเอง และไม่มีการประเมินความเป็นไปได้เลยก่อนที่จะยื่นข้อเสนอ ผลก็คือพายถูกวาดให้กลมเกินไปและใหญ่เกินไป หลังจากสปีดรัน ราคาของเหรียญก็ถูกทุบ และวิสัยทัศน์ทางเทคนิคและแผนงานที่กำหนดไว้เดิมก็ถูกทำให้แย่ลงเช่นกัน พูดตรงๆ ว่าฉันลืมไปว่าสิ่งที่ยิ่งใหญ่กำลังจะเกิดขึ้น และการเป็นผู้ติดตามนวัตกรรม web2 นั้นก็เป็นเรื่องดีอยู่แล้ว
4) ในตอนแรกผมภูมิใจมากกับเสน่ห์ที่ไม่มีใครทัดเทียมของ Tokenomics ของ web3 และการดึงดูดผู้มีความสามารถที่โดดเด่นของ web2 แต่เมื่อฉันเห็นว่าทีมงานที่อยู่เบื้องหลัง DeepSeek, Yushu Technology และ manus ซึ่งปรากฏอยู่ในข่าวทุกวันนี้ ล้วนมีวุฒิปริญญาเอกในสาขาวิทยาการคอมพิวเตอร์ วิศวกรรมอิเล็กทรอนิกส์ เป็นต้น จากมหาวิทยาลัย Tsinghua มหาวิทยาลัย Peking และสถาบันวิทยาศาสตร์จีน มาดูทีมนักพัฒนาในแวดวง Crypto AI กันบ้าง พวกเขาเป็นนักพัฒนา web2 ที่หงุดหงิดและกำลังมองหาทางลัดใน web3 หรือไม่ก็เป็นพวกหลอกลวงในแวดวง web3 หรือไม่ก็เป็นนักพัฒนา web3 ที่มีความสามารถทางเทคนิคแต่ไม่ได้รับความสนใจเท่าที่ควร ในแง่ของ “พรสวรรค์” เราจะเปรียบเทียบความเร็วของนวัตกรรมกับ web2 ได้อย่างไร หากการออกเหรียญ Tokenomics บริสุทธิ์เป็นที่มาของพลัง Build ทั้งหมด มันก็ยังเป็นหายนะที่จะฆ่าทุกสิ่งทุกอย่างเช่นกัน
5) ในตอนแรก ฉันคิดว่าปัญหาใหญ่ที่สุดของ web3 AI Agent ก็คือเวลา เพราะเวลาคือยารักษาโรคทุกชนิดที่สามารถรักษาได้ทุกอย่าง แต่ตอนนี้ฉันรู้แล้วว่าฉันคิดผิด หากแนวคิดพื้นฐานในการสร้างมูลค่าไม่ถูกปรับเปลี่ยน เวลาจะทำให้เกิดฟองสบู่ที่ใหญ่กว่านี้เท่านั้น และจะไม่ทำให้เกิดการเปลี่ยนแปลงใดๆ เลย ตอนนี้ Web2 ได้นำมาซึ่งการเปลี่ยนแปลงจากการทำงานหลายโหมดเป็นการทำงานโหมดเดียว นำมาซึ่งนวัตกรรมทางแนวคิดของการแยกการตัดสินใจและการกระทำ และนำมาซึ่งการเปลี่ยนแปลงไปสู่ระบบปฏิบัติการกรอบงานโดยใช้การผสมผสานของ LLM OS + โอเพนซอร์ส กรอบงานและมาตรฐาน web3, DeFai, GamFai, MetAiverse, การสร้างเครือข่ายและแนวทางการสร้างนวัตกรรมอื่นๆ รวมถึงทิศทางของเส้นทางได้ชี้ให้เห็นทิศทางอย่างชัดเจน ฉันตั้งตารอที่จะเห็นว่าทีมแบบไหนที่จะเป็นกลุ่มแรกที่ฝ่าวงล้อมและนำแสงแห่งชีวิตมาสู่ web3 AI Agent