原文作者:Haotian(X:@@tme l0 211)
一覺醒,好多朋友讓我看manus,號稱一款全球真正意義上通用的AI Agent,能夠實現獨立思考並規劃執行複雜任務,並交付完整結果。聽起來非常Cool,但除了許多朋友圈焦慮的要失業的聲音之外,它會為web3 DeFai 場景大爆發帶來什麼?以下,談談我的思考:
1)約一個月前OpenAI 推出了同類別產品Operator,AI 可以在瀏覽器中獨立完成包括餐廳預訂、購物、訂票、外帶訂餐等任務,用戶可以可視化進行監督,並隨時接管控制權。
這套Agent 的出現並沒有太多人討論,原因在於它是單一模型驅動,還是工具調用的那套框架,用戶一想到關鍵決策還需要幹預進行就失去了依賴其執行任務的想法。
2)manus 表面看似也差不太多,只是多了不少應用場景,包括篩選簡歷,研究股票、購買房產等等,但實際上是背後的框架和執行系統差異,Manus 由多模態大模型驅動,並創新性的採用了多重簽名系統。
簡而言之,AI 要模仿人執行(計劃- 執行- 檢查- 行動)的PDCA 循環行動,將由多個大模型共同協作完成,每個模型專注於特定環節,既能降低單一模型執行任務的決策風險,又能提高執行效率。所謂「多重簽章系統」其實是多模型協作的決策驗證機制,透過要求多個專業模型的共同確認來確保決策和執行的可靠性。
3)如此一比較,manus 的優勢顯然就凸顯出來了,加上視訊Demo 裡展現的一系列操作體驗,讓人確實有一種非凡的體驗感。但客觀來說, Manus 對Operator 的迭代創新只是個開始,還達不到顛覆性革命意義。
關鍵點就在於其執行任務的複雜程度,以及非統一標準用戶input Prompt 進入之後大模型的容錯率和交付結果成功率定義。不然,順著這套創新, web3 的DeFai 場景是不是立刻就可以成熟應用了?顯然,還做不到:
例如:DeFai 場景下Agent 要執行交易決策,需要有一個Oracle 層的Agent 負責鏈上數據收集和驗證,並進行數據整合分析,還要實時監控鏈上價格捕捉交易機會,這個過程對實時分析有很大挑戰,有可能前還有用的交易機會,等Oracle 大模型傳輸給交易執行Agent 後,套交易機會就不存在了;
這其實暴露了這類多模態大模型做執行決策的一個最大軟肋,如何聯網、觸鏈調取分析Real-Time 等級的數據,並從中分析出交易機會,然後進行交易捕捉。網路環境其實還好,很多電商網站的訂單價格並非即時變動,不容易造成整個多模態協作巨大動態平衡困擾,要是在鏈上,這樣的挑戰幾乎無時無刻。
4)所以,整體上manus 的出現確實會在web2 領域掀起一波朋友圈焦慮,畢竟很多重複性高的文職和資訊處理工種可能會面臨被AI 取代的風險。但讓他們焦慮他們的。
這事放在web3 對DeFai 應用場景的推動作用我們得客觀認識:
必須承認:意義肯定重大,畢竟它提出的LLM OS 以及Less Structure more intelligence 理念、尤其是多重簽章系統會給web3 拓展DeFi 和AI 的結合有很大的啟迪思路。
這其實修正了大部分DeFai 專案的重大迷思,不要上來就想依賴一個大模型來實現AI Agent 自主化思考+ 決策等複雜目標,這在金融場景下,根本不切實際。
真正DeFai 願景的實現需要解決單體AI 模型能力上限、多模態交互協作原子性保證、多模態系統統一資源調度和支配、系統容錯和故障處理機制等等複雜問題。
例如:Oracle 層Agent,負責收集鏈上資料和分析,並監控價格,形成有效資料來源;
決策層Agent,根據Oracle 餵過來的資料進行分析和風險評估,並制定一套決策和行動方案;
執行層Agent,根據決策層給出的多種方案,並考慮實際情況進行執行,包括gas 費用優化、跨鏈狀態、交易排序衝突等等。
唯有這一系列的Agent 都同步強大,並有一個龐大的系統框架落定,一個真正的DeFai 革命才會掀起。
manus 給web3 產業真正的衝擊是什麼?不是技術碾壓,而是精神和靈魂打擊!說實在的,有些話憋在心裡許久了,藉機不吐不快:
1)原本我不懂web2產業的人對web3 AI Agent 不屑一顧,但當web3 AI Agent 一地雞毛的時候,看著web2領域層出不窮的技術和應用創新,我不得不認清一個事實。我們堅守的 AI +Crypto 願景沒有錯,但當前web3領域充斥大量的混子,存在不少以長期主義 Builder 之名玩發 MEME 割韭菜的垃圾項目;
2)原本我想說需要給市場更多的信心,創新一直在路上,但時間久了我發現,成堆的項目出來後,吹起幾百億美金的泡沫,泡沫破裂的時候,不僅會傷害每一個長期主義持幣的 Holder,對一些混亂之中可能還心存一絲 Build 想法的從業者也是傷害。持續的 Dump,正在毀掉業界最底層的信心。被清退的不只歸零的幣價,沒準還有一大批原本心懷激情創業的優秀團隊;劣幣驅逐良幣的局面,沒有贏家!
3)原本可能我們都高估的web3 AI Agent 的創新能力。短時間內把 AI Agent 的自主化,AI Agent 獨立交易決策,AI Agent 遊戲 NPC 嵌入,AI Agent 元宇宙建模交互等等 AI +Crypto 創新夢都做了一遍。結果卻發現,大部分規劃和願景都是烏托邦式的自說自話,甚至在提 Proposal 之前都沒評估過可行性。結果餅畫的又圓又大,一場速通下來,幣價被砸沒了,原本勾勒的技術願景和 Roadmap,也 give a shit 了;真心,忘記大的要來了,做好web2創新梯隊的跟隨者,就已經很不錯了。
4)原本都很驕傲web3的 Tokenomics 的無與倫比吸引力和對web2優秀人才的吸引力,但看到 DeepSeek、宇樹科技還有今天刷屏的 manus 背後的團隊,基本都是清華、北大、中科院等計算機、電子工程等博士資歷。再看看 Crypto AI 圈的開發者團隊,要嘛是web2失落的開發者來web3找捷徑,要嘛是web3領域一直蛇鼠一窩的敘事詐騙慣犯,要嘛就是有技術實力但得不到應有重視的web3邊緣開發者。就「人才」這一關,拿什麼和web2比創新速度。如果純 Tokenomics 發幣是一切 Build 動力的源泉,那同樣也是殺死一切的禍根;
5)原本我以為web3 AI Agent 最大的困局在於時間,彷彿時間就是能治癒一切的良方。但,現在我知道錯了。如果底層價值創造的想法不重塑,時間只會帶來下一個更大的泡沫,並不能改變什麼。好了,現在web2帶來了多模態對單模態的迭代,帶來了用決策+行動分離的理念創新,帶來了用 LLM OS + 開源組合的框架操作系統躍遷。 web3的框架和標準、DeFai、GamFai、MetAiverse、鏈化等等創新 build 命題和路徑方向,清清楚楚的給指明方向了,很期待,究竟什麼樣的團隊能夠率先殺出重圍,給web3 AI Agent 帶來一絲生機。