Tác giả gốc: Nhà nghiên cứu Zeke của YBB Capital
1. Sở thích cái mới và không thích cái cũ bắt đầu bằng sự chú ý
Trong năm qua, lĩnh vực mã hóa dần trở thành trò chơi thu hút sự chú ý do tường thuật lớp ứng dụng không thể bắt kịp tốc độ bùng nổ cơ sở hạ tầng. Từ Silly Dragon đến Goat, từ Pump.fun đến Clanker, cuộc chiến giành sự chú ý ngày càng gay gắt. Bắt đầu với nhận thức bắt mắt sáo rỗng nhất, nó nhanh chóng chuyển sang mô hình nền tảng trong đó người yêu cầu và nhà cung cấp sự chú ý được hợp nhất, và sau đó các sinh vật dựa trên silicon trở thành nhà cung cấp nội dung mới. Trong số các nhà cung cấp Meme Coin kỳ lạ khác nhau, cuối cùng cũng có một sự tồn tại có thể cho phép các nhà đầu tư bán lẻ và VC đạt được sự đồng thuận: AI Agent.
Sự chú ý cuối cùng là một trò chơi có tổng bằng 0, nhưng sự đầu cơ thực sự có thể khiến mọi thứ trở nên điên rồ. Trong bài viết về UNI, chúng tôi đã xem xét sự khởi đầu của kỷ nguyên vàng cuối cùng của blockchain. Lý do cho sự phát triển nhanh chóng của DeFi bắt nguồn từ kỷ nguyên khai thác LP được bắt đầu bởi Composite Finance, được thực hiện trong nhiều nhóm khai thác khác nhau với hàng nghìn hoặc thậm chí hàng chục. của hàng nghìn Apy. Vào và ra là cách chơi trò chơi nguyên thủy nhất trên chuỗi trong thời kỳ đó, mặc dù tình huống cuối cùng là nhiều nhóm khai thác khác nhau bị sập và phủ đầy lông vũ. Tuy nhiên, làn sóng khai thác vàng điên cuồng đã thực sự để lại tính thanh khoản chưa từng có trong blockchain. DeFi cuối cùng đã thoát khỏi hoạt động đầu cơ thuần túy và hình thành một hướng đi trưởng thành, đáp ứng nhu cầu tài chính của người dùng về mọi mặt như thanh toán, giao dịch, chênh lệch giá và đặt cược. Đặc vụ AI cũng đang trải qua giai đoạn man rợ này ở giai đoạn này. Điều chúng tôi đang khám phá là làm thế nào Crypto có thể tích hợp AI tốt hơn và cuối cùng đẩy lớp ứng dụng lên một tầm cao mới.
2. Làm thế nào để một tác nhân thông minh trở nên tự chủ?
Trong bài viết trước, chúng tôi đã giới thiệu ngắn gọn về nguồn gốc của AI Meme: Truth Terminal và tầm nhìn của chúng tôi về tương lai của Tác nhân AI. Bài viết này trước tiên tập trung vào chính Tác nhân AI.
Hãy bắt đầu với định nghĩa về AI Agent. Theo định nghĩa ngày nay, AI Agent gần hơn với một tác nhân thông minh, tức là thiết lập một hệ thống cho một mô hình lớn để bắt chước quá trình ra quyết định của con người. Trong giới học thuật, hệ thống này được coi là hướng đi hứa hẹn nhất đối với AGI (Trí tuệ nhân tạo tổng hợp). .
Ở phiên bản GPT đầu tiên, chúng ta có thể nhận thấy rõ ràng rằng mô hình lớn rất giống con người, nhưng khi trả lời nhiều câu hỏi phức tạp, mô hình lớn chỉ có thể đưa ra một số câu trả lời mang tính suy đoán. Nguyên nhân cơ bản là mô hình lớn lúc đó dựa trên xác suất chứ không phải quan hệ nhân quả. Thứ hai, nó thiếu khả năng sử dụng công cụ, trí nhớ, lập kế hoạch, v.v. và AI Agent có thể bù đắp cho những thiếu sót này. Vậy tóm lại bằng một công thức, AI Agent (tác nhân thông minh) = LLM (mô hình lớn) + Lập kế hoạch (lập kế hoạch) + Bộ nhớ (bộ nhớ) + Công cụ (công cụ).
Mô hình lớn dựa trên các từ nhắc nhở (Prompt) giống một người tĩnh hơn khi chúng ta nhập nó và mục tiêu của tác nhân thông minh là một người thực hơn. Các tác nhân thông minh hiện tại trong vòng tròn chủ yếu là các mô hình được tinh chỉnh dựa trên phiên bản mã nguồn mở Llama 70 b hoặc 405 b của Meta (cả hai đều có các tham số khác nhau). Chúng có khả năng ghi nhớ và sử dụng các công cụ truy cập API, nhưng có thể cần sự trợ giúp của con người. hoặc đầu vào (bao gồm sự tương tác, cộng tác với các tác nhân khác), nên có thể thấy các tác nhân chính trong vòng kết nối ngày nay vẫn tồn tại trên mạng xã hội dưới dạng KOL. Để làm cho một tác nhân thông minh giống con người hơn, nó cần có khả năng lập kế hoạch và hành động, đồng thời chuỗi tư duy phụ trong việc lập kế hoạch là đặc biệt quan trọng.
3. Chuỗi suy nghĩ (CoT)
Khái niệm Chuỗi tư duy (CoT) lần đầu tiên xuất hiện trong bài báo Chuỗi tư duy thúc đẩy suy luận trong các mô hình ngôn ngữ lớn do Google xuất bản vào năm 2022. Bài báo chỉ ra rằng mô hình này có thể được nâng cao bằng cách tạo ra một loạt các phản hồi trung gian. các bước suy luận Khả năng suy luận giúp mô hình hiểu rõ hơn và giải quyết các vấn đề phức tạp.
Một CoT Nhắc điển hình bao gồm ba phần: hướng dẫn rõ ràng, mô tả nhiệm vụ, cơ sở logic, nền tảng lý thuyết hoặc ví dụ nguyên tắc để hỗ trợ giải pháp nhiệm vụ và trình diễn giải pháp có cấu trúc cụ thể này giúp mô hình hiểu được các yêu cầu nhiệm vụ và dần dần tiếp cận chúng thông qua lý luận logic. . câu trả lời, do đó nâng cao hiệu quả và độ chính xác của việc giải quyết vấn đề. CoT đặc biệt phù hợp với các nhiệm vụ yêu cầu phân tích chuyên sâu và lý luận nhiều bước, chẳng hạn như giải bài toán, viết báo cáo dự án và các nhiệm vụ đơn giản khác có thể không mang lại lợi thế rõ ràng, nhưng đối với các nhiệm vụ phức tạp, nó có thể cải thiện đáng kể hiệu suất. của mô hình, thông qua các chiến lược Giải quyết từng bước giúp giảm tỷ lệ lỗi và nâng cao chất lượng hoàn thành nhiệm vụ.
Khi xây dựng AI Agent, CoT đóng vai trò then chốt. AI Agent cần hiểu thông tin nhận được và đưa ra quyết định hợp lý phù hợp, giúp Agent xử lý và phân tích thông tin đầu vào một cách hiệu quả bằng cách đưa ra cách suy nghĩ có trật tự và chuyển hóa kết quả phân tích thành. Cách tiếp cận này không chỉ nâng cao độ tin cậy và hiệu quả trong việc ra quyết định của Tác nhân mà còn tăng tính minh bạch của quá trình ra quyết định, giúp hành vi của Tác nhân dễ dự đoán và theo dõi hơn bằng cách phân tách các nhiệm vụ thành các bước nhỏ. Mỗi điểm quyết định đều được xem xét cẩn thận nhằm giảm thiểu các quyết định sai lầm do quá tải thông tin gây ra. CoT giúp quá trình ra quyết định của Đại lý trở nên minh bạch hơn và giúp người dùng dễ dàng hiểu được cơ sở đưa ra quyết định của Đại lý hơn. Khi tương tác với môi trường, CoT cho phép Tác nhân liên tục tìm hiểu thông tin mới và điều chỉnh các chiến lược hành vi.
Là một chiến lược hiệu quả, CoT không chỉ cải thiện khả năng suy luận của các mô hình ngôn ngữ lớn mà còn đóng vai trò quan trọng trong việc xây dựng các Tác nhân AI thông minh và đáng tin cậy hơn. Bằng cách tận dụng CoT, các nhà nghiên cứu và nhà phát triển có thể tạo ra các hệ thống thông minh có khả năng thích ứng tốt hơn với các môi trường phức tạp và có mức độ tự chủ cao. CoT đã chứng minh những ưu điểm độc đáo của nó trong các ứng dụng thực tế, đặc biệt là khi xử lý các nhiệm vụ phức tạp bằng cách phân tách nhiệm vụ thành một loạt các bước nhỏ, nó không chỉ cải thiện độ chính xác của việc giải quyết nhiệm vụ mà còn nâng cao khả năng diễn giải và khả năng kiểm soát của mô hình. . Cách tiếp cận từng bước này để giải quyết vấn đề có thể làm giảm đáng kể các quyết định sai lầm do thông tin quá nhiều hoặc quá phức tạp gây ra khi phải đối mặt với các nhiệm vụ phức tạp. Đồng thời, cách tiếp cận này cũng cải thiện khả năng truy xuất nguồn gốc và kiểm chứng của toàn bộ giải pháp.
Chức năng cốt lõi của CoT là tích hợp lập kế hoạch, hành động và quan sát, thu hẹp khoảng cách giữa lý luận và hành động. Chế độ tư duy này cho phép Tác nhân AI đưa ra các biện pháp đối phó hiệu quả khi dự đoán các tình huống bất thường mà chúng có thể gặp phải, cũng như tích lũy thông tin mới khi tương tác với môi trường bên ngoài, xác minh các dự đoán đã đặt trước và đưa ra cơ sở lý luận mới. CoT giống như một công cụ ổn định và chính xác mạnh mẽ giúp Tác nhân AI duy trì hiệu quả làm việc hiệu quả trong môi trường phức tạp.
4. Đúng nhu cầu giả
Crypto sẽ tích hợp những khía cạnh nào của ngăn xếp công nghệ AI? Trong bài viết năm ngoái, tôi tin rằng việc phân cấp sức mạnh tính toán và dữ liệu là một bước quan trọng để giúp các doanh nghiệp nhỏ và nhà phát triển cá nhân tiết kiệm chi phí. Trong cuộc đua phân khúc Crypto x AI năm nay do Coinbase tổ chức, chúng tôi đã thấy sự phân chia chi tiết hơn:
(1) Lớp điện toán (chỉ mạng tập trung vào việc cung cấp tài nguyên bộ xử lý đồ họa (GPU) cho các nhà phát triển AI);
(2) Lớp dữ liệu (đề cập đến mạng hỗ trợ truy cập phi tập trung, điều phối và xác minh các đường dẫn dữ liệu AI);
(3) Lớp Middleware (đề cập đến nền tảng hoặc mạng hỗ trợ phát triển, triển khai và lưu trữ các mô hình hoặc tác nhân AI);
(4) Lớp ứng dụng (đề cập đến các sản phẩm hướng đến người dùng sử dụng cơ chế AI trên chuỗi, cho dù là B2B hay B2C).
Mỗi cấp trong số bốn cấp phân chia này đều có một tầm nhìn lớn và tất cả các mục tiêu của nó đều nhằm chống lại kỷ nguyên tiếp theo của những gã khổng lồ ở Thung lũng Silicon thống trị Internet. Như tôi đã nói năm ngoái, chúng ta có thực sự phải chấp nhận sự kiểm soát độc quyền về sức mạnh tính toán và dữ liệu của những gã khổng lồ ở Thung lũng Silicon không? Mô hình lớn nguồn đóng dưới sự độc quyền của họ là một chiếc hộp đen bên trong. Khoa học là tôn giáo phổ biến nhất của nhân loại ngày nay. Trong tương lai, mọi câu trả lời của mô hình lớn sẽ được đông đảo mọi người coi là sự thật, nhưng điều này. sự thật nên làm thế nào để xác minh? Theo tầm nhìn của những gã khổng lồ ở Thung lũng Silicon, các tác nhân thông minh cuối cùng sẽ có những quyền ngoài sức tưởng tượng, chẳng hạn như quyền thanh toán bằng ví của bạn và quyền sử dụng thiết bị đầu cuối. Làm thế nào để đảm bảo rằng mọi người không có ý đồ xấu?
Phân cấp là câu trả lời duy nhất, nhưng đôi khi chúng ta có cần xem xét hợp lý một cách toàn diện xem có bao nhiêu người mua cho những tầm nhìn lớn lao này? Trước đây, chúng ta có thể sử dụng Token để bù đắp những lỗi do lý tưởng hóa gây ra mà không tính đến các vòng khép kín thương mại. Tình hình ngày nay rất nghiêm trọng và Crypto x AI cần được thiết kế dựa trên tình hình thực tế. Ví dụ, làm thế nào để hai đầu của lớp sức mạnh tính toán có thể cân bằng khi hiệu suất bị mất và không ổn định? Để phù hợp với khả năng cạnh tranh của đám mây tập trung. Sẽ có bao nhiêu người dùng thực trong dự án lớp dữ liệu? Làm cách nào để xác minh tính hợp lệ thực sự của dữ liệu được cung cấp? Điều tương tự cũng áp dụng cho hai cấp độ còn lại. Trong thời đại này, chúng ta không cần quá nhiều nhu cầu giả có vẻ đúng.
5. Meme hết SocialFi
Như tôi đã nói ở đoạn đầu tiên, Meme đã phát triển một hình thức SocialFi tương thích với Web3 một cách cực nhanh. Friend.tech là Dapp đầu tiên ra mắt vòng ứng dụng xã hội này, nhưng nó đã bị đánh bại bởi thiết kế Token háo hức. Pump.fun đã xác minh tính khả thi của một nền tảng thuần túy không có bất kỳ mã thông báo hoặc quy tắc nào. Người yêu cầu và nhà cung cấp sự chú ý là thống nhất. Bạn có thể đăng meme, phát sóng trực tiếp, gửi tiền, để lại tin nhắn và giao dịch trên nền tảng. Mọi thứ đều miễn phí. Điều này về cơ bản phù hợp với mô hình kinh tế chú ý của các mạng xã hội như YouTube và Instagram ngày nay, ngoại trừ việc đối tượng sạc khác nhau và lối chơi của Pupm.fun giống Web3 hơn.
Bases Clanker là bậc thầy của tất cả. Nhờ hệ sinh thái tích hợp do hệ sinh thái đích thân quản lý, Base có Dapp xã hội của riêng mình như một công cụ hỗ trợ để hình thành một vòng khép kín nội bộ hoàn chỉnh. Meme thông minh là dạng 2.0 của Meme Coin Mọi người luôn tìm kiếm những ý tưởng mới và Pump.fun hiện đang đi đầu. Đánh giá theo xu hướng, việc những ý tưởng ngẫu nhiên của các sinh vật dựa trên silicon thay thế chỉ còn là vấn đề thời gian. những meme thô tục về các sinh vật dựa trên carbon.
Tôi đã nhắc đến Base không biết bao nhiêu lần, nhưng mỗi lần nó được nhắc đến trong một bối cảnh khác nhau, Base không bao giờ là người dẫn đầu trên dòng thời gian, nhưng nó luôn là người chiến thắng.
6. Một tác nhân thông minh có thể là gì khác?
Từ quan điểm thực dụng, các tác nhân không thể được phân cấp trong thời gian dài trong tương lai. Đánh giá từ việc xây dựng các tác nhân trong lĩnh vực AI truyền thống, không thể giải quyết được bằng cách đơn giản là phân cấp quy trình lý luận và nguồn mở. là nó cần truy cập vào nhiều API khác nhau để truy cập nội dung Web2. Chi phí vận hành của nó rất tốn kém. Việc thiết kế chuỗi tư duy và sự cộng tác của nhiều tác nhân thường vẫn dựa vào con người làm phương tiện. Chúng ta sẽ trải qua một giai đoạn chuyển tiếp dài cho đến khi xuất hiện một hình thức tích hợp phù hợp, có lẽ giống như UNI. Nhưng giống như bài viết trước, tôi vẫn nghĩ rằng các tác nhân thông minh sẽ có tác động lớn đến ngành của chúng ta, giống như sự tồn tại của Cex trong ngành của chúng ta, điều này không chính xác nhưng quan trọng.
Bài báo Tổng quan về tác nhân AI do Stanford Microsoft xuất bản tháng trước mô tả rộng rãi các ứng dụng của tác nhân trong ngành y tế, máy móc thông minh và thế giới ảo. Trong phần phụ lục của bài viết này, đã có rất nhiều tác nhân GPT-4 V. Tham gia vào các trường hợp thử nghiệm phát triển trò chơi AAA hàng đầu.
Không cần phải nhấn mạnh quá nhiều vào tốc độ kết hợp của nó với sự phân quyền. Tôi hy vọng rằng câu đố đầu tiên mà tác nhân thông minh có thể hoàn thành là khả năng và tốc độ từ dưới lên. Chúng ta có rất nhiều tàn tích tường thuật và những siêu dữ liệu trống rỗng cần thiết. để điền vào. Ở giai đoạn thích hợp, chúng tôi sẽ xem xét cách biến nó thành UNI tiếp theo.
Tài liệu tham khảo
Chuỗi tư duy “nổi lên” của các mô hình lớn có khả năng gì? Tác giả: não cực thân
Tìm hiểu Agent trong một bài viết, điểm dừng chân tiếp theo cho các mô hình lớn Tác giả: LinguaMind