AI 프레임워크 해체: 지능형 에이전트에서 분산화까지 탐색-web3资讯-ODAILY

원저자 : YBB캐피털 연구원 Zeke

AI 프레임워크 해체: 지능형 에이전트에서 분산화까지 탐색

머리말

이전 기사에서 우리는 AI Meme의 현재 상태와 AI Agent의 향후 개발에 대한 우리의 견해를 여러 번 논의했습니다. 하지만 AI Agent 트랙의 서사의 급속한 발전과 드라마틱한 진화는 여전히 다소 압도적이다. 진실의 터미널이 에이전트 서머를 개봉한 지 불과 두 달 만에 AI와 암호화폐의 결합에 대한 서사는 거의 매주 바뀌었다. 최근 시장의 관심은 기술적 내러티브가 지배하는 프레임워크 프로젝트에 집중되기 시작했습니다. 지난 몇 주 동안만 해도 이 부문에서는 시장 가치가 1억, 심지어 10억이 넘는 다크호스가 많이 생산되었습니다. 이러한 유형의 프로젝트는 또한 새로운 자산 발행 패러다임을 낳았습니다. 즉, 프로젝트는 Github 코드 기반을 사용하여 코인을 발행하고 프레임워크를 기반으로 구축된 에이전트도 코인을 다시 발행할 수 있습니다. 프레임을 하단으로, 에이전트를 상단으로 설정합니다. 자산발행 플랫폼처럼 보이지만 사실은 AI시대 특유의 신흥 인프라 모델이다. 우리는 이 새로운 추세를 어떻게 조사해야 할까요? 이 글은 프레임워크의 소개부터 시작하여 이를 자신의 생각과 결합하여 AI 프레임워크가 Crypto?

1. 프레임워크란 무엇입니까?

정의에 따르면 AI 프레임워크는 복잡한 AI 모델 구축 프로세스를 단순화하기 위해 사전 구축된 모듈, 라이브러리 및 도구 세트를 통합하는 하위 수준 개발 도구 또는 플랫폼입니다. 이러한 프레임워크에는 일반적으로 데이터 처리, 모델 교육 및 예측 기능도 포함됩니다. 한마디로 프레임워크를 데스크톱 운영체제의 윈도우와 리눅스, 모바일 단말의 iOS와 안드로이드 등 AI 시대의 운영체제로 간단히 이해할 수도 있다. 각 프레임워크에는 고유한 장점과 단점이 있으며 개발자는 특정 요구 사항에 따라 자유롭게 선택할 수 있습니다.

AI 프레임워크라는 용어는 암호화폐 분야에서 여전히 떠오르는 개념이지만, 그 유래로 볼 때 AI 프레임워크의 개발 과정은 실제로 2010년 테아노(Theano)가 탄생한 이후 약 14년에 가깝다. 전통적인 AI 분야에는 Google의 TensorFlow, Meta의 Pytorch, Baidu의 Flying Paddle, Byte의 MagicAnimate 등 학계와 업계 모두에서 선택할 수 있는 매우 성숙한 프레임워크가 이미 있습니다.

현재 Crypto에서 등장하는 프레임워크 프로젝트는 AI 붐이 시작될 때 수많은 에이전트 요구 사항을 기반으로 구축되었으며 다른 Crypto 트랙에서 파생되어 결국 다양한 하위 부문에서 AI 프레임워크를 형성했습니다. 이 문장을 확장하기 위해 현재 서클의 여러 주류 프레임워크를 예로 들어 보겠습니다.

1.1 엘리자

AI 프레임워크 해체: 지능형 에이전트에서 분산화까지 탐색

먼저 ai16z의 Eliza를 예로 들어 보겠습니다. 이 프레임워크는 자율 AI 에이전트를 생성, 배포 및 관리하는 데 특별히 사용되는 다중 에이전트 시뮬레이션 프레임워크입니다. 프로그래밍 언어로서 TypeScript를 기반으로 개발할 때의 장점은 더 나은 호환성과 더 쉬운 API 통합입니다.

공식 문서에 따르면 Eliza의 주요 목표 시나리오는 다중 플랫폼 통합 지원과 같은 소셜 미디어입니다. 프레임워크는 모든 기능을 갖춘 Discord 통합을 제공하고 음성 채널, X/Twitter 플랫폼의 자동화된 계정, Telegram 통합 및 직접 API를 지원합니다. . 입장. 미디어 콘텐츠 처리 측면에서는 PDF 문서 읽기 및 분석, 링크 콘텐츠 추출 및 요약, 오디오 전사, 비디오 콘텐츠 처리, 이미지 분석 및 설명, 대화 요약을 지원합니다.

현재 Eliza가 지원하는 사용 사례는 주로 네 가지 범주로 나뉩니다.

AI 보조 애플리케이션: 고객 지원 에이전트, 커뮤니티 관리자, 개인 비서;
소셜 미디어 역할: 자동화된 콘텐츠 제작자, 대화형 봇, 브랜드 대표;
지식 근로자: 연구 보조원, 콘텐츠 분석가, 문서 처리자
인터랙티브 캐릭터: 롤플레잉 캐릭터, 교육 상담사, 엔터테인먼트 로봇.

Eliza는 현재 다음 모델을 지원합니다.

오픈 소스 모델 로컬 추론: Llama 3, Qwen 1.5, BERT 등;
OpenAI의 API를 사용한 클라우드 기반 추론
기본 구성은 Nous Hermes Llama 3.1 B입니다.
복잡한 쿼리를 위해 Claude와 통합하세요.

1.2 게임

GAME(Generative Autonomous Multimodal Entities Framework)은 Virtual이 출시한 자동 생성 및 관리를 위한 다중 모드 AI 프레임워크로, 게임 내 지능형 NPC 설계가 주요 장면입니다. 코드가 없어도 기본 사용자도 사용할 수 있습니다. 평가판 인터페이스에 따르면 사용자는 에이전트 설계에 참여하기 위해 매개변수만 수정하면 됩니다.

AI 프레임워크 해체: 지능형 에이전트에서 분산화까지 탐색

프로젝트 아키텍처 측면에서 GAME의 핵심 디자인은 여러 하위 시스템을 사용하여 함께 작동하는 모듈형 디자인입니다. 자세한 아키텍처는 다음과 같습니다.

AI 프레임워크 해체: 지능형 에이전트에서 분산화까지 탐색

Agent Prompting Interface: 개발자가 AI 프레임워크와 상호작용하기 위한 인터페이스입니다. 이 인터페이스를 통해 개발자는 세션을 초기화하고 세션 ID, 에이전트 ID, 사용자 ID와 같은 매개변수를 지정할 수 있습니다.
인식 하위 시스템: 인식 하위 시스템은 입력 정보를 수신하고 이를 합성하여 전략 계획 엔진으로 보내는 역할을 담당합니다. 또한 대화 처리 모듈의 응답을 처리합니다.
전략 계획 엔진: 전략 계획 엔진은 전체 프레임워크의 핵심 부분으로 상위 수준 계획자(High Level Planner)와 하위 수준 정책(Low Level Policy)으로 구분됩니다. 높은 수준의 계획자는 장기 목표와 계획을 개발하고, 낮은 수준의 전략은 이러한 계획을 구체적인 실행 단계로 변환합니다.
World Context: 월드 컨텍스트에는 환경 정보, 세계 상태, 게임 상태 등의 데이터가 포함됩니다. 이 정보는 에이전트가 현재 상황을 이해하는 데 사용됩니다.
대화 처리 모듈: 대화 처리 모듈은 메시지 및 응답 처리를 담당하며 출력으로 대화 또는 반응을 생성할 수 있습니다.
온체인 지갑 운영자: 온체인 지갑 운영자는 블록체인 기술의 적용 시나리오에 관여할 수 있으며 구체적인 기능은 불분명합니다.
학습 모듈: 학습 모듈은 피드백을 통해 학습하고 에이전트의 지식 기반을 업데이트합니다.
작업 메모리: 작업 메모리는 에이전트의 최근 작업, 결과 및 현재 계획과 같은 단기 정보를 저장합니다.
장기 메모리 프로세서: 장기 메모리 프로세서는 에이전트와 해당 작업 메모리에 대한 중요한 정보를 추출하고 중요도 점수, 최근성 및 관련성과 같은 요소에 따라 순위를 매기는 역할을 합니다.
에이전트 저장소: 에이전트 저장소는 에이전트의 목표, 반성, 경험, 성격 및 기타 속성을 저장합니다.
행동 계획자(Action Planner): 행동 계획자는 낮은 수준의 전략을 기반으로 구체적인 행동 계획을 생성합니다.
계획 실행자: 계획 실행자는 실행 계획자가 생성한 실행 계획을 실행하는 일을 담당합니다.

작업 흐름: 개발자는 에이전트 프롬프트 인터페이스를 통해 에이전트를 시작하고 인식 하위 시스템은 입력을 받아 이를 전략 계획 엔진에 전달합니다. 전략 계획 엔진은 메모리 시스템, 세계 컨텍스트 및 에이전트 라이브러리의 정보를 사용하여 실행 계획을 개발하고 실행합니다. 학습 모듈은 에이전트의 작업 결과를 지속적으로 모니터링하고 결과에 따라 에이전트의 동작을 조정합니다.

적용 시나리오: 전체 기술 아키텍처의 관점에서 볼 때 이 프레임워크는 주로 가상 환경에서 에이전트의 의사 결정, 피드백, 인식 및 성격에 중점을 두고 있으며 게임 외에도 적용 가능합니다. Metaverse 아래 목록에서 이미 이 프레임워크를 사용하여 수많은 프로젝트가 구축되었음을 확인할 수 있습니다.

1.3리그

AI 프레임워크 해체: 지능형 에이전트에서 분산화까지 탐색

Rig는 LLM(대형 언어 모델) 애플리케이션 개발을 단순화하도록 설계된 Rust로 작성된 오픈 소스 도구입니다. 이를 통해 개발자는 통합 운영 인터페이스를 제공하여 여러 LLM 서비스 제공자(예: OpenAI 및 Anthropic) 및 다양한 벡터 데이터베이스(예: MongoDB 및 Neo 4 j)와 쉽게 상호 작용할 수 있습니다.

핵심 기능:

통합 인터페이스: 어떤 LLM 제공업체나 벡터 저장소에 관계없이 Rig는 일관된 액세스 방법을 제공하여 통합 작업의 복잡성을 크게 줄일 수 있습니다.
모듈형 아키텍처: 프레임워크는 공급자 추상화 계층, 벡터 저장 인터페이스 및 지능형 에이전트 시스템과 같은 핵심 부분을 포함하는 모듈형 설계를 채택하여 시스템의 유연성과 확장성을 보장합니다.
유형 안전성: Rust의 기능을 활용하여 유형이 안전한 임베딩 작업을 구현하고 코드 품질과 런타임 보안을 보장합니다.
효율적인 성능: 비동기 프로그래밍 모드를 지원하고 동시 처리 기능을 최적화하며 내장된 로깅 및 모니터링 기능은 유지 관리 및 문제 해결에 도움이 됩니다.

작업 흐름: 사용자 요청이 Rig 시스템에 들어오면 먼저 공급자 추상화 계층을 거치게 됩니다. 이 계층은 여러 공급자 간의 차이점을 표준화하고 오류 처리의 일관성을 보장하는 일을 담당합니다. 다음으로 코어 계층에서 지능형 에이전트는 다양한 도구를 호출하거나 벡터 저장소에 쿼리하여 필요한 정보를 얻을 수 있습니다. 마지막으로 시스템은 검색 증강 생성(RAG)과 같은 고급 메커니즘을 통해 문서 검색과 컨텍스트 이해를 결합하여 사용자에게 반환하기 전에 정확하고 의미 있는 응답을 생성할 수 있습니다.

응용 시나리오: Rig는 빠르고 정확한 답변이 필요한 질문 응답 시스템을 구축하는 데 적합할 뿐만 아니라 효율적인 문서 검색 도구, 상황 인식 챗봇 또는 가상 도우미를 만드는 데에도 사용할 수 있으며 기존 데이터 패턴을 기반으로 콘텐츠 생성을 지원하는 데에도 사용할 수 있습니다. .텍스트나 기타 형태의 콘텐츠를 자동으로 생성합니다.

1.4 제레파이

AI 프레임워크 해체: 지능형 에이전트에서 분산화까지 탐색

ZerePy는 X(이전의 Twitter) 플랫폼에서 AI 에이전트를 배포하고 관리하는 프로세스를 단순화하도록 설계된 Python 기반 오픈 소스 프레임워크입니다. Zerebro 프로젝트에서 탄생하여 핵심 기능을 상속받았지만 보다 모듈화되고 쉽게 확장 가능한 방식으로 설계되었습니다. 목표는 개발자가 개인화된 AI 에이전트를 쉽게 만들고 X에서 다양한 자동화된 작업과 콘텐츠 생성을 구현할 수 있도록 하는 것입니다.

ZerePy는 사용자가 배포된 AI 에이전트 1을 쉽게 관리하고 제어할 수 있도록 명령줄 인터페이스(CLI)를 제공합니다. 핵심 아키텍처는 모듈식 설계를 기반으로 하므로 개발자는 다음과 같은 다양한 기능 모듈을 유연하게 통합할 수 있습니다.

LLM 통합: ZerePy는 OpenAI 및 Anthropic의 LLM(대형 언어 모델)을 지원하므로 개발자는 애플리케이션 시나리오에 가장 적합한 모델을 선택할 수 있습니다. 이를 통해 에이전트는 고품질 텍스트 콘텐츠를 생성할 수 있습니다.
X 플랫폼 통합: 프레임워크는 X 플랫폼의 API를 직접 통합하여 에이전트가 게시, 답장, 좋아요, 전달과 같은 작업을 수행할 수 있도록 합니다.
모듈형 연결 시스템: 이 시스템을 통해 개발자는 다른 소셜 플랫폼이나 서비스에 대한 지원을 쉽게 추가하고 프레임워크의 기능을 확장할 수 있습니다.
메모리 시스템(향후 계획): 현재 버전에서는 완전히 구현되지 않을 수 있지만 ZerePy의 설계 목표에는 에이전트가 이전 상호 작용 및 상황 정보를 기억하여 보다 일관되고 개인화된 콘텐츠를 생성할 수 있도록 메모리 시스템을 통합하는 것이 포함됩니다.

ZerePy와 a16z의 Eliza 프로젝트는 모두 AI 에이전트 구축 및 관리에 전념하고 있지만 아키텍처와 목표가 약간 다릅니다. Eliza는 다중 에이전트 시뮬레이션과 광범위한 AI 연구에 더 중점을 두는 반면 ZerePy는 특정 소셜 플랫폼(X)에 AI 에이전트를 배포하는 프로세스를 단순화하는 데 중점을 두고 실제 애플리케이션의 단순화를 선호합니다.

2. BTC 생태계의 복제품

실제로 개발 경로 측면에서 AI Agent는 2023년 말과 2024년 초의 BTC 생태계와 많은 유사점을 가지고 있습니다. BTC 생태계의 개발 경로는 간단히 BRC 20-Atomical/Rune 및 기타 다중-생태계로 요약할 수 있습니다. 바빌론을 핵심으로 하는 프로토콜 경쟁-BTC L2-to-BTCFi. AI 에이전트는 성숙한 기존 AI 기술 스택을 기반으로 더욱 빠르게 발전했지만 전반적인 개발 경로는 BTC 생태계와 많은 유사점을 가지고 있습니다. 다음과 같이 간략하게 요약하겠습니다. GOAT/ACT-소셜 에이전트/분석 AI 에이전트와 유사한 프레임워크. 경쟁. 추세 측면에서 볼 때, 에이전트 분산화 및 보안에 초점을 맞춘 인프라 프로젝트는 이러한 프레임워크 열풍의 물결을 이어받아 다음 단계의 주요 주제가 될 가능성이 높습니다.

그렇다면 이 트랙은 BTC 생태계처럼 균질화되고 거품이 생길까요? 우선 AI Agent의 서사는 스마트 컨트랙트 체인의 역사를 재현하려는 것이 아니다. 둘째, 기존 AI 프레임워크 프로젝트가 기술적으로 강력하거나 PPT 단계나 ctrl C+에서 정체되어 있는지 여부이다. Ctrl v를 누르면 최소한 인프라 개발을 위한 새로운 아이디어를 제공합니다. 많은 기사에서 AI 프레임워크를 자산 발행 플랫폼에, 에이전트를 자산에 비교하고 있습니다. 실제로 Memecoin Launchpad 및 Inscription Protocol과 비교하면 AI 프레임워크가 미래의 퍼블릭 체인에 더 가깝다고 생각합니다. 에이전트는 미래의 Dapp에 더 가깝습니다.

오늘날의 암호화폐에는 수천 개의 퍼블릭 체인과 수만 개의 Dapp이 있습니다. 일반 체인 중에는 BTC, Ethereum 및 다양한 이종 체인이 있는 반면, 애플리케이션 체인의 형태는 게임 체인, 스토리지 체인, Dex 체인 등 더욱 다양합니다. 퍼블릭 체인은 AI 프레임워크에 해당한다. 사실 둘은 외관상 매우 유사하며, Dapp 역시 Agent와 매우 잘 대응할 수 있다.

AI 시대의 암호화폐는 이러한 형태로 나아갈 가능성이 매우 높습니다. 향후 논쟁도 EVM과 이종 체인 간의 논쟁에서 프레임워크에 대한 논쟁으로 옮겨갈 것입니다. 이런 점에서 후속 AI 인프라 프로젝트가 이를 기반으로 시작될 것이라고 생각합니다. 또 다른 점은 블록체인에서 이를 수행하는 이유가 무엇입니까?

3. 와인딩의 의미는 무엇입니까?

블록체인이 무엇과 결합되든 결국에는 다음과 같은 질문에 직면하게 될 것입니다. 그것이 말이 되는가? 작년 기사에서는 GameFi가 말보다 카트를 앞세우고 Infra가 고급 개발로 전환하고 있다고 비판한 바 있습니다. 이전 AI 관련 기사에서도 현 단계에서 AI x Crypto의 결합에 대해 낙관적이지 않다는 점을 밝혔습니다. . 결국, 전통적인 프로젝트의 경우 내러티브의 원동력이 점점 약해졌습니다. 작년에 통화 가격에서 좋은 성과를 거둔 소수의 전통 프로젝트는 기본적으로 통화 가격과 일치하거나 초과할 수 있는 능력을 갖추고 있습니다. AI는 암호화폐에 어떤 용도로 사용될 수 있나요? 예전에 생각했던 것은 구현의도를 대신해 운영되는 Agent, Metaverse, 직원으로서의 Agent 등 상대적으로 흔하면서도 수요가 많은 아이디어였습니다. 그러나 이러한 요구 사항이 체인에 완전히 연결될 필요는 없으며 비즈니스 논리 관점에서 루프를 닫을 수 없습니다. 이전 호에서 언급한 에이전트 브라우저 구현 의도는 실제로 데이터 라벨링, 추론 컴퓨팅 성능 등에 대한 요구 사항을 도출할 수 있습니다. 그러나 이 둘의 조합은 아직 충분히 가깝지 않으며 컴퓨팅 성능 부분은 여전히 많은 분야에서 중앙 집중식 컴퓨팅 성능에 의해 지배되고 있습니다. 측면.

AI 프레임워크 해체: 지능형 에이전트에서 분산화까지 탐색

DeFi의 성공을 다시 생각해보세요. DeFi가 기존 금융의 파이를 차지할 수 있는 이유는 접근성이 높고 효율성이 높으며 비용이 저렴하고 중앙 집중화에 대한 신뢰가 필요하지 않은 보안 때문입니다. 이런 생각을 해보면 Agent Chaining을 지원하는 데에는 여러 가지 이유가 있을 수 있다고 생각합니다.

1. 에이전트 체인을 통해 사용 비용을 낮추고 접근성과 선택성을 높일 수 있습니까? 마지막으로, 주요 Web2 회사에만 독점적으로 속하는 AI 임대권은 일반 사용자가 참여할 수 있게 됩니다.

2. 보안 에이전트의 가장 간단한 정의에 따르면 에이전트라고 할 수 있는 AI는 가상 또는 현실 세계와 상호 작용할 수 있어야 합니다. 에이전트가 현실이나 내 가상 지갑에 개입할 수 있다면 블록체인 기반 보안이 필요합니다. 해결책 이는 엄격한 요구 사항으로 간주될 수도 있습니다.

3. 에이전트가 블록체인 고유의 금융 게임플레이 세트를 구현할 수 있나요? 예를 들어 AMM의 LP를 사용하면 일반 사람들이 자동 시장 형성에 참여할 수 있습니다. 예를 들어 Agent에는 컴퓨팅 능력, 데이터 라벨링 등이 필요하며 사용자는 낙관적이라면 U 형태로 프로토콜에 투자합니다. 또는 다양한 애플리케이션 시나리오의 에이전트를 기반으로 새로운 금융 게임플레이를 구성할 수도 있습니다.

4. 현재 DeFi에는 완벽한 상호 운용성이 없습니다. 블록체인과 결합된 에이전트가 투명하고 추적 가능한 추론을 달성할 수 있다면 이전 기사에서 언급한 전통적인 인터넷 거대 기업이 제공하는 에이전트 브라우저보다 더 매력적일 수 있습니다.

4. 창의성?

프레임워크 프로젝트는 향후 GPT Store와 유사한 창업 기회도 제공할 것입니다. 현재 프레임워크를 통해 에이전트를 게시하는 것은 일반 사용자에게는 여전히 매우 복잡하지만, 에이전트 구축 프로세스를 단순화하고 일부 복잡한 기능 조합을 제공하는 프레임워크가 앞으로도 여전히 널리 퍼져 GPT Store보다 더 흥미로운 Web3 창조 경제를 형성할 것이라고 생각합니다. .

현재 GPT 스토어는 여전히 전통적인 분야의 실용성을 선호하고, 인기 있는 앱의 대부분은 전통적인 Web2 기업이 만들고, 수익은 창작자들이 독점적으로 소유하고 있습니다. OpenAI의 공식 설명에 따르면 이 전략은 미국의 일부 뛰어난 개발자에게만 재정적 지원과 일정 금액의 보조금을 제공합니다.

Web3는 수요 측면에서 아직 채워야 할 부분이 많고, 경제 시스템은 Web2 거대 기업의 불공정한 정책을 더욱 공정하게 만들 수 있으며, 또한 Agent를 더욱 완벽하게 만들기 위해 자연스럽게 커뮤니티 경제를 도입할 수도 있습니다. 에이전트의 창조경제는 일반 사람들이 참여할 수 있는 기회가 될 것이며, 미래의 AI 밈은 GOAT와 Clanker에 출시된 에이전트보다 훨씬 더 스마트하고 흥미로울 것입니다.

참고 기사:

1. AI 프레임워크의 역사적 진화와 동향 탐색

2.Bybit: AI Rig Complex(ARC): AI 에이전트 프레임워크

3. Deep Value Memetics: 4가지 주요 Crypto×AI 프레임워크의 수평적 비교: 채택 상태, 장단점, 성장 잠재력

4. 엘리자 공식 문서

5. 가상 공식 문서