マルチエージェントの詳細な分析: Web3 と AI は最終的に相互に成功を収めるのでしょうか?-web3资讯-ODAILY

AIGC がコンテンツ生成のインテリジェント時代を切り開くのであれば、AI エージェントは AIGC の機能を真に製品化する機会を得ることができます。

AI エージェントは、人工知能ロボットの原形と呼ばれる、より具体的な万能従業員のようなもので、人間と同じように周囲の環境を観察し、判断し、自動的に行動することができます。

ビル・ゲイツはかつて率直にこう言いました。「AI エージェントを制御することが本当の成果です。その頃には、オンラインで直接情報を検索する必要はなくなります。AI 分野の権威ある専門家も、AI の可能性について大きな期待を抱いています。」 AIエージェント。 Microsoft CEO Satya Nadella はかつて、AI Agent がユーザーのニーズを理解し、積極的にサービスを提供できる、人間とコンピューターの対話の主要な手段になるだろうと予測しました。また、Ng Enda 教授は、将来の作業環境では、人間と AI エージェントがより緊密に連携して、効率的な作業モデルを形成し、効率を向上させるだろうと予測しています。

AI Agent はテクノロジーの産物であるだけでなく、未来の生き方や働き方の中核でもあります。

これは、Web3 とブロックチェーンが最初に広範な議論を引き起こしたとき、人々はこのテクノロジーの可能性を説明するために「破壊」という言葉をよく使っていたことを思い出させます。ここ数年を振り返ると、Web3は初期のERC-20やゼロ知識証明から、他の分野と統合されたDeFi、DePIN、GameFiなどへと徐々に発展してきました。

Web3とAIという2つのデジタル技術を組み合わせたら、1+1>2の効果は生まれるのでしょうか？資金調達規模がますます大きくなる Web3 AI プロジェクトは、業界に新たなユースケースパラダイムをもたらし、新たな真のニーズを生み出すことができるでしょうか?

AIエージェント：人類にとって最も理想的な知的アシスタント

AIエージェントの想像力はどこへ？インターネット上で広く流通している、「大きな言語モデルは貪欲な蛇しかプログラムできないが、AI エージェントは栄光の王全体をプログラムできる」という高得点の答えがあります。大げさに聞こえますが、大げさではありません。

中国ではエージェントは通常「知能体」と訳されます。この概念は、「人工知能の父」ミンスキーによって 1986 年に出版された著書『思考の社会』の中で提案されました。ミンスキーは、社会の特定の個人が交渉の末、特定の問題に対する解決策を見つけられると信じていました。エージェントです。長年にわたり、エージェントは人間とコンピュータの対話の基礎であり、Microsoft の編集アシスタント Clippy から Google ドキュメントの自動提案に至るまで、これらの初期形式のエージェントはパーソナライズされた対話の可能性を示してきましたが、より複雑なタスクを処理する能力はまだ不十分です。まだ限られています。大規模言語モデル (LLM) が登場するまで、エージェントの真の可能性を引き出すことができませんでした。

今年 5 月、AI 分野の権威ある学者である Andrew Ng 教授は、米国で開催された Sequoia AI イベントで AI エージェントに関する講演を行い、その中で彼のチームが行った一連の実験を紹介しました。

AI にコードを書いて実行させ、さまざまな LLM やワークフローからの結果を比較させます。結果は次のとおりです。

GPT-3.5モデル：精度48%
GPT-4 モデル: 精度 67%
GPT-3.5 + Agent: GPT-4 モデルよりも高性能
GPT-4 + Agent: GPT-4 モデルよりもはるかに高く、非常に優れています

マルチエージェントの詳細な分析: Web3 と AI は最終的に相互に成功を収めるのでしょうか?

確かに。 ChatGPT などの LLM を使用する場合、通常、プロンプトの単語を入力すると、大規模なモデルが自動的にエラーを特定して修正したり、削除したり書き直したりすることなく、即座に答えを生成するという方法がとられます。

比較すると、AI エージェントのワークフローは次のようになります。

まずLLMに記事の概要を書いてもらい、必要に応じてインターネットでコンテンツを検索して分析し、初稿を出力し、その原稿を読んで最適化する方法を考える、というサイクルを何度も繰り返します。そして最終的には、エラー率が最も低く、論理的で厳密な高品質の記事が出力されます。

AI エージェントと LLM の違いは、LLM と人間の間の対話がプロンプトワード (プロンプト) に基づいていることであることがわかります。 AIエージェントは目標を設定するだけで、自ら考えて目標に向かって行動することができます。与えられたタスクに基づいて計画の各ステップを詳細に分析し、外界からのフィードバックと独立した思考を頼りに、目標を達成するためのヒントを自分自身に作成します。

したがって、OpenAI による AI エージェントの定義は、認知、計画、記憶、ツールの使用を自律的に理解し、複雑なタスクを自動的に実行できる、頭脳としての LLM によって駆動されるシステムです。

AIがツールを使用する状態から、ツールを使用できる主体に変化するとき、AIエージェントになります。これが、AI エージェントが人間にとって最も理想的な知的アシスタントとなり得る理由です。たとえば、AI エージェントは、ユーザーの過去のオンラインインタラクションに基づいてユーザーの興味、好み、毎日の習慣を理解して記憶し、ユーザーの意図を特定し、積極的に提案を行い、複数のアプリケーションを調整してタスクを完了することができます。

マルチエージェントの詳細な分析: Web3 と AI は最終的に相互に成功を収めるのでしょうか?

ゲイツ氏のビジョンと同じように、将来的には、さまざまなタスクのために別のアプリケーションに切り替える必要はなくなり、ユーザーが望むデータに基づいて、通常の言語を使用してコンピュータや携帯電話に指示するだけで済みます。共有するには、AI エージェントがパーソナライズされた応答を提供します。

一人乗りのユニコーンが現実になりつつある

AI エージェントは、企業が「人間と機械のコラボレーション」を核とした新しいインテリジェントな運用モデルを作成するのにも役立ちます。ますます多くのビジネス活動が AI によって完了されるようになりますが、人間は企業のビジョン、戦略、クリティカルパスの決定にのみ集中する必要があります。

OpenAI CEOのサム・アルトマン氏がかつてインタビューでこのような説得力のある点について言及したように、AIの発展に伴い、私たちは「一人ユニコーン」、つまり一人の人間によって設立され、10億人に達する企業の時代を迎えようとしています。会社の価値は米ドルで計算されます。

空想のように聞こえますが、AI エージェントの助けを借りて、この見方は現実になりつつあります。

テクノロジー関連のスタートアップを立ち上げたいとします。従来のアプローチでは、明らかにソフトウェアエンジニア、プロダクトマネージャー、デザイナー、マーケティング担当者、販売担当者、財務担当者を雇用する必要があります。これらの担当者はそれぞれ独自の業務を行っていますが、私が調整します。

つまり、AI Agentを使えば従業員を雇う必要すらなくなるかもしれません。

Devin — 自動化プログラミング

ソフトウェアエンジニアの代わりに、今年人気の AI ソフトウェアエンジニアである Devin を使うと、フロントエンドとバックエンドの作業をすべて完了するのに役立ちます。

Devin は Cognition Labs によって開発され、「世界初の AI ソフトウェアエンジニア」として知られています。ソフトウェア開発作業全体を独立して完了し、問題を分析し、決定を下し、コードを記述し、エラーを修正することができ、これらすべてを独立して実行できます。これにより、開発者の作業負荷が大幅に軽減されます。 Devin はわずか 6 か月で 1 億 9,600 万米ドルの資金調達を受け、その評価額はすぐに数十億ドルにまで上昇しました。投資家には、Founders Fund や Khosla Ventures などの有名なベンチャーキャピタルが含まれています。

Devin はまだ公開バージョンをリリースしていませんが、最近人気のあるもう 1 つの Web2 製品である Cursor から可能性を垣間見ることができます。ほとんどすべての作業を自動的に実行し、コマンドを実行するだけで簡単なアイデアを機能的なコードに変換できます。 8 歳の子供が、プログラミングの経験がなくても、Cursor を使用してコーディング作業を完了し、Web サイトを構築したとの報告があります。

Hebbia — ファイル処理

プロダクトマネージャーや財務スタッフの代わりに、すべてのドキュメントの整理と分析を支援してくれる Hebbia を選ぶかもしれません。

企業内のドキュメント検索に焦点を当てた Glean とは異なり、Hebbia Matrix は、複数の AI モデルを使用してユーザーがデータとドキュメントを効率的に抽出、構造化、分析できるようにするエンタープライズレベルの AI エージェントプラットフォームであり、それによって企業の生産性の向上を促進します。。 Matrix が一度に何百万ものドキュメントを処理できるのは印象的です。

Hebbiaは今年7月、Google VenturesやPeter Thielなどの著名な投資家らの参加を得て、a16z主導で1億3,000万米ドルのシリーズBラウンドを完了した。

Jasper AI — コンテンツ生成

ソーシャルメディアの運用やデザイナーの代わりに、コンテンツの生成に役立つ Jasper AI を選択するかもしれません。

Jasper AI は、クリエイター、マーケティング担当者、企業がコンテンツ生成プロセスを合理化し、生産性と作成効率を向上できるように設計された AI エージェントのライティングアシスタントです。 Jasper AI は、ユーザーが要求したスタイルに基づいて、ブログ投稿、ソーシャルメディア投稿、広告コピー、製品説明など、さまざまな種類のコンテンツを生成できます。また、ユーザーの説明に基づいて画像を生成し、テキストコンテンツの視覚補助を提供します。

Jasper AIは1億2500万ドルの資金を調達し、2022年には評価額15億ドルに達した。統計によると、Jasper AI はユーザーが 5 億語以上の単語を生成するのに役立ち、最も広く使用されている AI ライティングツールの 1 つとなっています。

MultiOn — Web ページの自動化

アシスタントの代わりに、日常のタスクの管理、スケジュールの調整、リマインダーの設定、さらには出張の計画、ホテルの自動予約、オンライン配車の自動手配などを支援してくれる MultiOn を選ぶかもしれません。

MultiOn は、あらゆるデジタル環境で自律的にタスクを実行するのに役立つ自動ネットワークタスク AI エージェントです。たとえば、ユーザーがオンラインショッピングや予約などの個人的なタスクを完了して個人の効率を向上させるのを支援したり、ユーザーが日常のタスクを簡素化し、作業効率を向上させたりするのを支援します。

困惑 — 検索、調査

研究者の代わりに、私なら NVIDIA の CEO が毎日使用している Perplexity を選ぶでしょう。

Perplexity は、ユーザーの質問を理解して分解し、コンテンツを検索して統合し、ユーザーに明確な回答を提供するレポートを生成する AI 検索エンジンです。

Perplexity はさまざまなユーザーグループに適しています。たとえば、学生や研究者は執筆時の情報検索プロセスを簡素化し、マーケティング戦略をサポートするための信頼できるデータを取得できます。

上記の内容は単なる想像にすぎません。これらの AI エージェントの実際の能力とレベルは、あらゆる分野のエリート人材に代わるにはまだ十分ではありません。 Logenic AI の共同創設者である Li Bojie 氏が述べたように、 LLM の現在の機能は初心者レベルにすぎず、専門家レベルには程遠いです。現在の AI エージェントは、迅速に働く従業員のようなものですが、あまり信頼できません。

ただし、これらの AI エージェントは、それぞれの専門性により、既存ユーザーのさまざまなシナリオにおける効率と利便性の向上を支援します。

テクノロジー企業だけでなく、あらゆる分野が AI エージェントの波から恩恵を受けることができます。教育の分野では、AI エージェントは生徒の学習の進度、興味、能力に基づいてパーソナライズされた学習リソースと個別指導を提供できます。また、AI エージェントはユーザーの個人的な財務管理を支援し、投資アドバイスを提供し、株式の傾向を予測することもできます。 ; 医療分野では、AI エージェントは医師の病気の診断や電子商取引の治療計画の策定を支援し、ユーザーの問い合わせに自動的に応答し、自然言語で注文の問題や返品要求を処理するインテリジェントな顧客サービスとしても機能します。処理および機械学習テクノロジーにより、顧客サービスの効率が向上します。

マルチエージェント: AI エージェントの次のステップ

一人のユニコーン企業のアイデアに関する前のセクションでは、単一の AI エージェントは複雑なタスクを処理する際に制限に直面し、実際のニーズを満たすことが困難です。複数の AI エージェントを使用する場合、これらの AI エージェントは異種 LLM に基づいているため、集合的な意思決定は難しく、その能力は限られているため、人間がこれらの独立した AI エージェント間のスケジューラとして機能し、異なるアプリケーションシナリオに対応するこれらの AI エージェントを調整する必要があります。 . 仕事に行きます。そこで誕生したのが「Multi Agent（マルチエージェントフレームワーク）」です。

複雑な問題には多くの場合、知識とスキルの複数の側面を統合する必要があり、単一の AI エージェントの能力は限られており、対処するのが困難です。マルチエージェントシステムでは、異なる機能を持つ AI エージェントを有機的に組み合わせることで、AI エージェントがそれぞれの強みを活用し、互いの強みを学習して、複雑な問題をより効果的に解決できます。

これは、リーダーがタスクを割り当て、さまざまな能力を持つ人々がさまざまなタスクを担当し、各プロセスの結果が次のプロセスに与えられ、最終的に最終的なタスクの結果が得られるという、実際の仕事のプロセスや組織構造と非常によく似ています。。

実装プロセスでは、下位レベルの AI エージェントがそれぞれのタスクを実行し、上位レベルの AI エージェントがタスクを割り当ててその完了を監督します。

マルチエージェントは、人間の意思決定プロセスをシミュレートすることもできます。問題に遭遇したときと同じように、複数の AI エージェントも集団的な意思決定行動をシミュレートし、より良い情報サポートを提供します。たとえば、Microsoft が開発した AutoGen は次の点を満たしています。

さまざまな役割を持つ AI エージェントを作成する機能。これらの AI エージェントは基本的な会話機能を備えており、受信したメッセージに基づいて応答を生成できます。
GroupChatを利用して、複数のAIエージェントが参加するグループチャット環境を構築します。このGroupChatには、他のAIエージェントのチャット記録や発言順序、発言の終了などを管理する管理者ロールを持つAIエージェントが存在します。

マルチエージェントの詳細な分析: Web3 と AI は最終的に相互に成功を収めるのでしょうか?

一人のユニコーン企業のアイデアに適用すると、マルチエージェントアーキテクチャを通じて、プロジェクトマネージャー、プログラマー、スーパーバイザーなどの異なる役割を持つ複数の AI エージェントを作成できます。私たちの目標を伝え、それを実現する方法を考えさせればよいのです。私たちが異議があると感じた場合、または彼らが何か間違っていると感じた場合は、私たちが満足するまで変更させてください。

単一の AI エージェントと比較して、マルチエージェントは次のことを実現できます。

スケーラビリティ:大規模な問題を処理するために AI エージェントの数を増やすことで、各 AI エージェントがタスクの一部を処理し、需要の増加に応じてシステムを拡張できます。
並列処理:当然のことながら並列処理をサポートし、複数の AI エージェントが問題の異なる部分に同時に取り組むことができるため、問題解決が加速されます。
意思決定の改善:それぞれが独自の視点と専門知識を持つ複数の AI エージェントからの洞察を集約することで、意思決定を強化します。

AI テクノロジーが進歩し続けるにつれて、マルチエージェントフレームワークがより多くの業界でより大きな役割を果たし、さまざまな新しい AI 駆動ソリューションの開発が促進されることが考えられます。

AIエージェントの風はWeb3に吹く

研究所から一歩踏み出すと、AI エージェントとマルチエージェントには長い道のりが待っています。

当面のマルチエージェントはともかく、現時点では最先端の単一AIエージェントであっても、物理レベルで必要なコンピューティングリソースやコンピューティングパワーには明確な上限があり、無限に拡張することはできない。非常に複雑で計算量の多いタスクに直面すると、AI エージェントは間違いなく計算能力のボトルネックに遭遇し、パフォーマンスが大幅に低下します。

さらに、AI エージェントおよびマルチエージェントシステムは本質的に集中型のアーキテクチャモデルであり、単一障害のリスクが非常に高いと判断されます。さらに重要なことは、OpenAI、Microsoft、Google、およびクローズドソースの大規模モデルに基づくその他の企業の独占的なビジネスモデルは、独立した単一の AI エージェントスタートアップの生存環境を深刻に脅かしており、AI エージェントが企業の膨大なプライベートデータをうまく利用して、より賢く、より効率的になりましょう。真に価値のある AI エージェントがニーズを持つ幅広い人々にサービスを提供し、社会により大きな価値を生み出すことができるように、AI エージェント間の民主的なコラボレーション環境が緊急に必要とされています。

最後に、AI エージェントは LLM よりも業界に近いですが、その開発は LLM に基づいています。ただし、現在の大規模モデルトラックは、技術的敷居が高く、多額の資本投資があり、AI エージェントを入手するのが通常は困難です。更新と反復を続けるための資金。

マルチエージェントパラダイムは、Web3 が AI を支援するための優れた角度であり、多くの Web3 開発チームがこれらの分野のソリューションを提供するためにすでに研究開発に投資しています。

マルチエージェントの詳細な分析: Web3 と AI は最終的に相互に成功を収めるのでしょうか?

AI エージェントおよびマルチエージェントシステムは通常、複雑な意思決定および処理タスクを実行するために大量のコンピューティングリソースを必要とします。 Web3 は、ブロックチェーンと分散技術を通じて分散型コンピューティング電力市場を構築し、コンピューティング電力リソースを地球規模でより公平かつ効率的に分散および利用できるようにします。 Akash、Nosana、Aethir、IO.net などの Web3 プロジェクトは、AI エージェントの意思決定と推論のためのコンピューティング機能を提供できます。

従来の AI システムは集中管理されることが多く、AI エージェントは単一障害点やデータプライバシーの問題に直面することがあります。Web3 の分散化により、各 AI エージェントはより分散化され、自律的に実行できるようになります。ノード上では、ユーザーが提示した要件が自律的に実行されるため、堅牢性とセキュリティが強化されます。 PoS、DPoS、その他のメカニズムを通じて誓約者と委任者に対するインセンティブと罰のメカニズムを確立すると、単一 AI エージェントまたはマルチエージェントシステムの民主化を促進できます。

この点では、GaiaNet、Theoriq、PIN AI、HajimeAI はいずれも非常に先進的な試みを行っています。

Theoriq は、「Web3 向け AI」を提供するプロジェクトであり、Agentic Protocol を通じて AI エージェントの呼び出しおよび経済システムを確立し、Web3 および多くの機能シナリオの開発を普及させ、Web3 dApps に検証可能なモデル推論機能を提供することを目指しています。
GaiaNet はノードベースの AI エージェントの作成および展開環境であり、集中型の OpenAI GPT ストアと競合するために、専門家やユーザーの知的財産とデータプライバシーを保護することを出発点としています。
この 2 つに基づいて、HajimeAI は実際のニーズに基づいた AI エージェントワークフローの確立と、インテント自体のインテリジェンスと自動化に焦点を当てており、PIN AI が言及した「AI インテリジェンスのパーソナライゼーション」を反映しています。
同時に、Modulus Labs と ORA Protocol は、それぞれ AI エージェントの zkML および opML アルゴリズムの方向で進歩を遂げました。

最後に、AI エージェントおよびマルチエージェントシステムの開発と反復には多額の財政的サポートが必要になることが多く、Web3 は、潜在的な AI エージェントプロジェクトがフロントローディング流動性の機能を通じて貴重な早期サポートを得るのに役立ちます。

SpectralとHajimeAIの両社は、チェーン上のAIエージェント資産の発行をサポートする製品コンセプトを提案しています。IAO（Initial Agent Offering）を通じてトークンを発行することで、AIエージェントは投資家から直接資金を得ることができ、同時にDAOのメンバーになることができます。ガバナンスを提供し、投資家にプロジェクト開発に参加し、将来の利益を共有する機会を提供します。その中で、HajimeAI の Benchmark DAO は、分散型 AI エージェントのスコアリングと、クラウドファンディングとトークンインセンティブによる AI エージェントの資産発行を有機的に組み合わせて、Web3 ファイナンスとコールドスタートに依存する AI エージェントのクローズドループを作成することを望んでおり、これも比較的新しい試みです。

AI パンドラの箱が開かれ、その中にいる誰もが興奮していると同時に混乱しています。この流行がチャンスなのか、隠れた危険なのかは誰にも分かりません。現在、あらゆる分野が PPT ファイナンスの時代ではありません。どんなに最先端のテクノロジーであっても、その価値は実装されて初めて実現されます。 AI Agent の将来は長いマラソンになることが運命づけられており、Web3 はこのレースで AI Agent が消え去ることがないように努めています。