原作者: 0xJeff ( @Defi0xJeff )
編集者: Asher ( @Asher_0210 )
現在、人々の注目のほとんどがオンラインに集中しているため、データはこの時代におけるデジタルゴールドです。 2024年の世界の平均スクリーンタイムは1日あたり6時間40分となり、前年より増加しています。米国ではその数はさらに多く、1日あたり7時間3分に達します。
このような高いレベルのエンゲージメントにより生成されるデータの量は驚異的となり、 2024 年には 1 日あたり 3.2877 TB のデータが生成されます。これは、生成、キャプチャ、複製、または消費されるすべての新しいデータを考慮すると、1 日あたり約 0.4 ZB のデータ (1 ZB = 1,000,000,000 TB) に相当します。
しかし、毎日膨大な量のデータが生成され、消費されているにもかかわらず、ユーザーが所有するデータはごくわずかです。
ソーシャル メディア: X、Instagram などのプラットフォーム上のデータは、ユーザーによって生成されたものであっても、企業によって管理されます。
モノのインターネット (IoT): スマート デバイスからのデータは、特定の契約で別途指定されていない限り、通常はデバイスの製造元またはサービス プロバイダーに帰属します。
健康データ: 個人は自身の医療記録に対する権利を有しますが、健康アプリやウェアラブルデバイスから得られるデータの多くは、それらのサービスを提供する企業によって管理されています。
暗号化とソーシャルデータ
暗号通貨分野では、Xプラットフォーム上のソーシャルデータをインデックス化し、プロジェクト、KOL、思想的リーダーが使用できる実用的な感情データに変換するKaito AIの台頭が見られました。 「yap」と「mindshare」という用語は、Kaito チームのグロースハッキングの専門知識 (人気のマインドシェアとヤッパーのダッシュボードを通じて) と、Crypto Twitter で自然な関心を引き付ける能力により、普及しました。
「Yap」は、Xプラットフォーム上での質の高いコンテンツの作成を奨励することを目指していますが、多くの疑問が未解決のまま残っています。
「ヤップ」はどのようにして「正確に」採点されるのでしょうか?
カイトについて言及すると、余計な「おしゃべり」が聞こえてくるでしょうか?
Kaito は本当に質の高いコンテンツを評価するのでしょうか、それとも物議を醸すような一般的な意見を優先するのでしょうか?
ソーシャル データ以外にも、データの所有権、プライバシー、透明性に関する議論がますます白熱しています。人工知能が急速に進歩するにつれて、新たな疑問が浮上します。AI モデルのトレーニングに使用されるデータは誰が所有するのでしょうか? AI が生成した結果から利益を得るのは誰でしょうか?これらの問題は、Web3 データ レイヤーの台頭への道を開き、分散型のユーザー主導のデータ エコシステムへの一歩となります。
データレイヤーの出現
Web3 分野では、個人データの主権を実現し、個人が自分のデータをより細かく制御できるようにし、収益化の機会を提供することを目的とした、データ レイヤー、プロトコル、インフラストラクチャのエコシステムが成長しつつあります。
ヴァナ
Vanaの中心的な使命は、特にデータがモデルのトレーニングに非常に重要である AI の分野において、ユーザーがデータを制御できるようにすることです。 Vana は、ユーザーが共通の利益のためにデータを共有するコミュニティ主導の組織である DataDAO を立ち上げました。各 DataDAO は特定のデータセットに焦点を当てています。
r/datadao: Reddit ユーザーデータに焦点を当て、ユーザーが自分の投稿を制御し、収益化できるようにします。
Volara: ユーザーがソーシャル メディア アクティビティから利益を得られるよう、X プラットフォーム データを処理します。
DNA DAO: プライバシーと所有権に重点を置いて遺伝子データを管理することを目的としています。
Vana はデータを「DLP」と呼ばれる取引可能な資産に分割します。各 DLP は特定の分野のデータを集約し、ユーザーはこれらのプールにトークンをステークして報酬を受け取ることができます。上位のプールはコミュニティのサポートとデータ品質に基づいて報酬を受け取ります。 Vana が際立っているのは、データの提供が容易なことです。ユーザーはDataDAO を選択し、 API 統合を通じてデータを直接集約するか、データを手動でアップロードするだけで、報酬として DataDAO トークンと VANA トークンを獲得できます。
オーシャンプロトコル
Ocean Protocol は、データ プロバイダーがデータを共有、販売、またはライセンス供与できる分散型データ マーケットプレイスであり、消費者は AI や研究で使用するためにこのデータにアクセスすることができます。 Ocean Protocol はデータセットへのアクセスを表すために「データトークン」(ERC 20 トークン)を使用し、データプロバイダーがアクセス条件を制御しながらデータを収益化できるようにします。
Ocean Protocol で取引されるデータの種類は次のとおりです。
公開データとは、気象情報、公開人口統計、過去の株価データなど、AI のトレーニングや研究に非常に価値のあるオープン データセットを指します。
個人データには、厳格なプライバシー管理を必要とする医療記録、金融取引、IoT センサー データ、または個人化されたユーザー データが含まれます。
Compute-to-Data は Ocean Protocol のもう 1 つの重要な機能であり、データを移動せずにデータに対して計算を実行できるため、機密データ セットのプライバシーとセキュリティが確保されます。
マサ
Masa は、 AI トレーニング データ用のオープン レイヤーの作成に注力し、AI エージェントと開発者にリアルタイムで高品質かつ低コストのデータを提供します。
Masa は Bittensor ネットワーク上に 2 つのサブネットを立ち上げました。
サブネット42 ( SN42 ): 1 日あたり数百万件のデータ レコードを集約して処理し、AI エージェントとアプリケーション開発の基盤を提供します。
サブネット59 ( SN59 ) –「AI エージェント アリーナ」: AI エージェントがSN42からのリアルタイム データを活用し、マインド シェア、ユーザー エンゲージメント、自己改善などのパフォーマンス メトリックに基づいて TAO リリースを競う競争環境。
さらに、Masa はVirtuals Protocolと提携して、Virtuals Protocol エージェントにリアルタイム データ機能を提供しています。また、TAOCAT トークンもリリースし、その機能を実証しました (現在 Binance Alpha で公開中)。
オープン元帳
Open Ledger は、特に AI および機械学習アプリケーション向けにデータに特化したブロックチェーンを構築し、安全で分散化された検証可能なデータ管理を保証します。主な特徴は次のとおりです。
データネット: AI アプリケーション向けに現実世界のデータをキュレートして強化する、OpenLedger 内の特殊なデータ ソースのネットワーク。
SLM: 特定の業界やアプリケーション向けにカスタマイズされた AI モデル。そのアイデアは、ニッチなユースケースでより正確なだけでなく、プライバシー要件に準拠し、汎用モデルに存在するバイアスの影響を受けにくいモデルを提供することです。
データ検証: 特定言語モデル (SLM) のトレーニングに使用されるデータの正確性と信頼性を確保し、これらのモデルが特定のユースケースに対して正確で信頼できるものであることを確認します。
AIトレーニングにおけるデータの必要性
人工知能と自律エージェントの開発を促進するため、高品質なデータの需要が急増しています。 AI エージェントには、初期トレーニングに加えて、継続的な学習と適応のためのリアルタイム データも必要です。主な課題と機会は次のとおりです。
データの質は量より重要です。AI モデルでは、偏りやパフォーマンスの低下を避けるために、高品質で多様性があり、関連性の高いデータが必要です。
データ主権とプライバシー: Vana が示すように、ユーザー所有のデータを収益化しようとする動きがあり、AI トレーニング データの取得方法が変化する可能性があります。
合成データ: プライバシーに関する懸念から、倫理的な懸念を軽減しながら AI モデルをトレーニングする方法として、合成データが注目を集めています。
データ マーケットプレイス: データ マーケットプレイス (集中型および分散型) の台頭により、データが取引可能な資産となる経済が生まれています。
データ管理における AI: AI は現在、データセットの管理、クリーンアップ、強化に使用されており、AI トレーニング用のデータの品質が向上しています。
AI エージェントがより自律的になるにつれて、リアルタイムで高品質なデータにアクセスし、それを処理する能力が、その有効性に直接影響するようになります。この需要の増加により、AI エージェントと人間の両方が高品質のデータにアクセスできる、AI エージェント専用に構築されたデータ マーケットプレイスが誕生しました。
Web3 プロキシデータ市場
Cookie DAO は、 AI エージェントからの社会的感情データとトークン関連情報を集約し、それを人間と AI エージェントにとって実用的な洞察に変換します。 Cookie DataSwarm API を使用すると、AI エージェントはリアルタイムの高品質データにアクセスして取引関連の洞察を得ることができます。これは、暗号空間で最も一般的なアプリケーションの 1 つです。さらに、月間アクティブユーザー数が 20 万人、1 日のアクティブユーザー数が 2 万人の Cookie は、COOKIE トークンを中核とする最大規模の AI エージェント データ マーケットプレイスの 1 つです。
最後に、この分野で注目すべきその他のプロジェクトは次のとおりです。
GoatIndex.ai はSolana エコシステムの洞察に重点を置いています。
Decentralised.Co は、 GitHub やプロジェクト固有の分析などのニッチなデータ ダッシュボードに重点を置いています。