私のデータは誰のものですか?データレイヤー内のどのプロジェクトに注目する価値がありますか?-web3资讯-ODAILY

原作者: 0xJeff ( @Defi0xJeff )

編集者: Asher ( @Asher_0210 )

私のデータは誰のものですか?データレイヤー内のどのプロジェクトに注目する価値がありますか?

現在、人々の注目のほとんどがオンラインに集中しているため、データはこの時代におけるデジタルゴールドです。 2024年の世界の平均スクリーンタイムは1日あたり6時間40分となり、前年より増加しています。米国ではその数はさらに多く、1日あたり7時間3分に達します。

このような高いレベルのエンゲージメントにより生成されるデータの量は驚異的となり、 2024 年には 1 日あたり 3.2877 TB のデータが生成されます。これは、生成、キャプチャ、複製、または消費されるすべての新しいデータを考慮すると、1 日あたり約 0.4 ZB のデータ (1 ZB = 1,000,000,000 TB) に相当します。

しかし、毎日膨大な量のデータが生成され、消費されているにもかかわらず、ユーザーが所有するデータはごくわずかです。

ソーシャルメディア: X、Instagram などのプラットフォーム上のデータは、ユーザーによって生成されたものであっても、企業によって管理されます。
モノのインターネット (IoT): スマートデバイスからのデータは、特定の契約で別途指定されていない限り、通常はデバイスの製造元またはサービスプロバイダーに帰属します。
健康データ: 個人は自身の医療記録に対する権利を有しますが、健康アプリやウェアラブルデバイスから得られるデータの多くは、それらのサービスを提供する企業によって管理されています。

暗号化とソーシャルデータ

暗号通貨分野では、Xプラットフォーム上のソーシャルデータをインデックス化し、プロジェクト、KOL、思想的リーダーが使用できる実用的な感情データに変換するKaito AIの台頭が見られました。「yap」と「mindshare」という用語は、Kaito チームのグロースハッキングの専門知識 (人気のマインドシェアとヤッパーのダッシュボードを通じて) と、Crypto Twitter で自然な関心を引き付ける能力により、普及しました。

「Yap」は、Xプラットフォーム上での質の高いコンテンツの作成を奨励することを目指していますが、多くの疑問が未解決のまま残っています。

「ヤップ」はどのようにして「正確に」採点されるのでしょうか?
カイトについて言及すると、余計な「おしゃべり」が聞こえてくるでしょうか?
Kaito は本当に質の高いコンテンツを評価するのでしょうか、それとも物議を醸すような一般的な意見を優先するのでしょうか?

ソーシャルデータ以外にも、データの所有権、プライバシー、透明性に関する議論がますます白熱しています。人工知能が急速に進歩するにつれて、新たな疑問が浮上します。AI モデルのトレーニングに使用されるデータは誰が所有するのでしょうか? AI が生成した結果から利益を得るのは誰でしょうか?これらの問題は、Web3 データレイヤーの台頭への道を開き、分散型のユーザー主導のデータエコシステムへの一歩となります。

データレイヤーの出現

Web3 分野では、個人データの主権を実現し、個人が自分のデータをより細かく制御できるようにし、収益化の機会を提供することを目的とした、データレイヤー、プロトコル、インフラストラクチャのエコシステムが成長しつつあります。

ヴァナ

私のデータは誰のものですか?データレイヤー内のどのプロジェクトに注目する価値がありますか?

Vanaの中心的な使命は、特にデータがモデルのトレーニングに非常に重要である AI の分野において、ユーザーがデータを制御できるようにすることです。 Vana は、ユーザーが共通の利益のためにデータを共有するコミュニティ主導の組織である DataDAO を立ち上げました。各 DataDAO は特定のデータセットに焦点を当てています。

r/datadao: Reddit ユーザーデータに焦点を当て、ユーザーが自分の投稿を制御し、収益化できるようにします。
Volara: ユーザーがソーシャルメディアアクティビティから利益を得られるよう、X プラットフォームデータを処理します。
DNA DAO: プライバシーと所有権に重点を置いて遺伝子データを管理することを目的としています。

Vana はデータを「DLP」と呼ばれる取引可能な資産に分割します。各 DLP は特定の分野のデータを集約し、ユーザーはこれらのプールにトークンをステークして報酬を受け取ることができます。上位のプールはコミュニティのサポートとデータ品質に基づいて報酬を受け取ります。 Vana が際立っているのは、データの提供が容易なことです。ユーザーはDataDAO を選択し、 API 統合を通じてデータを直接集約するか、データを手動でアップロードするだけで、報酬として DataDAO トークンと VANA トークンを獲得できます。

オーシャンプロトコル

私のデータは誰のものですか?データレイヤー内のどのプロジェクトに注目する価値がありますか?

Ocean Protocol は、データプロバイダーがデータを共有、販売、またはライセンス供与できる分散型データマーケットプレイスであり、消費者は AI や研究で使用するためにこのデータにアクセスすることができます。 Ocean Protocol はデータセットへのアクセスを表すために「データトークン」（ERC 20 トークン）を使用し、データプロバイダーがアクセス条件を制御しながらデータを収益化できるようにします。

Ocean Protocol で取引されるデータの種類は次のとおりです。

公開データとは、気象情報、公開人口統計、過去の株価データなど、AI のトレーニングや研究に非常に価値のあるオープンデータセットを指します。
個人データには、厳格なプライバシー管理を必要とする医療記録、金融取引、IoT センサーデータ、または個人化されたユーザーデータが含まれます。

Compute-to-Data は Ocean Protocol のもう 1 つの重要な機能であり、データを移動せずにデータに対して計算を実行できるため、機密データセットのプライバシーとセキュリティが確保されます。

マサ

私のデータは誰のものですか?データレイヤー内のどのプロジェクトに注目する価値がありますか?

Masa は、 AI トレーニングデータ用のオープンレイヤーの作成に注力し、AI エージェントと開発者にリアルタイムで高品質かつ低コストのデータを提供します。

Masa は Bittensor ネットワーク上に 2 つのサブネットを立ち上げました。

サブネット42 ( SN42 ): 1 日あたり数百万件のデータレコードを集約して処理し、AI エージェントとアプリケーション開発の基盤を提供します。
サブネット59 ( SN59 ) –「AI エージェントアリーナ」: AI エージェントがSN42からのリアルタイムデータを活用し、マインドシェア、ユーザーエンゲージメント、自己改善などのパフォーマンスメトリックに基づいて TAO リリースを競う競争環境。

さらに、Masa はVirtuals Protocolと提携して、Virtuals Protocol エージェントにリアルタイムデータ機能を提供しています。また、TAOCAT トークンもリリースし、その機能を実証しました (現在 Binance Alpha で公開中)。

オープン元帳

私のデータは誰のものですか?データレイヤー内のどのプロジェクトに注目する価値がありますか?

Open Ledger は、特に AI および機械学習アプリケーション向けにデータに特化したブロックチェーンを構築し、安全で分散化された検証可能なデータ管理を保証します。主な特徴は次のとおりです。

データネット: AI アプリケーション向けに現実世界のデータをキュレートして強化する、OpenLedger 内の特殊なデータソースのネットワーク。
SLM: 特定の業界やアプリケーション向けにカスタマイズされた AI モデル。そのアイデアは、ニッチなユースケースでより正確なだけでなく、プライバシー要件に準拠し、汎用モデルに存在するバイアスの影響を受けにくいモデルを提供することです。
データ検証: 特定言語モデル (SLM) のトレーニングに使用されるデータの正確性と信頼性を確保し、これらのモデルが特定のユースケースに対して正確で信頼できるものであることを確認します。

AIトレーニングにおけるデータの必要性

人工知能と自律エージェントの開発を促進するため、高品質なデータの需要が急増しています。 AI エージェントには、初期トレーニングに加えて、継続的な学習と適応のためのリアルタイムデータも必要です。主な課題と機会は次のとおりです。

データの質は量より重要です。AI モデルでは、偏りやパフォーマンスの低下を避けるために、高品質で多様性があり、関連性の高いデータが必要です。
データ主権とプライバシー: Vana が示すように、ユーザー所有のデータを収益化しようとする動きがあり、AI トレーニングデータの取得方法が変化する可能性があります。
合成データ: プライバシーに関する懸念から、倫理的な懸念を軽減しながら AI モデルをトレーニングする方法として、合成データが注目を集めています。
データマーケットプレイス: データマーケットプレイス (集中型および分散型) の台頭により、データが取引可能な資産となる経済が生まれています。
データ管理における AI: AI は現在、データセットの管理、クリーンアップ、強化に使用されており、AI トレーニング用のデータの品質が向上しています。

AI エージェントがより自律的になるにつれて、リアルタイムで高品質なデータにアクセスし、それを処理する能力が、その有効性に直接影響するようになります。この需要の増加により、AI エージェントと人間の両方が高品質のデータにアクセスできる、AI エージェント専用に構築されたデータマーケットプレイスが誕生しました。

Web3 プロキシデータ市場

Cookie DAO は、 AI エージェントからの社会的感情データとトークン関連情報を集約し、それを人間と AI エージェントにとって実用的な洞察に変換します。 Cookie DataSwarm API を使用すると、AI エージェントはリアルタイムの高品質データにアクセスして取引関連の洞察を得ることができます。これは、暗号空間で最も一般的なアプリケーションの 1 つです。さらに、月間アクティブユーザー数が 20 万人、1 日のアクティブユーザー数が 2 万人の Cookie は、COOKIE トークンを中核とする最大規模の AI エージェントデータマーケットプレイスの 1 つです。

最後に、この分野で注目すべきその他のプロジェクトは次のとおりです。

GoatIndex.ai はSolana エコシステムの洞察に重点を置いています。
Decentralised.Co は、 GitHub やプロジェクト固有の分析などのニッチなデータダッシュボードに重点を置いています。