Grass 的定位與使用場景
Grass 是部署在 Solana 鏈上,結合AI、Depin 和 Solana 技術的項目,定位為 AI 的資料層。它是一個去中心化的網路抓取平台,旨在幫助公司和非營利組織透過利用未使用的網路頻寬來訓練人工智慧(AI)。它透過瀏覽器擴展應用程式實現網路抓取,利用個人的未使用網路頻寬,並以Grass Points 獎勵用戶,Grass 透過讓用戶分享未使用的網路頻寬資源,旨在重新定義網路激勵結構,讓用戶直接從網路中受益,並確保網路的價值掌握在使用者手中。目前,該網路有 200 多萬個用戶運行節點,為 AI 模型抓取了大量資料。
技術架構
Grass 主權資料 Rollup 是 Grass 在 Solana 上專門建構的網絡,它使協定能夠處理從資料來源到處理、驗證和建構資料集的所有事務。此網路圍繞著驗證器 Validator(發出資料收集指令)、路由器 Router(管理 Web 請求分發)以及 Grass 節點 Node(使用者用來貢獻其閒置的網路資源)建構。具體架構如下:
驗證器 Validator:接收、驗證和按批次路由器的 Web 交易。然後,產生 ZK 證明以檢查鏈上的會話資料。鏈上證明可以在資料集中引用,以驗證資料來源並在整個生命週期中追蹤其譜系。驗證器集將從最初的單一驗證器的中心化框架過渡到去中心化的驗證器委員會。
路由器 Router:將 Grass 節點連接到驗證器。路由器使節點網路保持可追溯性,並中繼頻寬。 Grass 以透過中繼提供的總驗證頻寬比例激勵其運作。 Router 負責向網路中的驗證器報告以下指標:每個傳入和傳出請求的大小(以位元組為單位);每個節點的延遲和驗證器的延遲;每個連接節點的網路狀態。
Grass 節點 Node:利用使用者未使用的頻寬和中繼流量,以便網路可以抓取公共 Web 資料(而非使用者的個人資料)。運行節點是免費的,運行節點的人(節點操作員)按通過其中繼的數據而獲得報酬。
Zk 處理器 ZK Processor:批量處理所有 Web 請求的會話資料的有效性證明,並將證明提交到L1 區塊鏈。此操作會永久記錄網路上執行的每一次抓取行為。這也為全面了解AI 訓練資料的來源奠定了基礎。
Grass 資料帳本 Grass Data Ledger:這是被抓取的資料和L1結算層之間的連結。帳本是一種不可變的資料結構,它託管完整的資料集並將資料連結到其相應的鏈上證明,是確保資料來源的資料儲存庫。
邊緣嵌入模型 Edge Embedding Models:這是將非結構化 Web 資料轉換為結構化模型的過程。這包括所有必要的預處理步驟,確保收集的原始資料經過清理、標準化和結構化,格式符合 AI 模型的要求。
技術特性
在上述的架構中,Grass 網路處於客戶端和 Web 伺服器之間,客戶端發出 Web 請求,這些請求透過驗證器發送,最終透過 Grass 節點路由。無論客戶端請求哪個網站,其伺服器都會回應 Web 請求,允許其資料被抓取並傳送迴線路。然後,它將被清理、處理並準備用於訓練下一代 AI 模型。
這個過程需要了解兩個主要的附加功能:Grass 資料分類帳和 ZK 處理器。
Grass 資料帳本是所有資料最終儲存的地方,它是 Grass 抓取的每個資料集的永久帳本,嵌入了元數據,從起源時刻記錄其最開始的譜系。每個資料集的元資料證明將儲存在 Solana 的結算層上,結算資料本身也透過帳本提供。
ZK 處理器的目的是幫助記錄 Grass 網路上抓取的資料集的來源。過程如下:當網路上的節點(即安裝了 Grass 擴充功能的使用者)向給定網站發送 Web 請求時,它會傳回一個加密回應,其中包括節點請求的所有資料。這就是資料集誕生的時刻,也就是需要記錄的起源時刻,同時也是記錄元資料的時刻。它包含許多字段,如會話密鑰、抓取的網站 URL、目標網站 IP 位址、交易時間戳,當然還有資料本身。由於這些必要的資訊和網站來源清晰的資料集,AI 模型可以得到正確且忠實的訓練。
ZK 處理器可以讓需要在鏈上結算的資料不被 Solana 驗證器看到。此外,未來將在 Grass 上執行的大量 Web 請求將超出L1能承受的吞吐量。 Grass 很快就會擴展到每分鐘執行數千萬個 Web 請求的水平,並且每個請求的元資料都需要在鏈上結算。如果沒有 ZK 處理器先進行證明和按批次處理,就不可能將這些交易提交給L1。因此,Rollup 是實現計劃目標的唯一可能方法。
除了記錄資料集的來源網站之外,元資料還指示它透過網路上的哪個節點路由。這意味著每當一個節點抓取網路時,都可以因其所做的貢獻而獲得獎勵,而無需透露任何自己的身份資訊。這使得Grass 可以按比例獎勵節點,抓取數據更多、更有價值的節點將獲得更多的激勵,這一機制將顯著提高全球最熱門地區的獎勵,最終鼓勵這些地區的人註冊並增加網絡容量。加入的網路規模越大,Grass 可抓取的容量就越大,儲存的網路資料儲存庫就越大。數據越多則意味著 Grass 可以為需要訓練數據的人工智慧實驗室提供更多數據,激勵網路繼續成長。
Grass 節點運作以及安全機制
Grass 節點運作是免費的,可作為網路通往網際網路的網關。節點運營商(即應用程式用戶)會因透過其節點中繼的流量而獲得獎勵,並根據其聲譽得分和地理需求獲得網路流量。
Grass 節點有兩個主要用途:傳遞由用戶端發起並由驗證器指示的流量(即 Web 要求);將加密的 Web 伺服器回應傳回指定的路由器。
節點支援的系統如上圖所示,運行節點的流程也很簡單:建立帳戶、下載Grass 桌面應用程式、連接到網路即可。
連線後,節點會自動在網路上註冊。運營商負責維護網路正常運行時間,以便節點可以將網路請求轉發到公共網路伺服器。發送到 Grass 節點的每個請求都是一個加密的資料包。資料包僅向每個資料包目的地上的節點提供方向。網路請求透過所有相關方的數位簽章進行身份驗證。這些簽章將驗證請求的合法性,並確定是否應將其轉送到目標網頁伺服器(即公共網站)。此加密流程可防止資料篡改,並確保驗證器可以準確測量每個節點的聲譽。
節點聲譽評分主要包括以下幾點:
完整性:評估資料是否完整,評估資料集是否包含預期用例所需的所有必要資料點。
一致性:檢查不同資料集或同一資料集內隨時間變化的資料一致性。
及時性:衡量數據在需要時是否是最新的。
可用性:評估每個節點的資料可用程度。
在安全機制方面,Grass 網路不會使用使用者節點(即電腦)或查看使用者在電腦上執行的任何操作。它所做的只是透過用戶的 IP 位址路由網路流量,與用戶的活動完全無關。這意味著 Grass 對使用者的個人資料的存取權為零,被抓取的資料 100% 源自於公共網路資料。
此外,Grass 使用頻寬加密來確保所有用戶在共享網路連線時都受到保護。 Grass 也與領先的網路安全合規審計公司AppEsteem 合作,AppEsteem 24 小時監控 Grass 的產品是否有漏洞、洩漏、後門和惡意軟體,以確保用戶的安全性。 AppEsteem 認證在網路安全產業享有很高的聲譽,獲得該認證意味著 Grass 的產品也被頂級反惡意軟體應用程式列入白名單,包括Avast、Microsoft Defender、McAfee、AVG 等。
Grass token 的功能
Grass token 的持有者可以透過以下幾種方式參與 Grass 網路:
交易與回購:去中心化後,Grass 將用於支援網路抓取交易、資料集購買和 LCR(即時情境檢索)使用。
質押與獎勵:將 Grass 質押到路由器以促進網路流量,並因對網路安全做出貢獻而獲得獎勵。
網路治理:參與 Grass 網路的發展,包括提議和投票支持網路改進、協調與哪些組織合作以及確定所有利害關係人的激勵機制。
根據 Dune 網站統計,目前,Grass 的質押年化收益率在 45% 左右,約有 33% 的 grass token 參與了質押,質押數量超過了 2600 萬。
Router 質押與收益
路由器(Router)充當分散的樞紐,連接所有網路節點並管理驗證器的 Web 請求的傳入和傳出。 Router 運作受到激勵,獎勵與委託給每個路由器的質押量成比例。透過 Router 中繼路由的所有流量都經過加密和計量,以確保安全性和效能。
目前,各 Router 的質押量如上圖所示,使用者可以將 Grass 質押到 Router 代表以獲得收益,每個 Router 的佣金不同。
目前 DBunker 的 Grass 質押量約 143 萬,最小質押週期為 7 天,佣金 10% 。 (資料來源https://www.grassfoundation.io/stake/delegations )使用者只需點選 STAKE 即可連接錢包,質押 Grass,取得 Router 質押效益。
小結
Grass 致力於建構一個公正、開放的去中心化資料層,旨在解決當前網路資料擷取的倫理問題及資料品質問題,反對由少數大公司控制的資料壟斷現象。在技術架構和特性方面,Grass 透過建構資料 Rollup,引入了記錄所有資料集來源的元資料機制。這些資料的 ZK 證明被儲存在L1結算層上,而元資料本身最終將與其底層資料集綁定,因為這些資料集本身儲存在 Grass 的資料分類帳上。因此,ZK 證明為提高透明度和為節點提供者提供與其執行的工作量成比例的獎勵奠定了基礎,這也是激勵 Grass 網路擴張的重要因素。
Grass 專注於加密貨幣與 AI 交叉領域的數據,與閉源、集中式AI 的傳統參與者不同,它是 AI 數據的原始去中心化來源。作為web3浪潮中的重要參與者,Grass 透過去中心化技術,為 AI 公司和協議建立一個公正、開放的資料層,以市場需求為切入點,發展前景可期。