Giải thích nền kinh tế dữ liệu Web3 từ góc độ đầy đủ, theo dõi cấp độ 100 tỷ tiếp theo sau LSD-web3资讯-ODAILY

Tác giả gốc: Yuxing

Bài viết này chỉ nhằm mục đích giao tiếp và học tập và không mang tính chất tư vấn đầu tư.

Giải thích nền kinh tế dữ liệu Web3 từ góc độ đầy đủ, theo dõi cấp độ 100 tỷ tiếp theo sau LSD

Sự phổ biến của ChatGPT và GPT-4 đã cho chúng ta thấy sức mạnh của trí tuệ nhân tạo. Đằng sau trí tuệ nhân tạo, ngoài thuật toán, điều quan trọng hơn là dữ liệu khổng lồ. Chúng tôi đã xây dựng một hệ thống phức tạp quy mô lớn xoay quanh dữ liệu, giá trị của nó chủ yếu đến từ trí tuệ kinh doanh (Business Intelligence, BI) và trí tuệ nhân tạo (Artificial Intelligence, AI). Do sự tăng trưởng nhanh chóng của khối lượng dữ liệu trong kỷ nguyên Internet, những nỗ lực về cơ sở hạ tầng dữ liệu và các phương pháp hay nhất cũng đang phát triển nhanh chóng. Trong hai năm qua, hệ thống cốt lõi của nền tảng công nghệ cơ sở hạ tầng dữ liệu đã trở nên rất ổn định, các công cụ và ứng dụng hỗ trợ cũng phát triển nhanh chóng.

Kiến trúc cơ sở hạ tầng dữ liệu Web2

Kho dữ liệu đám mây (chẳng hạn như Snowflake, v.v.) đang phát triển nhanh chóng, tập trung chủ yếu vào người dùng SQL và các kịch bản người dùng thông minh trong kinh doanh. Việc áp dụng các công nghệ khác cũng đang tăng tốc, khách hàng của các hồ dữ liệu (chẳng hạn như Databricks) đang tăng trưởng với tốc độ chưa từng thấy và tính không đồng nhất trong ngăn xếp công nghệ dữ liệu sẽ cùng tồn tại.

Các hệ thống dữ liệu cốt lõi khác, chẳng hạn như thu thập và chuyển đổi dữ liệu, đã được chứng minh là có độ bền tương đương. Điều này đặc biệt rõ ràng trong thế giới dữ liệu thông minh hiện đại. Sự kết hợp của Fivetran và dbt (hoặc các công nghệ tương tự) có thể được tìm thấy ở hầu hết mọi nơi. Nhưng ở một mức độ nào đó, điều này cũng đúng trong các hệ thống kinh doanh. Sự kết hợp của Databricks/Spark, Confluent/Kafka và Astronomer/Airflow cũng đang bắt đầu trở thành tiêu chuẩn thực tế.

Giải thích nền kinh tế dữ liệu Web3 từ góc độ đầy đủ, theo dõi cấp độ 100 tỷ tiếp theo sau LSD

Nguồn: a16z

TRONG,

nguồn dữ liệuTạo dữ liệu kinh doanh và kinh doanh có liên quan trên thiết bị đầu cuối;
Khai thác và chuyển đổi dữ liệuChịu trách nhiệm trích xuất dữ liệu từ hệ thống kinh doanh (E), truyền đến bộ lưu trữ, căn chỉnh định dạng giữa nguồn và đích dữ liệu (L) và gửi dữ liệu đã phân tích trở lại hệ thống kinh doanh theo yêu cầu;
lưu trữ dữ liệuViệc lưu trữ dữ liệu ở định dạng có thể truy vấn và xử lý cần được tối ưu hóa theo hướng chi phí thấp, khả năng mở rộng cao và khối lượng công việc phân tích;
Truy vấn và xử lýDịch các ngôn ngữ lập trình cấp cao (thường là SQL, Python hoặc Java/Scala) sang các tác vụ xử lý dữ liệu cấp thấp. Sử dụng điện toán phân tán để thực hiện các truy vấn và mô hình dữ liệu dựa trên dữ liệu được lưu trữ, bao gồm phân tích lịch sử (mô tả các sự kiện đã xảy ra trong quá khứ) và phân tích dự đoán (mô tả các sự kiện dự kiến trong tương lai);
Chuyển thànhChuyển đổi dữ liệu thành các cấu trúc có thể sử dụng để phân tích và quản lý các quy trình cũng như tài nguyên;
Phân tích và đầu raNó cung cấp cho các nhà phân tích và nhà khoa học dữ liệu một giao diện có thể theo dõi thông tin chi tiết và cộng tác, hiển thị kết quả phân tích dữ liệu cho người dùng nội bộ và bên ngoài, đồng thời nhúng các mô hình dữ liệu vào các ứng dụng hướng đến người dùng.

Với sự phát triển nhanh chóng của hệ sinh thái dữ liệu, khái niệm “nền tảng dữ liệu” đã xuất hiện. Từ góc độ ngành, đặc điểm xác định của nền tảng là sự phụ thuộc lẫn nhau về công nghệ và kinh tế của nhà cung cấp nền tảng có ảnh hưởng và một số lượng lớn các nhà phát triển bên thứ ba. Từ góc độ nền tảng, ngăn xếp công nghệ dữ liệu được chia thành “front-end” và “back-end”.

“Phần phụ trợ” nói chung bao gồm trích xuất, lưu trữ, xử lý và chuyển đổi dữ liệu, đã bắt đầu hợp nhất xung quanh một số ít nhà cung cấp dịch vụ đám mây. Do đó, dữ liệu khách hàng được thu thập trong một bộ hệ thống tiêu chuẩn và các nhà cung cấp đang đầu tư mạnh vào việc làm cho các nhà phát triển khác có thể dễ dàng truy cập dữ liệu này. Đây cũng là nguyên tắc thiết kế cơ bản của các hệ thống như Databricks và được triển khai thông qua các hệ thống như tiêu chuẩn SQL và API điện toán tùy chỉnh như Snowflake.

Các kỹ sư Front-end tận dụng điểm tích hợp duy nhất này để xây dựng một loạt ứng dụng mới.Họ dựa vào dữ liệu được làm sạch và tích hợp trong kho/hồ dữ liệu mà không phải lo lắng về các chi tiết cơ bản về cách dữ liệu được tạo ra. Một khách hàng có thể xây dựng và mua nhiều ứng dụng trên hệ thống dữ liệu cốt lõi. Chúng tôi thậm chí còn bắt đầu thấy các hệ thống doanh nghiệp truyền thống, chẳng hạn như phân tích tài chính hoặc sản phẩm, đang được cơ cấu lại bằng cách sử dụng kiến trúc gốc kho hàng.

Khi nền tảng công nghệ dữ liệu dần hoàn thiện, các ứng dụng dữ liệu trên nền tảng dữ liệu cũng ngày càng phát triển. Do tiêu chuẩn hóa, việc áp dụng nền tảng dữ liệu mới chưa bao giờ quan trọng hơn và việc duy trì nền tảng phù hợp trở nên cực kỳ quan trọng. Ở quy mô lớn, nền tảng có thể cực kỳ có giá trị. Ngày nay, có sự cạnh tranh gay gắt giữa các nhà cung cấp hệ thống dữ liệu cốt lõi, không chỉ đối với hoạt động kinh doanh hiện tại mà còn đối với trạng thái nền tảng lâu dài. Việc định giá đáng kinh ngạc đối với các công ty thu thập và chuyển đổi dữ liệu sẽ dễ hiểu hơn nếu bạn coi rằng các mô-đun thu thập và chuyển đổi dữ liệu là phần cốt lõi của nền tảng dữ liệu mới nổi.

Tuy nhiên, các nhóm công nghệ này được hình thành theo cách tiếp cận sử dụng dữ liệu do các công ty lớn thống trị. Khi hiểu biết của xã hội về dữ liệu ngày càng sâu sắc, mọi người tin rằng dữ liệu, như đất đai, lao động, vốn và công nghệ, là những yếu tố sản xuất có thể được thị trường phân bổ. Dữ liệu là một trong năm yếu tố sản xuất chính và những gì được phản ánh đằng sau nó là giá trị tài sản của dữ liệu.

Để hiện thực hóa cấu hình của thị trường phần tử dữ liệu, nền tảng công nghệ hiện tại còn lâu mới đáp ứng được nhu cầu. Trong lĩnh vực Web3 được tích hợp chặt chẽ với công nghệ blockchain, cơ sở hạ tầng dữ liệu mới đang phát triển và phát triển. Các cơ sở hạ tầng này sẽ được nhúng vào kiến trúc cơ sở hạ tầng dữ liệu hiện đại để hiện thực hóa việc xác định quyền sở hữu dữ liệu, giao dịch lưu thông, phân phối thu nhập và quản trị yếu tố. Bốn lĩnh vực này rất quan trọng xét từ góc độ quản lý của chính phủ và do đó cần được quan tâm đặc biệt.

Kiến trúc cơ sở hạ tầng dữ liệu lai Web3

Lấy cảm hứng từ kiến trúc cơ sở hạ tầng dữ liệu hợp nhất a16z (2.0) và tích hợp sự hiểu biết về kiến trúc cơ sở hạ tầng Web3, chúng tôi đề xuất kiến trúc cơ sở hạ tầng dữ liệu lai Web3 sau đây.

Giải thích nền kinh tế dữ liệu Web3 từ góc độ đầy đủ, theo dõi cấp độ 100 tỷ tiếp theo sau LSD

Orange là đơn vị ngăn xếp công nghệ duy nhất cho Web3. Do công nghệ phi tập trung vẫn đang trong giai đoạn phát triển ban đầu nên hầu hết các ứng dụng trong lĩnh vực Web3 vẫn sử dụng kiến trúc cơ sở hạ tầng dữ liệu lai này. Phần lớn các ứng dụng không thực sự là cấu trúc thượng tầng. Kiến trúc thượng tầng có các đặc điểm là không thể ngăn cản, tự do, có giá trị, có thể mở rộng, không được phép, có các tác động bên ngoài tích cực và tính trung lập đáng tin cậy. Nó tồn tại như một hàng hóa công cộng trong thế giới kỹ thuật số và là cơ sở hạ tầng công cộng của thế giới Metaverse. Điều này đòi hỏi một kiến trúc cơ bản hoàn toàn phi tập trung để hỗ trợ nó.

Kiến trúc cơ sở hạ tầng dữ liệu truyền thống phát triển dựa trên sự phát triển kinh doanh của doanh nghiệp. a16z tóm tắt nó thành hai hệ thống (hệ thống phân tích và hệ thống kinh doanh) và ba kịch bản (thông minh kinh doanh hiện đại, xử lý dữ liệu đa mô hình, trí tuệ nhân tạo và học máy). Đây là bản tóm tắt dưới góc độ doanh nghiệp - dữ liệu phục vụ cho sự phát triển của doanh nghiệp.

Giải thích nền kinh tế dữ liệu Web3 từ góc độ đầy đủ, theo dõi cấp độ 100 tỷ tiếp theo sau LSD

Nguồn: a16z

Tuy nhiên, không chỉ các doanh nghiệp, xã hội và cá nhân mới được hưởng lợi từ việc tăng năng suất do các yếu tố dữ liệu mang lại. Các quốc gia trên thế giới lần lượt đưa ra các chính sách và quy định với hy vọng tiêu chuẩn hóa việc sử dụng dữ liệu từ cấp quy định và thúc đẩy việc lưu thông dữ liệu. Điều này bao gồm nhiều Ngân hàng dữ liệu khác nhau thường thấy ở Nhật Bản, trao đổi dữ liệu gần đây đã xuất hiện ở Trung Quốc và các nền tảng giao dịch đã được sử dụng rộng rãi ở Châu Âu và Hoa Kỳ, như BDEX (Mỹ), Streamr (Thụy Sĩ), DAWEX (Pháp) , CARUSO, v.v.

Khi dữ liệu bắt đầu xác định quyền sở hữu, luồng giao dịch, phân phối thu nhập và quản trị, hệ thống và kịch bản của chúng sẽ không chỉ trao quyền cho việc ra quyết định và phát triển kinh doanh của chính công ty. Các hệ thống và kịch bản này yêu cầu sự trợ giúp của công nghệ blockchain hoặc phụ thuộc nhiều vào sự giám sát chính sách.

Web3 là mảnh đất tự nhiên cho thị trường yếu tố dữ liệu. Về mặt kỹ thuật, nó loại bỏ khả năng gian lận, giảm đáng kể áp lực pháp lý và cho phép dữ liệu tồn tại như một yếu tố sản xuất thực sự và được định cấu hình theo định hướng thị trường.

Giải thích nền kinh tế dữ liệu Web3 từ góc độ đầy đủ, theo dõi cấp độ 100 tỷ tiếp theo sau LSD

Trong bối cảnh Web3, mô hình sử dụng dữ liệu mới bao gồm các hệ thống thị trường mang các phần tử dữ liệu luân chuyển và các hệ thống công cộng quản lý các phần tử dữ liệu công cộng. Chúng bao gồm ba kịch bản kinh doanh dữ liệu mới: tích hợp phát triển dữ liệu quyền sở hữu, lớp dữ liệu ban đầu có thể tổng hợp và khai thác dữ liệu công cộng.

Một số kịch bản này được tích hợp chặt chẽ với cơ sở hạ tầng dữ liệu truyền thống và thuộc kiến trúc cơ sở hạ tầng dữ liệu lai Web3; một số kịch bản tách biệt khỏi kiến trúc truyền thống và được hỗ trợ hoàn toàn bởi các công nghệ mới có nguồn gốc từ Web3.

Web3 và nền kinh tế dữ liệu

Thị trường kinh tế dữ liệu là chìa khóa để định cấu hình các thành phần dữ liệu, bao gồm việc phát triển và tích hợp dữ liệu sản phẩm và thị trường lớp dữ liệu ban đầu với khả năng kết hợp. Trong một thị trường kinh tế dữ liệu tuân thủ và hiệu quả, những điểm sau đây rất quan trọng:

Quyền sở hữu dữ liệuNó là chìa khóa để bảo vệ quyền lợi và việc sử dụng tuân thủ, cần được phân bổ và xử lý một cách có cấu trúc, đồng thời việc sử dụng dữ liệu cần phải xác nhận cơ chế ủy quyền. Mỗi người tham gia đều có quyền và lợi ích liên quan.
giao dịch lưu thôngNó đòi hỏi sự tích hợp trong và ngoài trang web cũng như sự tuân thủ và hiệu quả. Nó phải dựa trên bốn nguyên tắc về nguồn dữ liệu có thể xác nhận, phạm vi sử dụng có thể xác định, quy trình lưu thông có thể theo dõi và các rủi ro bảo mật có thể phòng ngừa được.
hệ thống phân phối thu nhậpCần phải hiệu quả và công bằng. Theo nguyên tắc “ai đầu tư, ai đóng góp, ai được hưởng lợi”, chính phủ cũng có thể đóng vai trò hướng dẫn và điều tiết trong việc phân phối thu nhập từ các yếu tố dữ liệu.
Quản trị nhân tố là an toàn, có thể kiểm soát, linh hoạt và toàn diện.Điều này đòi hỏi phải đổi mới cơ chế quản trị dữ liệu của chính phủ, thiết lập hệ thống tín dụng thị trường phần tử dữ liệu và khuyến khích các doanh nghiệp tích cực tham gia xây dựng thị trường phần tử dữ liệu. chúng ta cần thúc đẩy các nhà cung cấp dữ liệu và các tổ chức dịch vụ chuyên nghiệp bên thứ ba. Hệ thống cam kết và tuyên bố giao dịch lưu thông dữ liệu.

Các nguyên tắc trên là nguyên tắc cơ bản để các cơ quan quản lý xem xét nền kinh tế dữ liệu. Trong ba kịch bản phát triển và tích hợp dữ liệu quyền sở hữu, lớp dữ liệu ban đầu có thể kết hợp và khai thác dữ liệu công cộng, chúng ta có thể suy nghĩ dựa trên những nguyên tắc này. Chúng ta cần cơ sở hạ tầng nào để hỗ trợ nó? Những cơ sở hạ tầng này có thể nắm bắt được giá trị gì ở giai đoạn nào?

Kịch bản 1: Phát triển và tích hợp dữ liệu quyền tài sản

Giải thích nền kinh tế dữ liệu Web3 từ góc độ đầy đủ, theo dõi cấp độ 100 tỷ tiếp theo sau LSD

Lưu ý: Màu cam là đơn vị giao nhau của Web2 và Web3

Trong quá trình phát triển dữ liệu quyền sở hữu, cần thiết lập cơ chế xác nhận và ủy quyền quyền phân loại và phân cấp để xác định quyền sở hữu, quyền sử dụng và quyền vận hành đối với dữ liệu công cộng, dữ liệu doanh nghiệp và dữ liệu cá nhân. Theo nguồn dữ liệu và đặc điểm tạo, quyền sở hữu của dữ liệu được xác định thông qua điều chỉnh dữ liệu. Trong số đó, các dự án tiêu biểu có thể kể đến Navigate, Streamr Network và KYVE, v.v. Các dự án này đạt được tiêu chuẩn hóa chất lượng dữ liệu, thu thập dữ liệu và tiêu chuẩn hóa giao diện thông qua các phương tiện kỹ thuật, xác nhận quyền của dữ liệu ngoài chuỗi dưới một số hình thức và thực hiện phân loại dữ liệu và ủy quyền phân cấp thông qua hợp đồng thông minh hoặc hệ thống logic nội bộ.

Các loại dữ liệu có thể áp dụng trong trường hợp này là dữ liệu không công khai, tức là dữ liệu doanh nghiệp và dữ liệu cá nhân. Giá trị của các yếu tố dữ liệu phải được kích hoạt theo cách định hướng thị trường thông qua “việc sử dụng chung và lợi ích chung”.

Dữ liệu doanh nghiệp bao gồm dữ liệu được các chủ thể thị trường khác nhau thu thập và xử lý trong hoạt động sản xuất kinh doanh không liên quan đến thông tin cá nhân và lợi ích công cộng. Các thực thể thị trường có quyền nắm giữ, sử dụng và thu được thu nhập theo quy định của pháp luật cũng như quyền nhận được lợi nhuận hợp lý cho sức lao động và các đóng góp yếu tố khác của họ.
Dữ liệu cá nhân yêu cầu người xử lý dữ liệu thu thập, lưu giữ, lưu trữ và sử dụng dữ liệu theo luật pháp và quy định trong phạm vi ủy quyền cá nhân. Sử dụng các phương tiện công nghệ tiên tiến để thúc đẩy việc ẩn danh thông tin cá nhân và đảm bảo an toàn thông tin và quyền riêng tư cá nhân khi sử dụng thông tin cá nhân. Khám phá cơ chế để người được ủy thác đại diện cho lợi ích cá nhân và giám sát việc thu thập, xử lý và sử dụng dữ liệu thông tin cá nhân của các thực thể thị trường. Đối với dữ liệu thông tin cá nhân đặc biệt liên quan đến an ninh quốc gia, các đơn vị liên quan có thể được phép sử dụng dữ liệu đó theo quy định của pháp luật.

Tình huống 2: Lớp dữ liệu ban đầu có thể kết hợp

Giải thích nền kinh tế dữ liệu Web3 từ góc độ đầy đủ, theo dõi cấp độ 100 tỷ tiếp theo sau LSD

Lưu ý: Màu cam là đơn vị giao nhau của Web2 và Web3

Các lớp dữ liệu ban đầu có thể tổng hợp là một phần quan trọng của thị trường nền kinh tế dữ liệu. Khác với dữ liệu về quyền sở hữu chung, đặc điểm rõ ràng nhất của phần dữ liệu này là cần xác định định dạng chuẩn của dữ liệu thông qua quản lý lược đồ dữ liệu. Khác với tiêu chuẩn hóa chất lượng, thu thập và giao diện của thích ứng dữ liệu, điểm nhấn ở đây là tiêu chuẩn hóa các mẫu dữ liệu, bao gồm các định dạng dữ liệu tiêu chuẩn và mô hình dữ liệu tiêu chuẩn. Ceramic và Lens là những công ty tiên phong trong lĩnh vực này. Họ đảm bảo các chế độ tiêu chuẩn tương ứng cho dữ liệu ngoài chuỗi (lưu trữ phi tập trung) và dữ liệu trên chuỗi, giúp dữ liệu có thể tổng hợp được.

Được xây dựng dựa trên các công cụ quản lý lược đồ dữ liệu này là lớp dữ liệu ban đầu có thể tổng hợp, thường được gọi là lớp dữ liệu, chẳng hạn như Cyberconnect, KNN 3, v.v.

Lớp dữ liệu ban đầu có thể kết hợp hiếm khi liên quan đến ngăn xếp công nghệ Web2, nhưng công cụ đọc dữ liệu nóng dựa trên Ceramic đã phá vỡ điều này, đây sẽ là một bước đột phá rất quan trọng. Nhiều dữ liệu tương tự không cần lưu trữ trên blockchain và rất khó lưu trữ trên blockchain mà cần được lưu trữ trên mạng phi tập trung, chẳng hạn như bài đăng, lượt thích và bình luận của người dùng, v.v. với tần suất cao và thấp Data, Ceramic cung cấp mô hình lưu trữ cho loại dữ liệu này.

Dữ liệu ban đầu có thể tổng hợp là kịch bản quan trọng cho sự đổi mới trong kỷ nguyên mới và là biểu tượng quan trọng cho sự kết thúc của quyền bá chủ dữ liệu và độc quyền dữ liệu. Nó có thể giải quyết vấn đề khởi đầu nguội của các công ty khởi nghiệp về mặt dữ liệu và kết hợp các tập dữ liệu hoàn thiện và tập dữ liệu mới, từ đó cho phép các công ty khởi nghiệp xây dựng lợi thế cạnh tranh dữ liệu nhanh hơn. Đồng thời, các công ty khởi nghiệp được phép tập trung vào giá trị dữ liệu gia tăng và độ mới của dữ liệu, từ đó tiếp tục đạt được khả năng cạnh tranh cho các ý tưởng đổi mới của họ. Bằng cách này, lượng lớn dữ liệu sẽ không trở thành con hào cho các công ty lớn.

Kịch bản 3: Khai thác dữ liệu công khai

Giải thích nền kinh tế dữ liệu Web3 từ góc độ đầy đủ, theo dõi cấp độ 100 tỷ tiếp theo sau LSD

Lưu ý: Màu cam là đơn vị giao nhau của nhiều loại

Khai thác dữ liệu công cộng không phải là một kịch bản ứng dụng mới, nhưng trong nền tảng công nghệ Web3, nó đã được nhấn mạnh hơn bao giờ hết.

Dữ liệu công truyền thống bao gồm dữ liệu công do các cơ quan đảng, chính phủ, doanh nghiệp và tổ chức tạo ra khi họ thực hiện nhiệm vụ theo quy định của pháp luật hoặc cung cấp dịch vụ công. Các cơ quan quản lý khuyến khích việc cung cấp dữ liệu đó cho xã hội dưới dạng mô hình, xác minh và các sản phẩm, dịch vụ khác theo yêu cầu dữ liệu gốc không rời khỏi miền và dữ liệu có sẵn và vô hình trên tiền đề của bảo vệ quyền riêng tư cá nhân và đảm bảo an toàn công cộng. Họ sử dụng các ngăn xếp công nghệ truyền thống (màu xanh lam và một số màu cam, màu cam tượng trưng cho sự giao nhau của nhiều loại ngăn xếp công nghệ, giống như bên dưới).

Trong Web3, dữ liệu giao dịch và dữ liệu hoạt động trên blockchain là một loại dữ liệu công khai khác, được đặc trưng bởi có sẵn và hiển thị, do đó, chúng thiếu quyền riêng tư dữ liệu, bảo mật dữ liệu và khả năng xác nhận ủy quyền sử dụng dữ liệu và thực sự là Hàng hóa công cộng. Họ áp dụng các ngăn xếp công nghệ (màu vàng và một phần màu cam) với blockchain và hợp đồng thông minh làm cốt lõi.
Dữ liệu trên lưu trữ phi tập trung chủ yếu là dữ liệu ứng dụng Web3 ngoài các giao dịch, hiện tại chủ yếu là lưu trữ tệp và đối tượng, ngăn xếp công nghệ tương ứng vẫn chưa trưởng thành (màu xanh lá cây và một số màu cam). Các vấn đề thường gặp trong quá trình sản xuất và khai thác dữ liệu công cộng đó bao gồm lưu trữ nóng và lạnh, lập chỉ mục, đồng bộ hóa trạng thái, quản lý và tính toán quyền, v.v.

Nhiều ứng dụng dữ liệu đã xuất hiện trong kịch bản này, không phải là cơ sở hạ tầng dữ liệu mà là nhiều công cụ dữ liệu hơn, bao gồm Nansen, Dune, NFTScan, 0x Scope, v.v.

Trường hợp: Trao đổi dữ liệu

Trao đổi dữ liệu đề cập đến một nền tảng để giao dịch dữ liệu như một loại hàng hóa. Chúng có thể được phân loại và so sánh dựa trên đối tượng giao dịch, cơ chế định giá, đảm bảo chất lượng, v.v. DataStreamX, Dawex và Ocean Protocol là một số sàn giao dịch dữ liệu điển hình trên thị trường.

Ocean Protocol (vốn hóa thị trường 200 triệu) là giao thức nguồn mở được thiết kế để cho phép các doanh nghiệp và cá nhân trao đổi và kiếm tiền từ dữ liệu cũng như các dịch vụ dựa trên dữ liệu. Giao thức này dựa trên chuỗi khối Ethereum và sử dụng mã thông báo dữ liệu để kiểm soát quyền truy cập vào các tập dữ liệu. Mã thông báo dữ liệu là mã thông báo ERC 20 đặc biệt thể hiện quyền sở hữu hoặc quyền sử dụng của tập dữ liệu hoặc dịch vụ dữ liệu. Người dùng có thể mua hoặc kiếm mã thông báo dữ liệu để có được thông tin họ cần.

Kiến trúc kỹ thuật của Ocean Protocol chủ yếu bao gồm các phần sau:

Nhà cung cấp: đề cập đến các nhà cung cấp dữ liệu hoặc dịch vụ dữ liệu, họ có thể phát hành và bán mã thông báo dữ liệu của riêng mình thông qua Ocean Protocol để kiếm thu nhập.
Người tiêu dùng: là những người có nhu cầu mua và sử dụng dữ liệu hoặc dịch vụ dữ liệu, họ có thể mua hoặc kiếm được mã thông báo dữ liệu cần thiết thông qua Ocean Protocol để có được quyền truy cập.
Thị trường: đề cập đến thị trường giao dịch dữ liệu mở, minh bạch và công bằng do Ocean Protocol hoặc bên thứ ba cung cấp, có thể kết nối nhà cung cấp và người tiêu dùng trên toàn thế giới và cung cấp mã thông báo dữ liệu trong nhiều loại và lĩnh vực khác nhau. Thị trường có thể giúp các tổ chức khám phá các cơ hội kinh doanh mới, tăng nguồn doanh thu, tối ưu hóa hiệu quả hoạt động và tạo ra nhiều giá trị hơn.
Mạng: đề cập đến lớp mạng phi tập trung do Ocean Protocol cung cấp, có thể hỗ trợ trao đổi dữ liệu thuộc nhiều loại và quy mô khác nhau, đồng thời đảm bảo tính bảo mật, độ tin cậy và minh bạch trong quá trình giao dịch dữ liệu. Lớp mạng là một tập hợp các hợp đồng thông minh được sử dụng để đăng ký dữ liệu, ghi lại thông tin quyền sở hữu, hỗ trợ trao đổi dữ liệu an toàn, v.v.
Người quản lý: đề cập đến vai trò trong hệ sinh thái chịu trách nhiệm sàng lọc, quản lý và xem xét các bộ dữ liệu. Họ chịu trách nhiệm xem xét thông tin nguồn, nội dung, định dạng và giấy phép của bộ dữ liệu để đảm bảo rằng bộ dữ liệu đáp ứng các tiêu chuẩn và có thể được những người dùng khác tin tưởng và sử dụng.
Người xác minh: Đề cập đến vai trò trong hệ sinh thái chịu trách nhiệm xác minh và xem xét các giao dịch dữ liệu và dịch vụ dữ liệu, họ xem xét và xác minh các giao dịch giữa nhà cung cấp dịch vụ dữ liệu và người tiêu dùng để đảm bảo chất lượng, tính sẵn có và chất lượng của dịch vụ dữ liệu và độ chính xác.

Giải thích nền kinh tế dữ liệu Web3 từ góc độ đầy đủ, theo dõi cấp độ 100 tỷ tiếp theo sau LSD

Nguồn: Giao thức đại dương

Dịch vụ dữ liệu do nhà cung cấp dữ liệu tạo ra bao gồm dữ liệu, thuật toán, tính toán, lưu trữ, phân tích và quản lý. Các thành phần này được gắn với các thỏa thuận thực thi của dịch vụ (chẳng hạn như thỏa thuận cấp độ dịch vụ), tính toán bảo mật, kiểm soát truy cập và quyền. Về cơ bản, điều này kiểm soát quyền truy cập vào “bộ dịch vụ đám mây” thông qua hợp đồng thông minh.

Giải thích nền kinh tế dữ liệu Web3 từ góc độ đầy đủ, theo dõi cấp độ 100 tỷ tiếp theo sau LSD

Nguồn: Giao thức đại dương

Ưu điểm là,

Các giao thức mã nguồn mở, linh hoạt và có thể mở rộng giúp các tổ chức và cá nhân tạo ra hệ sinh thái dữ liệu độc đáo của riêng mình.
Lớp mạng phi tập trung dựa trên công nghệ blockchain có thể đảm bảo tính bảo mật, độ tin cậy và tính minh bạch trong quá trình giao dịch dữ liệu, đồng thời bảo vệ quyền riêng tư và quyền của nhà cung cấp và người tiêu dùng.
Một thị trường dữ liệu mở, minh bạch và công bằng có thể kết nối các nhà cung cấp và người tiêu dùng trên toàn thế giới và cung cấp mã thông báo dữ liệu ở nhiều loại và lĩnh vực.

Ocean Protocol là một ví dụ điển hình của kiến trúc lai. Dữ liệu của nó có thể được lưu trữ ở nhiều nơi khác nhau, bao gồm các dịch vụ lưu trữ đám mây truyền thống, mạng lưu trữ phi tập trung hoặc máy chủ của chính nhà cung cấp dữ liệu. Giao thức xác định và quản lý quyền sở hữu và quyền truy cập dữ liệu thông qua mã thông báo dữ liệu và NFT dữ liệu. Ngoài ra, giao thức còn cung cấp chức năng tính toán dữ liệu, cho phép người tiêu dùng dữ liệu phân tích và xử lý dữ liệu mà không làm lộ dữ liệu gốc.

Giải thích nền kinh tế dữ liệu Web3 từ góc độ đầy đủ, theo dõi cấp độ 100 tỷ tiếp theo sau LSD

Nguồn: Giao thức đại dương

Mặc dù Ocean Protocol là một trong những nền tảng giao dịch dữ liệu hoàn thiện nhất trên thị trường ở giai đoạn này nhưng nó vẫn phải đối mặt với nhiều thách thức:

Thiết lập cơ chế tin cậy hiệu quả, để tăng sự tin cậy giữa nhà cung cấp dữ liệu và người yêu cầu và giảm rủi ro giao dịch. Ví dụ: thiết lập hệ thống tín dụng thị trường yếu tố dữ liệu để lưu giữ và xác minh chứng chỉ thông qua chuỗi khối nhằm xác định hành vi không đáng tin cậy trong giao dịch dữ liệu, khuyến khích đáng tin cậy, hình phạt không đáng tin cậy, sửa chữa tín dụng, xử lý phản đối, v.v.
Thiết lập cơ chế giá cả hợp lý, để phản ánh giá trị thực của các sản phẩm dữ liệu, thúc đẩy các nhà cung cấp dữ liệu cung cấp dữ liệu chất lượng cao và thu hút nhiều người có nhu cầu hơn.
Thiết lập một đặc điểm kỹ thuật tiêu chuẩn thống nhất, để thúc đẩy khả năng tương tác và tương thích giữa dữ liệu có định dạng, loại, nguồn và cách sử dụng khác nhau.

Trường hợp: Thị trường mô hình dữ liệu

Trong Vũ trụ dữ liệu của họ, Ceramic đề cập đến thị trường mô hình dữ liệu mở mà họ muốn tạo, thị trường này có thể tăng năng suất đáng kể vì dữ liệu yêu cầu khả năng tương tác. Thị trường mô hình dữ liệu như vậy được kích hoạt bởi sự đồng thuận mới nổi về mô hình dữ liệu, tương tự như tiêu chuẩn hợp đồng ERC trong Ethereum, từ đó các nhà phát triển có thể chọn làm mẫu chức năng để có ứng dụng phù hợp với tất cả dữ liệu của mô hình dữ liệu đó. Ở giai đoạn này, thị trường như vậy không phải là thị trường giao dịch.

Về mô hình dữ liệu, một ví dụ đơn giản là trong mạng xã hội phi tập trung, mô hình dữ liệu có thể được đơn giản hóa thành 4 tham số, đó là:

PostList: lưu trữ chỉ mục các bài viết của người dùng
Bài viết: lưu trữ một bài viết duy nhất
Hồ sơ: lưu trữ thông tin người dùng
FollowList: lưu trữ danh sách theo dõi của người dùng

Vậy làm cách nào để tạo, chia sẻ và sử dụng lại các mô hình dữ liệu trên Ceramic, cho phép khả năng tương tác dữ liệu giữa các ứng dụng?

Ceramic cung cấp Cơ quan đăng ký DataModels, một kho lưu trữ mã nguồn mở do cộng đồng xây dựng gồm các mô hình dữ liệu ứng dụng có thể tái sử dụng cho Ceramic. Đây là nơi các nhà phát triển có thể đăng ký, khám phá và tái sử dụng một cách công khai các mô hình dữ liệu hiện có - nền tảng cho các ứng dụng vận hành của khách hàng được xây dựng trên các mô hình dữ liệu dùng chung. Hiện tại, nó dựa trên bộ lưu trữ Github và trong tương lai nó sẽ được phân cấp trên Ceramic.

Tất cả các mô hình dữ liệu được thêm vào sổ đăng ký sẽ tự động được xuất bản lên gói plugin npm của @datamodels. Bất kỳ nhà phát triển nào cũng có thể sử dụng @datamodels/model-name để cài đặt một hoặc nhiều mô hình dữ liệu, giúp chúng có sẵn để lưu trữ hoặc truy xuất dữ liệu trong thời gian chạy bằng bất kỳ ứng dụng khách IDX nào, bao gồm DID DataStore hoặc Self.ID.

Ngoài ra, Ceramic cũng đã xây dựng diễn đàn DataModels trên nền tảng Github, mỗi model trong data model register đều có thread thảo luận riêng trên diễn đàn, qua đó cộng đồng có thể bình luận, thảo luận. Đây cũng là nơi để các nhà phát triển đăng ý tưởng về các mô hình dữ liệu để nhận ý kiến đóng góp từ cộng đồng trước khi thêm chúng vào sổ đăng ký. Mọi thứ hiện đang ở giai đoạn đầu và không có nhiều mô hình dữ liệu trong sổ đăng ký. Các mô hình dữ liệu có trong sổ đăng ký phải được cộng đồng đánh giá và được gọi là tiêu chuẩn CIP, giống như các tiêu chuẩn hợp đồng thông minh của Ethereum, cung cấp Khả năng kết hợp dữ liệu.

Trường hợp: Kho dữ liệu phi tập trung

Không gian và Thời gian là kho dữ liệu phi tập trung đầu tiên kết nối dữ liệu trên chuỗi và ngoài chuỗi để hỗ trợ các trường hợp sử dụng hợp đồng thông minh thế hệ mới. Space and Time (SxT) có dịch vụ lập chỉ mục blockchain hoàn thiện nhất trong ngành. Kho dữ liệu SxT cũng sử dụng mật mã mới có tên Proof of SQL™ để tạo ra các kết quả chống giả mạo có thể kiểm chứng, cho phép các nhà phát triển dễ dàng. Định dạng SQL tham gia không cần tin cậy trên- dữ liệu chuỗi và ngoài chuỗi, đồng thời tải kết quả trực tiếp vào hợp đồng thông minh, hỗ trợ các truy vấn dưới giây và phân tích cấp doanh nghiệp theo cách hoàn toàn chống giả mạo và gắn liền với blockchain.

Giải thích nền kinh tế dữ liệu Web3 từ góc độ đầy đủ, theo dõi cấp độ 100 tỷ tiếp theo sau LSD

Không gian và Thời gian là mạng hai lớp bao gồm lớp xác nhận và kho dữ liệu. Sự thành công của nền tảng SxT phụ thuộc vào sự tương tác liền mạch giữa trình xác thực và kho dữ liệu để tạo điều kiện truy vấn đơn giản và an toàn dữ liệu trên chuỗi và ngoài chuỗi.

Kho dữ liệu bao gồm các mạng cơ sở dữ liệu và cụm máy tính được kiểm soát và định tuyến đến các trình xác thực không gian và thời gian. Không gian và thời gian sử dụng giải pháp kho bãi rất linh hoạt: HTAP (Xử lý phân tích/giao dịch lai).
Trình xác thực giám sát, ra lệnh và xác thực các dịch vụ do các cụm này cung cấp, sau đó điều phối luồng dữ liệu và truy vấn giữa người dùng cuối và cụm kho dữ liệu. Trình xác thực cung cấp phương tiện để dữ liệu đi vào hệ thống (chẳng hạn như chỉ mục blockchain) và để dữ liệu thoát khỏi hệ thống (chẳng hạn như hợp đồng thông minh).

Định tuyến - cho phép tương tác giao dịch và truy vấn với mạng kho dữ liệu phi tập trung
Truyền trực tuyến – Hoạt động như một phần chìm cho khối lượng công việc phát trực tuyến khối lượng lớn của khách hàng (theo hướng sự kiện)
Đồng thuận - Cung cấp khả năng chịu lỗi Byzantine hiệu suất cao cho dữ liệu vào và ra khỏi nền tảng
Bằng chứng truy vấn – Cung cấp bằng chứng SQL cho nền tảng
Neo bảng - cung cấp bằng chứng lưu trữ cho nền tảng bằng cách neo bảng vào chuỗi
Oracle - hỗ trợ các tương tác Web3, bao gồm lắng nghe sự kiện hợp đồng thông minh và nhắn tin/chuyển tiếp chuỗi chéo
Bảo mật – ngăn chặn truy cập không được xác thực và trái phép vào nền tảng

Giải thích nền kinh tế dữ liệu Web3 từ góc độ đầy đủ, theo dõi cấp độ 100 tỷ tiếp theo sau LSD

Nền tảng Không gian và Thời gian là cấu trúc dữ liệu phi tập trung đầu tiên trên thế giới, mở ra một thị trường mạnh mẽ nhưng chưa được phục vụ: chia sẻ dữ liệu. Trong nền tảng Không gian và Thời gian, các công ty có thể chia sẻ dữ liệu một cách tự do và sử dụng hợp đồng thông minh để giao dịch dữ liệu được chia sẻ. Ngoài ra, các tập dữ liệu có thể được kiếm tiền theo cách tổng hợp thông qua bằng chứng SQL mà không cấp cho người tiêu dùng quyền truy cập vào dữ liệu thô. Người tiêu dùng dữ liệu có thể tin tưởng rằng việc tổng hợp là chính xác mà không cần xem chính dữ liệu đó, vì vậy, nhà cung cấp dữ liệu không còn phải là người tiêu dùng dữ liệu nữa. Vì lý do này mà sự kết hợp giữa bằng chứng SQL và lược đồ cấu trúc dữ liệu có khả năng dân chủ hóa các hoạt động dữ liệu vì bất kỳ ai cũng có thể đóng góp vào việc nhập, chuyển đổi và cung cấp các tập dữ liệu.

Quản trị và khám phá dữ liệu Web3

Hiện tại, kiến trúc cơ sở hạ tầng dữ liệu Web3 thiếu cấu trúc quản trị dữ liệu thực tế và hiệu quả. Tuy nhiên, cơ sở hạ tầng quản trị dữ liệu thực tế và hiệu quả là rất quan trọng để định cấu hình các thành phần dữ liệu theo lợi ích liên quan của mỗi người tham gia.

Đối với nguồn dữ liệu, cần phải có sự đồng ý rõ ràng và quyền tự do lấy, sao chép và chuyển dữ liệu đó.
Đối với người xử lý dữ liệu, họ cần có khả năng tự chủ kiểm soát, sử dụng dữ liệu và thu được lợi ích.
Đối với các công cụ phái sinh dữ liệu, cần có quyền vận hành.

Hiện tại, khả năng quản trị dữ liệu Web3 là duy nhất và tài sản cũng như dữ liệu (bao gồm cả Ceramic) thường chỉ có thể được kiểm soát bằng cách kiểm soát khóa riêng, hầu như không có khả năng cấu hình phân loại phân cấp. Gần đây, các cơ chế đổi mới của Tableland, FEVM và Greenfield có thể đạt được khả năng quản lý dữ liệu không cần sự tin cậy ở một mức độ nhất định. Các công cụ quản trị dữ liệu truyền thống như Collibra nhìn chung chỉ có thể được sử dụng trong doanh nghiệp và chỉ có độ tin cậy ở cấp độ nền tảng, đồng thời, công nghệ không phi tập trung cũng khiến chúng không thể ngăn chặn được tệ nạn cá nhân và những điểm thất bại duy nhất. Thông qua các công cụ quản trị dữ liệu như Tableland, công nghệ bảo mật, tiêu chuẩn và giải pháp cần thiết cho quá trình lưu thông dữ liệu có thể được đảm bảo.

Trường hợp: Tableland

Tableland Network là một giao thức web3 phi tập trung dành cho dữ liệu quan hệ có cấu trúc, bắt đầu với Ethereum (EVM) và L2 tương thích EVM. Với Tableland, giờ đây có thể triển khai chức năng cơ sở dữ liệu quan hệ web2 truyền thống bằng cách tận dụng lớp blockchain để kiểm soát truy cập. Tuy nhiên, Tableland không phải là một cơ sở dữ liệu mới - nó chỉ là các bảng quan hệ gốc của web3.

Tableland cung cấp một cách mới để các dapp lưu trữ dữ liệu quan hệ trong mạng gốc web3 mà không có những sự đánh đổi này.

giải pháp

Giải thích nền kinh tế dữ liệu Web3 từ góc độ đầy đủ, theo dõi cấp độ 100 tỷ tiếp theo sau LSD

Với Tableland, siêu dữ liệu có thể được thay đổi (sử dụng kiểm soát truy cập nếu cần), được truy vấn (sử dụng SQL quen thuộc) và có thể kết hợp (với các bảng khác trên Tableland) - tất cả đều theo cách hoàn toàn phi tập trung.
Tableland chia cơ sở dữ liệu quan hệ truyền thống thành hai thành phần chính: sổ đăng ký trên chuỗi với logic kiểm soát truy cập (ACL) và bảng ngoài chuỗi (phi tập trung). Mỗi bảng trong Tableland ban đầu được tạo ra dưới dạng mã thông báo ERC 721 trên lớp tương thích EVM cơ bản. Do đó, chủ sở hữu bảng trên chuỗi có thể đặt quyền ACL trên bảng, trong khi mạng Tableland ngoài chuỗi quản lý việc tạo và các thay đổi tiếp theo đối với chính bảng đó. Các liên kết giữa trên chuỗi và ngoài chuỗi đều được xử lý ở cấp hợp đồng, chỉ đơn giản trỏ đến mạng Tableland (sử dụng baseURI + tokenURI, giống như nhiều mã thông báo ERC 721 hiện có sử dụng cổng IPFS hoặc máy chủ lưu trữ cho siêu dữ liệu).

Giải thích nền kinh tế dữ liệu Web3 từ góc độ đầy đủ, theo dõi cấp độ 100 tỷ tiếp theo sau LSD Chỉ những người có quyền trên chuỗi thích hợp mới có thể ghi vào một bảng cụ thể. Tuy nhiên, việc đọc bảng không nhất thiết phải là các hoạt động trên chuỗi và có thể sử dụng cổng Tableland; do đó, các truy vấn đọc là miễn phí và có thể đến từ các yêu cầu giao diện người dùng đơn giản hoặc thậm chí từ các chuỗi khối không phải EVM khác. Bây giờ, để sử dụng Tableland, trước tiên một bảng phải được tạo (tức là được đúc trên chuỗi dưới dạng ERC 721). Địa chỉ triển khai ban đầu được đặt cho chủ sở hữu bảng và chủ sở hữu này có thể đặt quyền cho bất kỳ người dùng nào khác cố gắng tương tác với bảng để thực hiện thay đổi. Ví dụ: chủ sở hữu có thể đặt quy tắc về người có thể cập nhật/chèn/xóa giá trị, dữ liệu nào họ có thể thay đổi và thậm chí quyết định xem họ có sẵn sàng chuyển quyền sở hữu bảng cho bên khác hay không. Ngoài ra, các truy vấn phức tạp hơn có thể kết hợp dữ liệu từ nhiều bảng (được sở hữu hoặc chưa được sở hữu) để tạo ra một lớp dữ liệu quan hệ hoàn toàn động và có thể kết hợp được.

Hãy xem xét sơ đồ sau, tóm tắt sự tương tác của người dùng mới với một bảng đã được một số dapp triển khai lên Tableland:

Giải thích nền kinh tế dữ liệu Web3 từ góc độ đầy đủ, theo dõi cấp độ 100 tỷ tiếp theo sau LSD

Đây là luồng thông tin tổng thể:

1. Người dùng mới tương tác với giao diện người dùng của dapp và cố gắng cập nhật một số thông tin được lưu trữ trong bảng Tableland.

2. Dapp gọi hợp đồng thông minh đăng ký Tableland để chạy câu lệnh SQL này và hợp đồng này sẽ kiểm tra hợp đồng thông minh của dapp, hợp đồng này chứa ACL tùy chỉnh xác định quyền của người dùng mới này. Có một số điểm cần lưu ý:

ACL tùy chỉnh trong hợp đồng thông minh riêng biệt của dapp là trường hợp sử dụng hoàn toàn tùy chọn nhưng nâng cao; nhà phát triển không cần triển khai ACL tùy chỉnh và có thể sử dụng chính sách mặc định của hợp đồng thông minh đăng ký Tableland (chỉ chủ sở hữu mới có toàn quyền).
Bạn cũng có thể sử dụng cổng để viết truy vấn thay vì gọi trực tiếp đến hợp đồng thông minh Tableland. Luôn có tùy chọn để các dapp gọi trực tiếp các hợp đồng thông minh của Tableland, nhưng bất kỳ truy vấn nào cũng có thể được gửi qua cổng, cổng này sẽ chuyển tiếp truy vấn đến chính hợp đồng thông minh theo cách được trợ cấp.

3. Hợp đồng thông minh Tableland lấy các câu lệnh SQL và quyền của người dùng rồi kết hợp chúng vào các sự kiện được phát ra để mô tả các hành động dựa trên SQL sẽ được thực hiện.

4. Nút Trình xác thực Tableland lắng nghe những sự kiện này và sau đó thực hiện một trong các hành động sau:

Nếu người dùng có quyền chính xác để ghi vào bảng, trình xác thực sẽ chạy lệnh SQL tương ứng (ví dụ: chèn một hàng mới vào bảng hoặc cập nhật giá trị hiện có) và phát dữ liệu xác nhận lên mạng Tableland.
Nếu người dùng không có quyền chính xác, Trình xác thực sẽ không thực hiện bất kỳ thao tác nào trên bảng.
Nếu yêu cầu là một truy vấn đọc đơn giản, dữ liệu thích hợp sẽ được trả về; Tableland là mạng dữ liệu quan hệ hoàn toàn mở, nơi bất kỳ ai cũng có thể thực hiện các truy vấn chỉ đọc trên bất kỳ bảng nào.

5. Dapp sẽ có thể phản ánh bất kỳ cập nhật nào xảy ra trên mạng Tableland thông qua cổng.

(Tình huống sử dụng) Những điều cần tránh

Dữ liệu nhận dạng cá nhân - Tableland là một mạng mở và bất kỳ ai cũng có thể đọc dữ liệu từ bất kỳ bảng nào. Do đó, dữ liệu cá nhân không nên được lưu trữ ở Tableland.
Ghi tần số cao, dưới giây - chẳng hạn như bot giao dịch tần số cao.
Lưu trữ mọi tương tác của người dùng trong ứng dụng - việc lưu dữ liệu này vào bảng web3, chẳng hạn như lần nhấn phím hoặc lần nhấp chuột, có thể không có ý nghĩa. Viết tần số dẫn đến chi phí cao.
Các tập dữ liệu rất lớn - nên tránh những tập dữ liệu này và được xử lý tốt nhất thông qua lưu trữ tệp, sử dụng các giải pháp như IPFS, Filecoin hoặc Arweave. Tuy nhiên, các con trỏ tới các vị trí này và siêu dữ liệu liên quan thực sự là một trường hợp sử dụng tốt cho các bảng Tableland.

Suy nghĩ về việc nắm bắt giá trị

Các đơn vị khác nhau đóng một vai trò không thể thay thế trong toàn bộ kiến trúc cơ sở hạ tầng dữ liệu. Giá trị thu được chủ yếu được phản ánh trong giá trị thị trường/định giá và thu nhập ước tính. Có thể rút ra các kết luận sau:

Nguồn dữ liệu là mô-đun có giá trị thu được lớn nhất trong toàn bộ kiến trúc
Tiếp theo là sao chép, chuyển đổi, truyền phát và lưu trữ dữ liệu
Lớp phân tích có thể có dòng tiền tốt nhưng sẽ có giới hạn về định giá

Nói một cách đơn giản, việc nắm bắt giá trị của các công ty/dự án ở phía bên trái của toàn bộ sơ đồ cấu trúc có xu hướng lớn hơn.

Sự tập trung của ngành

Theo phân tích thống kê chưa đầy đủ, mức độ tập trung của ngành có thể được đánh giá như sau:

Hai mô-đun tập trung cao nhất trong ngành là lưu trữ dữ liệu và truy vấn và xử lý dữ liệu.
Sự tập trung của ngành trung bình là khai thác và chuyển đổi dữ liệu
Hai mô-đun có mức độ tập trung vào ngành thấp hơn là nguồn dữ liệu, phân tích và đầu ra.

Mức độ tập trung của các ngành nguồn dữ liệu, phân tích và đầu ra thấp, nhận định ban đầu là các kịch bản kinh doanh khác nhau dẫn đến sự xuất hiện của các kịch bản đứng đầu theo chiều dọc trong từng kịch bản kinh doanh, chẳng hạn như Oracle trong lĩnh vực cơ sở dữ liệu, Stripe trong các dịch vụ của bên thứ ba và dịch vụ doanh nghiệp. Salesforce, Tableau cho phân tích bảng điều khiển, Sisense cho phân tích nhúng, v.v.

Đối với mô-đun trích xuất và chuyển đổi dữ liệu có mức độ tập trung ngành trung bình, ban đầu người ta đánh giá nguyên nhân là do tính chất định hướng công nghệ của các thuộc tính nghiệp vụ. Dạng mô-đun của phần mềm trung gian cũng làm cho chi phí chuyển đổi tương đối thấp.

Các mô-đun lưu trữ và truy vấn và xử lý dữ liệu có mức độ tập trung cao nhất trong ngành.Nhận định sơ bộ là do kịch bản kinh doanh duy nhất, nội dung kỹ thuật cao, chi phí khởi động cao và chi phí chuyển đổi tiếp theo, công ty/dự án có bước đi đầu tiên mạnh mẽ lợi thế và có hiệu ứng mạng.

Mô hình kinh doanh giao thức dữ liệu và lối thoát

Xét về thời điểm thành lập và niêm yết,

Hầu hết các công ty/dự án thành lập trước năm 2010 đều là các công ty/dự án nguồn dữ liệu, Internet di động chưa xuất hiện, lượng dữ liệu chưa lớn, ngoài ra còn có một số dự án đầu ra về lưu trữ và phân tích dữ liệu, chủ yếu là bảng điều khiển.
Từ năm 2010 đến năm 2014, trước sự trỗi dậy của Internet di động, các dự án lưu trữ và truy vấn dữ liệu như Snowflake và Databricks đã ra đời, các dự án trích xuất và chuyển đổi dữ liệu cũng bắt đầu xuất hiện. Trong giai đoạn này, có một số lượng lớn các dự án loại đầu ra phân tích, chủ yếu là loại bảng điều khiển.
Từ năm 2015 đến năm 2020, các dự án truy vấn và xử lý đã mọc lên như nấm, đồng thời một số lượng lớn các dự án trích xuất và chuyển đổi dữ liệu cũng xuất hiện, cho phép mọi người tận dụng tốt hơn sức mạnh của dữ liệu lớn.
Kể từ năm 2020, các cơ sở dữ liệu phân tích thời gian thực và giải pháp hồ dữ liệu mới hơn đã xuất hiện, chẳng hạn như Clickhouse và Tabular.
Việc cải thiện cơ sở hạ tầng là điều kiện tiên quyết cho cái gọi là áp dụng đại trà. Trong thời kỳ ứng dụng quy mô lớn, vẫn có những cơ hội mới, nhưng những cơ hội này hầu như chỉ thuộc về “middleware”, trong khi kho dữ liệu cơ bản, nguồn dữ liệu và các giải pháp khác gần như là kẻ thắng được tất cả, trừ khi có. chất kỹ thuật Đột phá về mặt tình dục, nếu không sẽ khó phát triển.

Các dự án đầu ra phân tích là cơ hội cho các dự án khởi nghiệp ở bất kỳ thời kỳ nào. Nhưng nó cũng liên tục lặp lại và đổi mới, làm những điều mới dựa trên các kịch bản mới.Tableau, xuất hiện trước năm 2010, chiếm hầu hết các công cụ phân tích bảng điều khiển trên máy tính để bàn, và sau đó các kịch bản mới xuất hiện, chẳng hạn như các công cụ DS/ML chuyên nghiệp hơn, Máy trạm dữ liệu được định hướng toàn diện hơn và phân tích nhúng theo định hướng SaaS hơn, v.v.

Nhìn vào giao thức dữ liệu hiện tại của Web3 từ góc độ này:

Tình trạng của các dự án nguồn dữ liệu và lưu trữ vẫn chưa chắc chắn, nhưng dự án dẫn đầu đang bắt đầu xuất hiện. Lưu trữ trạng thái trên chuỗi được dẫn đầu bởi Ethereum (giá trị thị trường là 220 tỷ), trong khi lưu trữ phi tập trung được dẫn đầu bởi Filecoin (giá trị thị trường là 2,3 tỷ) và Arweave (giá thị trường 280 triệu USD) có thể sẽ có sự xuất hiện đột ngột của Greenfield. --Thu thập giá trị cao nhất
Vẫn còn chỗ cho sự đổi mới trong các dự án trích xuất và chuyển đổi dữ liệu. Chainlink oracle dữ liệu (giá trị thị trường là 3,8 tỷ USD) chỉ là bước khởi đầu. Gốm, cơ sở hạ tầng xử lý luồng và luồng sự kiện cũng như nhiều dự án khác sẽ xuất hiện, nhưng không có nhiều phòng. - Nắm bắt giá trị vừa phải
Đối với các dự án truy vấn và xử lý, Graph (giá trị thị trường 1,2 tỷ đồng) đã đáp ứng được hầu hết các nhu cầu, đồng thời loại hình và số lượng dự án vẫn chưa đạt đến giai đoạn bùng nổ. - Nắm bắt giá trị vừa phải
Các dự án phân tích dữ liệu, chủ yếu là Nansen và Dune (trị giá 1 tỷ đồng), yêu cầu các kịch bản mới để có cơ hội mới.NFTScan và NFTGo có phần giống với các kịch bản mới, nhưng chúng chỉ là cập nhật nội dung chứ không phải cấp độ logic/mô hình phân tích. . ---Thu thập giá trị tầm thường và dòng tiền đáng kể.

Nhưng Web3 không phải là bản sao của Web2 và cũng không hoàn toàn là sự phát triển của Web2. Web3 có các nhiệm vụ và kịch bản rất nguyên bản, do đó tạo ra các kịch bản kinh doanh hoàn toàn khác so với trước đây (ba kịch bản đầu tiên đều là những kịch bản trừu tượng có thể được thực hiện hiện tại).