本文引自微信公众号本翼资本CapitalWings 作者:陈云红 张曼丽
人工智能与区块链的关系就好比计算机与互联网之间的关系,计算机为互联网提供了生产工具,互联网为计算机实现了信息互联互通;人工智能将解决区块链在自治化、效率化、节能化以及智能化等方面难题,而区块链将把孤岛化、碎片化的人工智能以共享方式实现通用智能,前者是工具,后者是目的。
我们认为AI和区块链的各自特征及存在的痛点,决定了两者的结合是必然,分布式和去中心化的区块链,将会给AI带来广阔和自由流动的数据市场、AI模块资源和算法资源,同时,将AI加入到区块链,可以让区块链变得更节能、安全、高效,其智能合约、自治组织也将会变得更智能。
因而这两者的结合会有2种不同的方式,而这2种方式的侧重点也有所不同:一是基于区块链,将AI的功能用于优化区块链(包括私链、同盟连、公链)的搭建;二是基于AI,利用区块链的去中心化和价值网络的天然属性,分布式解决AI整体系统的调配,以及实现数据、算法、模型资源的自由流动。
区块链和AI是技术范围的2个极端方面:一方面培养封闭数据平台的集中智能,另一方面在开放数据环境中推动分散式应用。如果我们找到一种智能的方法来使它们一起工作,那么总的积极外部性可能在一瞬间被放大。
1. 区块链给AI带来分布式智能,并实现数据市场的自由流动
首先,针对AI存在的痛点,来探究区块链对AI所作出的里程碑式改变。
说到人工智能,就不能回避大数据。人工智能包含三个核心部分:算法、算力及数据,一个优秀的AI算法模型需要大数据的训练和充足的算力支持,进行不断的优化和升级。人工智能和数据的关系就好比飞梭和珍妮机,过去人类一直构思机器学习方法,但是苦于没有足够多的数据来验证和训练,互联网的爆发终于迎来了大数据时代,但当下的很多数据都掌握在中心机构,如Google、Facebook、BAT等,而AI发展所需的,诸如:个人的消费记录、医疗数据、教育数据、行为数据等,却不能随意被个人支配,数据市场还未形成,中心化的大数据带来的结果就是信息孤岛。
区块链的几大主要特征,如:分布式节点的共识系统、信息的不可篡改、匿名化、去中心化。区块链还有一种非常神奇的计算方法叫零知识证明,它能够向你证明我的数据是非常有价值的,但又不告诉你真正隐私的数据在哪儿。有了区块链之后,数据市场能够使社会变得更加公平,而激励机制使数据共享成为可能,这样我们就用了良性的数据市场,在这个市场里,区块链和人工智能将会达成互相共存的新理念,最终实现各自不同的价值。
改变一:区块链带来的分布式AI,可以实现AI不同功能之间的相互调用,加快AI的发展速度。
如今每个企业都在不同程度上对AI有需求,而当下的AI产品很少能满足企业的需求,而开发个性化的AI产品又有很高的技术壁垒和资金壁垒。即使可以雇佣开发人员来建立自定义AI产品的巨头,也很难聘请足够的AI专家来满足全部需求。比如我们现在所熟知的,科大讯飞主攻语音智能,旷视科技擅长图像、人脸识别,大疆科技主打无人机、百度潜心研制无人驾驶,即使这些业内巨头都只能专注于人工智能的一个领域和一个方向,无法做到全面。但人工智能是一个系统,视觉、听觉系统只是这个系统下的一个子系统,想要真正迎接智能时代,就必须打破各个系统之间的界限,实现各个系统之间的相互调用。
区块链是用一种分布式的方式来运行AI系统的复杂网络,整个网络就好比大脑,而网络中运行的不同AI节点,就好比脑区。即使大脑不控制人体内的每个系统,但基于分布式区块链的网络同样可以为AGI(人工智能)的协调开发创造了一个动态平台。在这个动态平台上,每个AI节点都可以调用其他AI节点的模块和工具包。此外,对于网络攻击者来说,攻击整个分布式网络比攻击个别AI系统更安全,分布式AI系统也会更安全。
图 1:不同AI模块之间的相互调用
(资料来源:本翼资本)
改变二:区块链可以打破封闭的AI开发模式、共享AI资源以及鼓励传统孤岛之间的数据共享。
许多先进的AI工具只存在于由研究生或独立研究人员创建的GitHub(编程社区)存储库中。这使他们不能触及任何人都无法安装、配置和运行它们。大多数AI开发者是学者,而不是商人,外界无法访问到他们的算法和模型。区块链的共享机制和激励机制,可以鼓励AI模型的开发者共享其开发成果。机器学习、深度学习都需要有足够大的数据集,而创建和管理这种大型数据集是AI人员无法做到的,同时,目前封闭的开发模式也使开发人员难以共享数据集。
区块链的分散性促进了数据共享:如果没有单个实体控制存储数据的基础架构,那么因共享数据而带来的摩擦就会减小。数据共享可以发生在企业内部(不同分公司之间的数据合并,可降低企业内审成本)、联盟数据库(综合银行的数据可以有效降低欺诈)或公共区块链上(能源使用+汽车零部件供应链数据)。关于数据分享VS数据护城河的争论:是分享数据还是用数据建立壁垒,实质要看这两种行为所带来的利益之间的博弈,要分享,必须有足够的驱动力超过“护城河”效益。
区块链上代币激励的方式给共享数据提供了一个激励机制的典范。如果有足够的前期收益,数据共享就会成为必然,当来自孤岛的数据合并时,可以获得新的数据集,当我们对新的数据集进行训练时,又将会带来一个可以用于新业务的新模型。
改变三:区块链还可用于审计追踪数据和模型,以获得更可靠的预测:AI喜欢数据,数据越多,模型越好,但数据量与AI模型之间的正比例关系,建立在良好的数据质量的基础上。如果在垃圾数据上训练,你也会得到一个垃圾模型,测试数据也是一样,因而数据也需要可信度,有效的数据训练出的模型也是有效的,这样模型也获得了声誉和可信度,也才能被更加广泛的利用。
改变四:去中心化的数据市场,可以减少数据共享所带来的摩擦:在分散管理的过程中,数据和模型作为知识产权资产进行交换,没有一个实体可以控制数据存储的基础设施,这使得组织更容易协同工作或共享数据。通过这种分散交易,我们将看到真正开放的数据市场。
改变五:在区块链数据库中,权限就是资产,拥有权限的个人可以控制数据和模型的流向:创建可用于模型构建的数据以及自行创建模型时,可以预先指定许可,以限制其他人使用它们的方式,例如读取权限或查看特定数据或模型片段的权限。作为权利持有者,个人/机构可以将这些数字资产许可权转让给系统中的其他人。
图 2:中心化的大数据和AI VS 分布式AI
(资料来源:本翼资本)
与当前的数据孤岛相比,未来加入区块链技术的分布式AI平台,希望达到的目标就是实现数据、算法、AI资源(包括开发工具、数据包等)的自由调度,建立一个真正自由流动的市场。
这个平台的价值在于底层协议的构建、数据、AI资源的对接,而不仅指将资源引进平台。引入平台只是第一步,随后比较重要的是可以实现:通过数据/AI接口可以调用这些数据和资源。再延伸,就是调用的方便程度和速度。
2. AI可以优化区块链的运行方式,使其更安全、高效、节能
区块链本质上是一种新的数字信息归档系统,它将数据以加密的分布式总账格式存储。由于数据经过加密并分布在许多不同的计算机上,因此可以创建防篡改、高度可靠的数据库,只有获得许可的用户才能读取和更新数据库。但区块链技术在近几年的高速发展中暴露出了许多问题,阻碍了其商业化进程。总结来说主要有效率问题、安全问题、扩展问题、监管问题四大问题。
我们基于区块链,来探讨AI对区块链带来的颠覆式创新。
创新一:凭借AI算法的优化,结合POW和POS的共识机制可节省区块链的电力及能源的消耗。
以上我们提到人工智能的三大核心组成部分:数据、算法、算力,算法的优化可以节省算力,按照这个逻辑,将人工智能用于POW共识机制和哈希运算,可大大提高计算效率,从而节省电力和能源。例如:新创企业Matrix,利用AI将POW与POS结合使用,采用分层的共识机制,首先利用随机聚类算法在整个节点网络中产生多个小型集群并主要基于POS机制选举出代表节点,再由选举出的代表节点进行POW竞争记账权,相比全节点的竞争记账方式,可大大减少能源的浪费。
创新二:AI可以引入新的分散式学习系统来解决区块链上的数据冗余问题,扩展系统。分散式的学习系统,如联邦学习、新的数据分片技术,可以使系统更有效。此外,实践证明,通过AI模型和算法的优化,还可实现区块链的自然进化、动态调整,还可有效的防止分叉的出现。
创新三:AI可更加有效的管理好区块链的自治组织:传统上,如果没有关于如何执行任务的明确指示,计算机无法完成它们。由于区块链的加密特性,在计算机上使用区块链数据进行操作需要大量的计算机处理能力(如比特币挖矿)。而人工智能可以更聪明、更周到的方式管理任务。就好比一个擅长破译密码的专家通过训练可以使其破译密码的速度越来越快,一个机器学习驱动的挖掘算法,如果给它提供了正确的培训数据,它可以几乎立即提高其专业技能,如果将技能用于社区管理,那么社区管理的效率就会大大提高。
创新四:AI可以延展和提高智能合约的功能和效率:区块链2.0的智能合约编写时需要用户仔细描述合约的参数细节以及执行过程,由于计算机语言的严谨性,这些合约往往会存在许多潜在的漏洞。将各类AI模型、智能审查机制等引入到智能合约的编写,可以实现,用户只需要提供合约的主要目的和关键内容,AI虚拟机就可以在审核其安全性之后直接调用模型库的基础AI模型进行匹配、整合,满足大部分普通用户编写使用智能合约的需求。
图 3: AI给区块链带来的四大创新
(资料来源:本翼资本)
二、案例分析
1.SingularityNET
SingularityNET的价值在于建立了一个去中心化的AI算法、数据共享网络,其创始人Ben Goertzel曾是Hanson Robotics的首席科学家,目前通过Hanson Robotics对外提供AI模块,并进入了新合作伙伴Ocean,探索建立分布式数据库。
项目简介
SingularityNET是一个去中心化的AI算法、数据共享网络,致力于构建通用化的AI服务交易市场。在这个市场中,开发人员的研究成果都被代币化并且通过智能合约可以自由的进行交换、分享从而获得经济收益,同时参与其中的用户也可以通过API接口与外部供需方进行资源交换。SingularityNET希望通过该网络解决目前人工智能行业数据资源、模型算法垄断,缺乏新鲜血液的痛点,给予AI初创企业及开发者更好的生存环境,最终实现全球的通用智能。
图 4:SingularityNET的网络
(资料来源:本翼资本)
SingularityNET的团队既有人工智能、大数据、软件工程方面的专家,也有专业的市场化团队,人员结构比较完善。
SingularityNET发行的代币名称为AGI,总量10亿,当前流通供给量约5.4亿,市价0.2美元/个,市值约1.1亿美元。首次ICO发起于2017年12月,基于以太坊平台,价格为1AGI=0.1USD,共计融资3600万美金。
图 5:AGI走势图
(资料来源:互联网,本翼资本)
目前AGI代币在以太坊网络的持有地址数量为14845个,共发起交易次数46078次。其总量的50%都被ICO公开发售,20%放入奖励池,18%分配给创始人团队,8%分配给基金会,剩下5%分配给运动支持者(比如说赏金)。2017年12月SingularityNET通过发币筹集了3600万美元,并在不到60秒的时间内售罄。
图 6:AGI分配机制
(资料来源:项目白皮书,本翼资本)
SingularityNET项目在2017年6月发起,2017至2018年将着重于基础设施及AI工具开发,尤其关于语言图像处理、生物医学分析、金融等方面。同时在2017年12月及2018年7月SingularityNET将发布Alpha、Beta测试版本的主网络。预计到2019年整个系统结构包括基础设施、AI工具都将趋于完善,SingularityNET 1.0版本正式开始运行。
SingularityNET是一个开放的网络,任何人可以插入一个AI代理,并通过SingularityNET API接口,在网络中分享信息和获得奖励。在SingularityNET的生态系统中,任务需求方可以在该系统中发出使用AI的任务的需求(例如训练机器人跳舞),然后系统会将该AI任务分类为各种算法,在全网分散出去,那些具有不同技能的AI代理就会做出反馈,并将任务结果发送给需求方。作为激励,这些提供AI算法,反馈任务结果的AI代理,会得到需求方的代币奖励。
图 7:SingularityNET的运作方式
(资料来源:本翼资本)
AI代理发布AI任务、交换数据、提供AI反馈等行为,主要通过一系列的智能合约来实现。此外,非AI代理想要在网络中从AI代理处获得AI服务,也是通过智能合约实现。目前为了培养市场活力,SingularityNET不收手续费。
从严格意义上说,SingularityNET还不能称之为是一个自治组织,因为SingularityNET基金会负责该网络的监管,但随着网络的完善,SingularityNET最终会具备自治的能力。SingularityNET基金会由以下5大组织组成:OpenCog基金会、Hanson Robotics、Vulpem、Novamente LLC和经济航空局。
提供的服务:目前SingularityNET网络的主要服务形式有四种:互换硬件和软件资源、用AGI代币换取硬件和软件资源、AI代理之间的匹配和联合、对自治组织进行投票。前两种交易的实现方式,是将一定标准的软硬件API写入智能合约模板,通过将AI工具嵌入合约模板提供给他人使用。SingularityNET提供的智能合约包括:AI代理之间进行信息交流、条款协商的API接口;用AGI代币交换服务;针对具体问题的民主自治。
图 8:SingularityNET提供的四种服务
(资料来源:本翼资本)
共识机制:当前SingularityNET是基于以太坊,其共识机制和以太坊共识机制相似,采用POW+POS,未来脱离以太坊后,SingularityNET将创建POR(Proof of Reputation)信誉共识机制。该机制包含了一下一系列的因素:股权、在网络中的整体活动、特定评级方面、活动长度和特定阈值以上的评级等。此外,该机制和Nem区块链所采用的POI(Proof of Importance)共识机制相似,所以未来会大量采用Nem区块链的算法。
底层设计:SingularityNET的初始通用的底层设计由基金会成员—经济空间局(ECSA)设计,目前公司正与ECSA合作开发一种名为Gravity的工具,该工具为区块链经济提供了一个高度灵活的操作系统,能够在各种平台上支撑各种基于智能合同的高效率交互。此外,Gravity自带一套智能合约模板,面向各种类型的分散式区块链组织的设计。
SingularityNET的基础设施分为四层:一层是一个开放的JSON/RPC协议及其用于服务互操作性的参考实现;二层是服务描述是一个共享的和可扩展的本体,因此交易细节可以在各方之间进行协商;三层是:信誉体系追踪服务质量并激励更好的质量;四层是:基于分布式账本技术的小额支付交易将有财务层,所以各方可以通过无摩擦的方式将高质量的人工智能服务货币化。这可以实现不同的AI方法和开发,例如机器学习和深度学习,具有概率推理的本体和语义图,自然语言处理,演化和遗传规划以及机器人技术。
图 9:SingularityNET基础设施的构想
(资料来源:本翼资本)
当前SingularityNET可以提供:用于与AI代理交互的API和一组智能合约;一个以代币为基础的经济体,用于处理与AI代理商之间的金融交易;调整经济参数的民主治理机制。目前的AI模块由Hanson Robotics和OpenCog Foundation提供,以及其他的开源的AI模块。
SingularityNET发行的代币名称为AGI,总量10亿,当前流通供给量约5.4亿,市价0.2美元/个,市值约1.1亿美元。首次ICO发起于2017年12月,基于以太坊平台,价格为1AGI=0.1USD,共计融资3600万美金。
3.Matrix AI Network(MAN)
Matrix AI Network在其底层架构、共识机制等方面都做了独特的优化创新,并且利用人工智能算法改善了现行区块链安全性、扩展性等问题,白皮书中也对这些技术实现问题例如系统框架、共识算法、挖矿机制、区块链结构等作了详细介绍。经过其改进革新的区块链架构可以被认为是以太坊、EOS等区块链2.0结构的升级版,也可以理解为区块链3.0。
项目简介
Matrix AI Network项目由中国清华大学软件学院副教授邓仰东教授发起,并集结了一批人工智能、区块链、芯片及底层硬件领域的专家学者,团队专业背景很强。
Matrix AI Network的代币简称为“MAN”,总量10亿,当前流通供给量1.5亿,市价0.76美元/个,市值1.14亿美元。第一期ICO预计发售规模2亿,将用于人工智能算法、区块链技术及相关硬件如矿机的开发。截止2018年1月17号,Matrix首次PreICO及ICO结束,共计发售1.5亿代币,基于以太坊ERC20标准,ICO发售5000万MAN,定价0.36美元,募集约13227以太币。目前Matrix总供给量2.5亿代币,1.5亿在二级市场流通,1亿由创始团队及基金会所有。根据以太坊区块链浏览器的查询数据,目前持有MAN币的地址数为18762,转账交易总计59710笔,从地址持有数分布来看较为分散。
图 10:MAN走势图
(资料来源:互联网,本翼资本)
图 11:MAN币分配机制(资料来源:公开资料,本翼资本)
Matrix网络在2016年9月被正式发起,至今仍在进行前期准备工作,例如区块链设计、基于人工智能的矿机设计等。Matrix主网预计会在2019年3月前上线,届时已经ICO发售的MAN币将以1:1的比例迁移到Matrix主网。到2020年初,Matrix主网生态包括挖矿、AI应用开发、相关基础设施建设都将逐步完善,生态链基本形成。
Matrix生态链主要包含基础层、应用层、用户组三部分,基础层主要包括提供算力的人工智能矿机及矿工,应用层则是基于Matrix区块链开发的人工智能项目或是智能合约项目,用户组主要包含应用开发者、算力需求机构及普通用户。而该系统中的MAN币承担着连接整个Matrix生态链的作用,为其注入活力及运行动力。
图 12:MAN币流通体系
(资料来源:Matrix白皮书,本翼资本)
前文提到了Matrix相比于现有的区块链具备四大优势:更易用、更安全、更快捷、更灵活,这些优势基本上都得益于Matrix区块链的架构创新。总的来说Matrix网络具有分层共识机制、多功能异类节点、多链区块链结构、协议参数动态优化四大创新点。
分层共识机制
Matrix没有直接采用POW、POS或现在较流行的DPOS、PBFT等共识算法,也没有采用一些ICO项目经常用的前期POW转后期POS的混合共识算法,而是独创性的将POW与POS结合使用,并将传统的Hash运算转变为其人工智能体系基石-贝叶斯决策理论需要的蒙特卡洛马尔科夫计算(MCMC),令矿工在挖矿的过程中能够产生实际价值。
具体来说,Matrix的共识网络具备两个阶段。第一阶段利用随机聚类算法在整个节点网络中产生多个小型集群并主要基于POS机制选举出代表节点;第二阶段选举出的代表节点进行POW竞争记账权,获得记账权的代表节点的选民也会获得部分收益。Matrix的共识算法在挖矿过程中通过消耗算力、能源赋予了MAN币实际价值,并且可以有效防止51%攻击。
图 13:Matrix AI Network共识机制
(资料来源:本翼资本)
多链式区块链结构
相比于先行的基础公有链,Matrix网络采用控制与数据分离的设计思想,具有多链并行的创新结构,基础结构由一条分布式控制链与一条数据链组成。分布式控制链主要由区块头、控制链参数、AI模型列表组成,主要在区块中包含各数据链的参数配置,数据区块链的结构与以太坊类似,同时在区块头部附加了AI版本号,用于获取AI参数及模型,在Matrix网络中可以定义多条数据链并将其参数模型映射到控制链区块中。
此外,除了控制链及第一条数据链需要遵循Matrix的POS/POW混合共识机制,后续新增数据链的共识机制都可以自己设置,目前Matrix支持几乎所有的主流共识算法。随着其区块链提供的AI服务、附载的数据链进一步增多,各个数据链中的区块通过控制链及智能合约可以实现数据交互、跨链交易,最终Matrix将进化为区块链网络。
协议参数动态优化
基于Matrix控制链与数据链分离的设计理念,Matrix区块链具有自然进化、动态调整的能力,这是其与现行区块链相比最大的创新点。Matrix通过建立贝叶斯网络模型实时统计、分析各类AI参数,然后通过标准优化算法,实现参数最优化。目前Matrix区块链采用的优化模型是贝叶斯增强式学习算法。
多功能异类节点
Matrix系统模型包含六类系统设备:标准Matrix节点、云接入节点、云存储节点、Matrix可信网关、外部数据存储池、AI服务设备。
标准Matrix节点运行一条Matrix分布式控制链以及至少一条数据链,并且具备运行AI虚拟机的能力,能够执行控制链及数据链定义的AI模型,运行智能合约。
云接入节点是由Matrix在云端部署的服务节点,主要为没有Matrix节点的用户,尤其是移动端设备提供便捷的访问方法。用户只需要提供接入认证并在相关安全加密操作之后便可链接到云接入节点,获取Matrix提供的AI服务。
云存储节点会实时备份Matrix区块数据,数据源由创世节点实时写入云端,并且可以以传统数据库的方式存储。云接入节点的设立主要是为了方便用户进行离线查阅历史数据资料。
图 14:Matrix AI Network系统模型
(资料来源:本翼资本)
Matrix可信网关是Matrix网络与外部数据交互的重要设备,基于AI智能审核以及节点投票,Matrix可以为各种外部数据源给出信用评级。该网关帮助提升了Matrix网络的扩展性,使其运行的智能合约获取外部数据更安全、便捷。
外部数据存储池主要存储经由可信网关获取的外部数据并安全加密处理,只能允许特定用户访问。Matrix将部署多个分布式存储池,只有在存储池数据内容达成一致时,才能被写入区块。
AI服务设备主要包含两个功能,第一个功能是帮助支持整个Matrix系统及其中各类AI模型的参数优化;第二个功能是能够将Matrix网络作为一个整体为外部用户提供服务,也可以调用Matrix节点为内部用户服务。AI服务设备需要有硬件支持提供所需算力。
Matrix存在的潜在风险
时间风险:Matrix主网目前还未上线,ICO也通过以太坊智能合约进行,所以其白皮书提到的各类架构创新是否能够顺利运行仍是未知数。尽管基于人工智能的各类优化算法、智能审查等机制在理论上都可以实现,但是实际用户体验还需要项目落地才能得知,这就带来了极大的时间风险,毕竟目前Matrix还处于概念阶段。
技术风险:主要指的是Matrix人工智能体系的基石-贝叶斯理论如果在接下来几年被弃用,或被其他更先进的人工智能理论所取代,那么Matrix整个基础体系将面临崩溃,或是需要大规模的调整、更新。这对Matrix未来发展的打击是极其沉重的。
4.Ocean Protocal
Ocean protocal构建了一个基于区块链的数据和服务分享市场。其白皮书详细的解释了该系统的体系结构、经济系统及关键环节例如市场运行机制、数据定价机制、加密验证机制等,糅合了过往成熟的经验及创新的元素,希望为未来人工智能的数据、服务共享提供底层通用平台。
Ocean Protocal(海洋协议)成立于2017年11月,2018年2月发布了白皮书,是一个分散的数据交换网络,可让人们共享数据并通过数据货币化用于AI模型的培训。海洋协议是共享数据和相关服务的生态系统,提供了一个标记化服务层,公开用于消耗的数据、存储、计算和算法,有助于解锁数据,尤其是AI数据,并使用区块链技术,允许数据以安全、透明的方式共享和出售。
Ocean Protocal所解决的行业痛点是因缺乏信任而导致的数据孤岛,海洋的协议的目标是建立一个支持多个数据自由流动的市场,锁更多的AI功能,比如,允许人工智能研究人员对数十种计算机视觉应用程序进行图像分类器训练。
海洋协议的团队人员基本上都有连续创业的经验,大都来自于Big Chain DB,基本都有大数据、区块链、人工智能和数据交换的背景知识,以及设计师和技术人员的经验。主要团队成员如下:
2018年3月7日,Ocean Protocal开始ICO,代币名称OCN,总量14.1亿个,募资金额上限2210万美元,接受以太币兑换。预计2018年Q4上限测试版(V0.9),2019年Q1将会启动网络,并激活AI/数据社区。
图 15:Matrix AI Network系统模型
(资料来源:本翼资本)
代币分配:网络维护和数据提供者将会分配代币总量的45%,创始团队20%,社区和生态系统发展10%,最后25%用于公开出售,分三次出售。第一次在2017年10月,种子轮已筹集500万美元,出售了代币总数的3.6%;第二次在2018年3月,预启动众筹2200美元,出售了代币总数的6.4%;第三次预计在2019年Q1,释放5.1%;如果5年内,项目需要资金来扩大生产规模,会再次发起众筹,释放最后10%。
Ocean protocal的生态系统由上至下可以分为用户层、服务层、基础层三层。用户层主要包括数据消费者,是Ocean提供的数据及服务市场的需求方;服务层主要包括数据/服务提供者、数据管理者/引荐人以及数据验证者,是用户直接对接获得数据及服务的平台,基础层主要包含Ocean的底层区块链维护者,为其服务平台提供基础设施支持。
区块中的数据释义是指用于解释数据集/服务的描述信息,包含数据概要、数据链接等。整个交易流程第一步由数据集/服务所有者在市场发布信息;第二步系统中的管理者可以依据自身经验为该数据下注,客户可以从下注额中获得关于数据的信息;第三步客户可以通过智能合约发出请求对接所需求的数据集/服务,并在市场中竞价;第四步平台中的验证者验证该合约的相关信息;最后Ocean协议会依据其激励机制给予数据集/服务提供方代币奖励,其具体的下注及经济激励机制会在下一节详细讲述。
图 16:Ocean生态系统结构
(资料来源:Ocean protocal白皮书,本翼资本)
由于数据资源难以定价的特性,Ocean protocal针对其生态系统设计了一套独有的经济激励机制以鼓励用户参与并作出贡献。Ocean设计了一种下注的方式来定义数据提供者应得的奖励,具体来说提供数据的用户及其他参与者可以为该数据下注来表示对该数据流行度的预期,奖励额等于用户的下注额与该数据的流行程度(一定时间段内的使用次数)的对数的乘积再乘以真实的数据使用比例(防止恶意刷分),用公式来表达就是:。由于该公式需要在每个奖励周期重复计算每个参与者对每个数据集或服务的下注额,所以运算过程很复杂并且会消耗较高的计算成本。
Ocean借鉴了比特币的挖矿模式,将其修改为每当有节点提交可用的数据集或服务时,Ocean协议会随机选择是否给予其奖励,其选择概率等于上文提及的奖励额除以全网总奖励额。奖励的发生时间被设定为平均每分钟产生一次。
同时对于每个数据集或服务,Ocean以一种由代币OCN派生出的代币drops来定价,简写为“D”,对于数据集X的代币drop被称为“DX”。代币DX与OCN的兑换比例受数据集X的关注度影响,即DX的价格将随下注数据集X的额度提高而提高,两者成正相关关系。所以Ocean协议中的参与节点会同时拥有多种代币OCN、DX、DY等。
图 17:DX与OCN兑换比例示意图
(资料来源:Ocean protocal白皮书,本翼资本)