时间:2023-08-27|浏览:196
过去几年里,人们一直在谈论数据时代,但对于数据时代的定义并不清晰。在此之前,我们只是感受到数据时代即将到来,但真正的数据时代是以数据为中心的时代,数据具有自身的特征和属性,网络为数据服务。有了IPFS,这一切就有了可能。
我在8月14日在深圳的分布式存储大会上做了关于《分布式存储助力DT时代到来》的主题演讲。演讲中提到了数据时代的一些特征和现有的技术,下面对这些内容进行梳理。
数据爆炸并不意味着我们已经进入了数据时代。提出数据时代的原因是大家意识到了数据的价值和数据量的爆发,进行了大数据计算和数据挖掘,似乎网络要以数据为中心了。但我们并没有建立起以数据为中心的基础设施,缺乏适用于数据保存、流通和价值交换的协议、标准和网络。
各种应用带来了海量的数据,而且数据量以每年40%的速度增长。但这并不意味着我们已经进入了数据时代,实际上我们仍然处于网络时代,只是感觉到网络技术似乎不太适应以数据为中心的模式。因此出现了许多与数据相关的问题,比如滥用数据、用户数据归属不明、App强制授权、隐私信息被不当使用等等。此外,个人数据的流通也面临困难,直接变现也很难实现。所有这些问题并不是互联网协议可以解决的。
数据时代需要数据互联。目前我们仍然处于互联网时代,即IT时代。互联网以网络为中心,各种协议实现了网络节点之间的自由通信,比如TCP/IP、HTTP、DNS、TLS、OSPF和BGP等等。在互联网中,每个节点都有一个网络地址,每份内容都定位于某个路径之下。在这套协议的支持下,我们可以自由地在网络上交流,但前提是要知道要访问的内容在哪里。
而数据时代应该具有自身的特征,数据时代的协议套件应该以数据的互联为目标。因此我提出了一个新词:Interdata。这是一套建立在互联网之上的协议,目标是实现数据的定位、流通和交易。数据时代也可以称为Interdata时代。
数据时代具有三个特征:每份数据都有自己的身份,数据之间的关系由数据本身来表达,网络支持数据的自由流通。而这一切,目前可以通过IPFS来实现。
每份数据都有自己的身份。IPFS的协议套件中有一个叫Multiformats的部分,用来描述数据或网络。在描述数据方面,通过哈希算法对数据进行描述,从而实现数据的身份标记。每个数据都有自己独一无二的身份,无论数据身处何处。
当数据有了独一无二的身份后,就可以实现内容寻址。与互联网时代不同,你不需要知道数据在哪里,只需告诉网络你要找哪个数据,就能找到它。
打个比方,在互联网时代,你要找一份数据,你必须知道数据在具体哪个网址的哪个路径下。然而在数据时代,数据本身有独立的身份标志,你只需利用这个标志向网络查询即可。这就像在这个时代你要找某个人,只需知道他的电话号码或微信,直接联系即可,无需知道他在哪。这是一个巨大的突破。
数据之间的关系由数据本身来表达。数据之间存在关系,就像人与人、人与物之间存在关系一样。当数据具有身份后,这个身份就具备很多特征,其中之一就是与其他数据的关系。例如,一篇论文可能包含许多引用或实验结果。在互联网时代或纸质时代的论文中,引用只是一个标记,但并不明确引用的内容。而在数据时代或IPFS中,数据可以通过IPLD的方式进行存储,其中包含许多关系。这些关系直接通过数据的身份进行链接。因为无需进行路径寻址,你可以认为数据之间是相互包含的。这形成了一个大的语义网络。
类似于HTML超链接,但比HTML更强大,因为它是自包含、内容寻址和自验证的。
网络支持数据的自由流通。在无需路径寻址的情况下,用户如何通过内容的身份标记直接访问数据呢?这就是Libp2p协议套件在IPFS中的作用。
Libp2p实现了真正的点对点网络,用户之间的连接是对等的,不存在服务器和客户端的区分。用户之间的连接是自由和全方位的,一个节点可以连接成百上千个节点以保证可靠性。Libp2p通过分布式哈希表(DHT)帮助内容寻址,从底层实现了自由连接。可以简单地理解为现在的移动网络中,随时了解你的位置,当有人找你时,通过你的号码直接找到你。不同的是,在数据网络中,同一份数据可能存在多份,其中任何一份都具有相同的意义。因此Libp2p会根据网络情况选择合适的位置提供内容。
与IT时代最大的不同之一是,整个协议套件是直接为数据服务的,网络只是该套协议的
用戶喜愛的交易所
已有账号登陆后会弹出下载