区块链技术在数据互联时代的加速作用

时间：2023-08-27|浏览：222

真正的数据时代是以数据为中心的时代。IPFS可以实现数据时代的特征，如数据拥有身份和自由流通。而Filecoin有望加速数据时代与商业世界的结合。

过去几年里，人们一直在谈论数据时代，但对于数据时代的定义并不清晰。在此之前，我们只是感受到数据时代即将到来，但真正的数据时代是以数据为中心的时代，数据具有自身的特征和属性，网络为数据服务。有了IPFS，这一切就有了可能。

我在8月14日在深圳的分布式存储大会上做了关于《分布式存储助力DT时代到来》的主题演讲。演讲中提到了数据时代的一些特征和现有的技术，下面对这些内容进行梳理。

数据爆炸并不意味着我们已经进入了数据时代。提出数据时代的原因是大家意识到了数据的价值和数据量的爆发，进行了大数据计算和数据挖掘，似乎网络要以数据为中心了。但我们并没有建立起以数据为中心的基础设施，缺乏适用于数据保存、流通和价值交换的协议、标准和网络。

各种应用带来了海量的数据，而且数据量以每年40%的速度增长。但这并不意味着我们已经进入了数据时代，实际上我们仍然处于网络时代，只是感觉到网络技术似乎不太适应以数据为中心的模式。因此出现了许多与数据相关的问题，比如滥用数据、用户数据归属不明、App强制授权、隐私信息被不当使用等等。此外，个人数据的流通也面临困难，直接变现也很难实现。所有这些问题并不是互联网协议可以解决的。

数据时代需要数据互联。目前我们仍然处于互联网时代，即IT时代。互联网以网络为中心，各种协议实现了网络节点之间的自由通信，比如TCP/IP、HTTP、DNS、TLS、OSPF和BGP等等。在互联网中，每个节点都有一个网络地址，每份内容都定位于某个路径之下。在这套协议的支持下，我们可以自由地在网络上交流，但前提是要知道要访问的内容在哪里。

而数据时代应该具有自身的特征，数据时代的协议套件应该以数据的互联为目标。因此我提出了一个新词：Interdata。这是一套建立在互联网之上的协议，目标是实现数据的定位、流通和交易。数据时代也可以称为Interdata时代。

数据时代具有三个特征：每份数据都有自己的身份，数据之间的关系由数据本身来表达，网络支持数据的自由流通。而这一切，目前可以通过IPFS来实现。

每份数据都有自己的身份。IPFS的协议套件中有一个叫Multiformats的部分，用来描述数据或网络。在描述数据方面，通过哈希算法对数据进行描述，从而实现数据的身份标记。每个数据都有自己独一无二的身份，无论数据身处何处。

当数据有了独一无二的身份后，就可以实现内容寻址。与互联网时代不同，你不需要知道数据在哪里，只需告诉网络你要找哪个数据，就能找到它。

打个比方，在互联网时代，你要找一份数据，你必须知道数据在具体哪个网址的哪个路径下。然而在数据时代，数据本身有独立的身份标志，你只需利用这个标志向网络查询即可。这就像在这个时代你要找某个人，只需知道他的电话号码或微信，直接联系即可，无需知道他在哪。这是一个巨大的突破。

数据之间的关系由数据本身来表达。数据之间存在关系，就像人与人、人与物之间存在关系一样。当数据具有身份后，这个身份就具备很多特征，其中之一就是与其他数据的关系。例如，一篇论文可能包含许多引用或实验结果。在互联网时代或纸质时代的论文中，引用只是一个标记，但并不明确引用的内容。而在数据时代或IPFS中，数据可以通过IPLD的方式进行存储，其中包含许多关系。这些关系直接通过数据的身份进行链接。因为无需进行路径寻址，你可以认为数据之间是相互包含的。这形成了一个大的语义网络。

类似于HTML超链接，但比HTML更强大，因为它是自包含、内容寻址和自验证的。

网络支持数据的自由流通。在无需路径寻址的情况下，用户如何通过内容的身份标记直接访问数据呢？这就是Libp2p协议套件在IPFS中的作用。

Libp2p实现了真正的点对点网络，用户之间的连接是对等的，不存在服务器和客户端的区分。用户之间的连接是自由和全方位的，一个节点可以连接成百上千个节点以保证可靠性。Libp2p通过分布式哈希表（DHT）帮助内容寻址，从底层实现了自由连接。可以简单地理解为现在的移动网络中，随时了解你的位置，当有人找你时，通过你的号码直接找到你。不同的是，在数据网络中，同一份数据可能存在多份，其中任何一份都具有相同的意义。因此Libp2p会根据网络情况选择合适的位置提供内容。

与IT时代最大的不同之一是，整个协议套件是直接为数据服务的，网络只是该套协议的

热点：ipfs 区块链区块链技术数据