区块链与大数据

西瓜财经 百科
2018-11-24 14:23:17

  

区块链与大数据这是每一个搞区块链的人都经常被问到的问题 。




 

一、什么是区块链?

我们一直以来对区块链的定义都是:区块链实际上是围绕交易平等来设计的一套信用(信任)建设体系和价值流通平台。在这套体系和平台里,所有参与方地位都应尽可能平等(现实场景根据现实情况各有各的妥协);价值(token)随着交易同步流通。数据安全和隐私保护是区块链采用共识机制、分布式账本、加密技术、智能合约和授权模式等手段后的必然技术结果。 需要补充的是:这里提的交易泛指广义的交易,既包括我们对现有对交易的理解和认知,还包括任何价值信息的传递 。

区块链,是比特币的底层技术架构,它在本质上是一种去中心化的分布式账本。区块链技术作为一种持续增长的、按序整理成区块的链式数据结构,通过网络中多个节点共同参与数据的计算和记录,并且互相验证其信息的有效性。从这一点来说,区块链技术也是一种特定的数据持久化技术。由于去中心化在安全、便捷方面的特性,很多业内人士看好其发展,认为它是对现有互联网技术的升级与补充。

从上面的定义很容易看出来,区块链是多种现有技术的集大成,虽然没有创新型技术发明,但区块链最重要的是设计思想和逻辑,它是一套体系,一套以技术为基础,可以用Token进行生态设计和构建的生产关系。

我们经常听到有人说区块链是数据库,显然这种说法过于简单的把区块链等同于分布式账本了,严格来说是非常片面的!所以特别强调两点:

1、区块链是一套体系,数据库或者说分布式账本只是区块链体系内的一分子。

2、区块链的分布式存储是属于数据库的范畴,但和传统的数据库有本质的区别。

二、什么大数据?

对于“大数据”(Big data)研究机构Gartner给出了定义,“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

大数据,需要应对海量化和快增长的存储,这要求底层硬件架构和文件系统在性价比上要大大高于传统技术,能够弹性扩张存储容量。谷歌的GFS和Hadoop的HDFS奠定了大数据存储技术的基础。另外,大数据对存储技术提出的另一个挑战是多种数据格式的适应能力,因此现在大数据底层的存储层不只是HDFS,还有HBase和Kudu等存储架构。

大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。

从技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分。大数据必然无法用单台的计算机进行处理,必须采用分布式架构。它的特色在于对海量数据进行分布式数据挖掘,但它必须依托云计算的分布式处理、分布式数据库和云存储、虚拟化。

大数据需要特殊的技术,以有效地处理大量的容忍经过时间内的数据。适用于大数据的技术,包括大规模并行处理(MPP)数据库、数据挖掘电网、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。

简单一句话,大数据其实就是统计学。同样运用了数据库技术、分布式存储技术、数据统计和数据挖掘技术。

三、区块链与大数据的异同?

到这里我们基本搞清楚了什么是区块链和什么是大数据的定义。也就可以区分区块链与大数据了。

1、区块链利用了共识算法、中心不明显,甚至是完全去中心的,也就没有管理员的角色;大数据还是中心化的,管理员的角色回避不了,而且管理员有着完全的权限,带来的安全和泄露危险很多时候控制起来比较困难,公信力和区块链项目无法比拟。

2、区块链主要是围绕交易而设计的生态平台,因而区块链项目可以借助Token来完善整个生态建设和信用建设,一个好的区块链项目是有利于生态发展,并能最大化程度回馈所有参与方;大数据这种中心化平台本身并不具备生态和激励措施,如果有这块设计的需求是要从头开发的。

3、区块链自带加密算法,大数据有这方面的需求需要从头开发。

4、大数据没有区块链智能合约这一概念。

5、最重要的一点,区块链所用的数据库结构和大数据的数据库结构有着本质的区别,我们来看看区块链的区块展示:

上图一目了然的展示了区块,它所有的指向都是向前,传统的大数据刚好相反,向后向后再向后。

区块链产品重在设计,这种泛中心化的设计思想在区块链产品设计中主要体现在共识算法和智能合约实现上,其他该怎么设计就怎么设计,所以两者是可以共存的。

某种程度上来说,区块链技术的引入可以解决传统大数据和数据库很多固有的弊端,特别是基于区块链的数字身份和数据空间的引入,不仅可以改善传统数据库和大数据在安全与风险方面存在的问题,甚至还可以引入新的业务模式“对象既业务”改善大数据和数据库的运行效率。

四、区块链+大数据

在大数据中使用区块链技术,大数据的技术生态百花齐放,没有哪个软件能解决所有的问题,能解决问题也是在一个范围内,即使是Spark、Flink等。在强调透明性、安全性的场景下,区块链有其用武之地。在大数据的系统上使用区块链技术,可以使得数据不能被随意添加、修改和删除,当然其时间和数据量级是有限度的。

以时间、数据量为坐标轴,列出了目前大数据引擎大致擅长处理数据的范围,区块链可在其中成为一种很好的补充。

比如,对于存档的历史数据,因为它们是不能被修改的,我们可以对大数据作Hash处理,并加上时间戳,存在区块链之上。在未来的某一时刻,当我们需要验证原始数据地真实性时,可以对对应的数据做同样的Hash处理,如果得出的答案是相同的,则说明数据是没有被篡改过的。或者,只对汇总数据和结果做处理,这样,只需要处理增量数据处理,那么应对的数据量级和吞吐量级可能是今天的区块链或改善过的系统可以处理的。

通过把大数据与区块链相结合,能让区块链中的数据更有价值,也能让大数据的预测分析落实为行动,它们都将是数字经济时代的基石。


本文地址: https://www.xiguacaijing.com/news/baike/2018/1276.html
声明:本文经授权发布,除注明来源外,均为西瓜财经用户投稿,不代表西瓜财经立场。转载请注明:西瓜财经(xiguacaijing.com)
提醒:投资有风险,入市需谨慎。若内容涉及投资建议,仅供参考勿作为投资依据。谨防以“区块链”名义进行非法集资。
赞助商