这里是普通文章模块栏目内容页
1分钟了解“挖矿”的本质
有奖调研 | 人脸识别功能在互联网行业认知度情况

上一篇《1分钟了解区块链的本质》,介绍了什么是区块链,区块链是一个没有管理员,每个节点都拥有全部数据,高可用的分布式存储系统。

文章的留言里,不少朋友会用比特币来解释区块链。

1分钟了解“挖矿”的本质

那区块链与比特币是什么关系?

答:区块链是分布式存储,比特币是基于该存储的应用,其他诸如莱特币,以太币都是基于区块链的电子货币应用。理论上,使用上层应用来解释底层存储是不合适的。

1分钟了解“挖矿”的本质

如上图,mysql是底层存储,wechat是上层应用,用wechat来解释mysql是不合适的。

今天,从技术的角度出发,聊聊什么是区块链里的“挖矿”。

先说结论,区块链挖矿的本质是啥?

答:生成一个区块,链入区块链的过程,就是挖矿。挖矿的人,就是矿工。

什么是区块(block)?

答:如《1分钟了解区块链的本质》里所述,区块是一块存储空间,可以存储数据。

如上图,区块分为区块头(header)和区块体(body)。

区块体(body)存了些什么?

答:想存什么存什么,和上层应用有关,就像mysql里存什么依赖于上层应用。例如比特币使用的区块链,区块体里存储的是比特币交易记录。

区块头(header)存了些什么?

答:区块头里存储了和这个区块,以及区块链相关的一些元数据。

1分钟了解“挖矿”的本质

如上图,区块头里的三个常见属性:

前一个区块的哈希值

区块生成的时间戳

随机数

什么是区块链(blockchain)?

区块是怎么链起来的?

答:

struct node{ 

         node* prev; // 前一个节点 

         int time; // 时间戳 

         int nonce; // 随机数 

         void* node_body; // 存储数据 

}node; 

1分钟了解“挖矿”的本质

链表,节点指针可以作为这个节点的唯一标识,下一个节点通过存储上一个节点的指针,将链表链起来。

1分钟了解“挖矿”的本质

与之类似,区块的哈希可以作为区块的唯一标识,下一个区块通过存储上一个区块的哈希,将区块链起来,这就是区块链。

讲完区块与区块链的概念,接下来讲挖矿,也就是区块的生成。

在此之前,先说说区块链的三个特性:

历史生成的区块是无法改变的,即“区块链只能像写日志一样追加写,不能像mysql一样随机写”

只能在最新的区块后面生成新区块,即“必须先完成同步全网最新的区块链数据这项工作,才能启动新区块生成这项工作”

新区块的生成很难,必须满足一定条件的新区块才有效

假如已经同步了最新的区块链数据,要满足什么条件,才算生成一个新的区块,才算“挖矿”成功呢?

答:对最新的区块头进行两次SHA256计算,得到的256bit哈希结果,高位48bit必须是0x00000000FFFF,才算挖矿成功。

画外音:这句话很重要,是这篇文章的核心。

为什么大家都说“挖矿”很难?

由符合条件的哈希值,倒推出区块头,填入相应的“前一块区块哈希值”“时间”“随机数”不就可以了吗?

答:额,这,,,哈希(SHA256是一个哈希算法)是不可逆的。例如MD5

md5(string) = md5_result 

由字符串,算出对应的md5值很容易,但由md5值反推出字符串是不可能的大家都知道:

可以认为哈希的结果是完全随机的,要得出前48bit必须是0x00000000FFFF的哈希结果,就如同连续抛48次硬币,每次都得到我们想要的结果,其概率为(1/2)^48

可以看到,这就好比在一座山上随手捡起一块石头,正好是一块金子,我猜测,这也正是把生成新区块叫做“挖矿”的原因。

那应该怎么找到符合条件的区块头呢,从而成功挖到矿呢?

答:穷举法。

区块头里有个随机属性nonce,将这个属性从0开始,遍历到2^32,来计算区块头的哈希值,如果得到的哈希结果符合条件,则挖矿成功。

其伪代码如下:

byte[32] = PrevBlockHash; // 上一个区块的哈希 

for(int i=0 to 2^32){ // 遍历所有整数 

  int time=now(); // 时间戳 

  blockHeadernew(byte[32], time, i); // 生成区块头 

  hashResultSHA256D(blockHeader); // 计算哈希值 

  if(hashResult>>208 == 0x00000000FFFF){ //哈希符合预期 

    echo“bingo”; // 挖到矿啦 

看上面的算法,只要程序运行时间足够久,总能挖到矿呀?

#p#分页标题#e#

答:错,如果别人计算能力强,在你挖到矿之前,如果别人先生成了新区块,广播到了区块链网络,你本地不是最新的区块链,你挖到的矿就作废啦,此时你要放弃之前所有的工作,先向网络同步最新的数据,再重新开始挖。

有什么方法可以提升挖矿的速度呢?

答:从架构的角度出发

“缓存”是无效的:每个区块的哈希值都不一样,每个时间戳都不一样,历史计算过的值无法通过“查表”来节省时间

scale up是有效的:增强单CPU的计算能力,使用GPU代替CPU,使用特殊的芯片计算SHA256D等优化都是有效的,但scale up总是有极限的,单机总会遇到瓶颈

scale out是有效的:单机不行,来并行,一台机器不行,搞集群,这就是为什么会有这么多的矿场

1分钟了解“挖矿”的本质

如上图,这是西藏高原上的一个比特币矿场,廉价的电力让无数矿工趋之若鹜。

综上,区块链里,什么是挖矿?

答:在最新区块链的数据上,生成一个符合条件的区块,链入区块链的过程,就是挖矿。

关于区块链与挖矿,大家或许还有不少疑问:

如何保证数据的一致性

这TM有病吧,挖这玩意有什么意义,不是纯浪费电吗

这和比特币有什么关系

比特币怎么保证总量有限

这些疑惑,下一个一分钟,再和大家解释。

希望这很短的一分钟,大家了解了挖矿的本质。

【本文为51CTO专栏作者“58沈剑”原创稿件,转载请联系原作者】

1分钟了解“挖矿”的本质

收藏
0
有帮助
0
没帮助
0