比特币随想 - 重拾 Proof of Work
Proof of Work (PoW)工作量证明,并不是比特币首创,但是比特币巧妙的使用了他,把它变成了一种实现共识的方法1。除了比特币,PoW 协议其实还有很多其他的用途:防止 DoS 攻击、处理垃圾邮件。
本文组织如下:
- 工作量证明的一般原理
- 比特币工作量证明的社会原理
- Proof of Stake
工作量证明,PoW
为了理解 PoW,我们首先脱离比特币的场景,来单独看看 PoW 协议。PoW 最早被提出来是为了主动防御 DoS 攻击,就是拒绝服务攻击,而垃圾邮件可以被认为是某种 DoS 攻击。
一个攻击者可以同时发送 1 百万封垃圾邮件,而不用付出任何代价。但是这对邮件服务器和邮件阅读者都是一种困扰。PoW 的方案是:为每一封邮件都附上一个代价(就好像邮票)。在计算机的世界,这种代价的一个选择是 CPU 资源。当服务器验证发信人为这封邮件附上了代价,服务器才会处理该邮件。这种代价往往对于每天只发送几百封邮件的人来说算不上什么,但是对于垃圾邮件攻击者,几百万封邮件意味着极大的成本,因此从经济学角度,他可能选择不再攻击。
现在我们需要一种机制,既可以让发信人花费一定的 CPU 资源,有让服务器可以快速的验证发信人确实花费了一定的 CPU 资源。以下就是一种方案:
假设邮件内容,S;发信人需要寻找一个整数,P,使得 $H = hash(S, P)$。这里 H 是一串长度固定为 N 比特的数字,且 H 的前 M 位均为 0。
这里 Hash 是一个密码学的函数,他可以把任意宽度的比特转化成一个固定长度的比特传,该函数有以下特性:
- 通过 S 和 P 计算 H 的速度非常快
- 给出 H 几乎不可能找到 S 和 P
- 输出 H 和输入的关系是随机的,即输入微小的变化,输出就会产生随机巨大变化
下面我举个例子,我们选用 SHA-256 作为我们的 Hash 函数,256 的意思就是函数输出结果一共 256 位。
import hashlib
def hash(s):
m = hashlib.sha256()
m.update(s)
res = m.hexdigest()
return res
print(hash(b"11111"))
# d17f25ecfbcc7857f7bebea469308be0b2580943e96d13a3ad98a13675c4bfc2
print(hash(b"11112"))
# 744b8397028efb93fc77ef9d12ed82d522a8d168616550a79dec63185c2d3fc2
可以看到仅仅从 1 变成 2,hash 的结果已经是面目全非!
下面就是 PoW 协议工作的基本方式:(看注释)
import hashlib
def pow(s: str, difficulty: int=2) -> int:
p = 0
while True:
m = hashlib.sha256()
m.update((s + str(p)).encode())
h = m.hexdigest()
if h[:difficulty] == "0" * difficulty:
return p
else:
p += 1
# 工作量证明,寻找 p
s = "This is a message!"
diff = 4 # 这里是难度系数,即 hash 结果开头的 0 的数量,比如 0000xxxxx
p = pow(s, diff) # p 就是我们找到的整数
print(p) # 83205
# 发邮件的时候,我们除了发送信息 s,也发送我们找到的整数 p
# (其实这个 Protocol 已经有问题了,发现了吗?我们应该要求把收件人也加入has,不过这个不重要)
# 然后,服务器就可以通过 s 和 p 证明我们做了工作:
m = hashlib.sha256()
s = "This is a message!"
p = 83205
m.update((s + str(p)).encode())
h = m.hexdigest()
print(h)
# 这是hash的结果:
# 00002516593e4194cfb8667fa3559f37fb964d0a375c9567c6ca297bfbb48cfe
# 可以看到开头有 4 个 0,也就是验证了发信人做了工作
这个协议其实非常巧妙,首先验证结果非常快,只需要一次 hash 操作;但是找到整数 p 却很慢,而且难度是可以控制的,且难度随着 0 的个数程指数上升。我们举例:
import time
import matplotlib.pyplot as plt
message = "This is a message!"
x = []
y = []
ps = []
for diff in range(1, 7):
_s = time.time()
p = pow(message, diff)
ps.append(p)
_e = time.time()
dur = _e - _s
print(f"难度:{diff} - {dur} ")
x.append(diff)
y.append(dur)
"""
难度:1 - 1.71661376953125e-05
难度:2 - 7.200241088867188e-05
难度:3 - 0.009111881256103516
难度:4 - 0.14280223846435547
难度:5 - 0.19749689102172852
难度:6 - 21.125200271606445
"""
plt.plot(x, y)
可以看出,当难度为 6 时,这个简单的 PoW 协议需要 21 秒才能找到合适整数。当然,你总是可以用更好的算法,使用更好的硬件进行并行计算,但是这个算法复杂度不会因此改变,搜索时间随难度程指数级别增长。
比特币和 PoW
讲完了 PoW 的基本概念,我们从其他角度看看这个协议。因为 PoW 可能是比特 币协议看起来最难解的概念,比特币协议通过 PoW 来定义新块(一组新的交易记录)被加入分布式交易记录链(区块链)。 实际上 PoW 来自赛博朋克运动2(不是那个科幻小说赛博朋克,而是一种推崇计算机密码学的运动)的一部分,他跟货币政策或者计算机科学都有点格格不入。
所有比特币的区块都包括一个叫做 nonce 的无意义的整数,而“挖矿”做的工作跟我们上一节讲解的内容一样,寻找 nouce(其实就是我们之前提到的 p )。整个挖矿过程是一个非常随机的过程,谁先找到这个整数,谁就有权利提出下一个区块。
尽管矿机(节点)的目的是为了记账,但是他们做的绝大多数工作却是“挖矿”,即寻找整数,而不是记账。挖矿花费的能源(电力、维护等等)再也不会回来了,用掉了。整个比特币网络具有巨大的计算能力(hash能力),除了一小部分之外,其他一切都是没有目的的。
当一个人升级他们的挖矿计算机时,他们就能挖的更快,然后赚更多的比特币。但是,当每个人都升级时,挖矿整体并没有变得更有效率。不管网络的算力有多大,每十分钟只有一个块加入区块链。为了维持这个出块频率,网络会更新难度(0的个数)。比特币网络更像是一片森林,每棵树都试图长的更高来获得阳光,但是结果是大部分太阳能都被用来长高高的树干。
对于比特币网络来说,我们应该这样理解 PoW:比特币网络由一群自私的人组成,他们相互独立没有从属关系,为了让这群自私的人形成共识,我们需要 PoW,否则如果比特币网络中都是诚实和无私的节点,它就不需要 PoW 形成共识。
成块的 10 分钟发生了什么
在一个区块生成以前,网络中可能存在大量的交易,也没人决定哪一些交易应该进入下一个区块(mempool)。这些交易中,有一些是无效的,因此需要节点检查;有一些没有交易费,节点需要决定是不是无偿处理这些交易;还有一些交易不能同时为真,比如双花的交易,节点需要选择哪一个作为合法交易等等。
因此,根据当前的交易,其实可以形成无数多个合法的区块,但是没有人应该决定哪一个才是对的,因为就没有对错可言(当然,不合法的交易是不行的)。不同的区块可能对不同人的收益是不一样的。
矿工(节点)可以有意识的拒绝认证他的“敌人”的交易,或者他也可以无私的接受没有交易费的交易,因为他认识交易人。当然他也可以作弊,比如双花。他先向某人购买商品,然后之后把同一笔钱转给另一个人,然后只验证后一笔交易。
有无数多的理由可以让矿工按照自己的目的操纵比特币区块链,但是网络需要共识才能运行,但是网络不需要对某一个特定的目的达成共识。比特币的方案就是通过 PoW 为区块提议增加成本,这样增加了作弊的成本。一旦新的区块提案出现,矿工可以选择接受提议,或者坚持自己的提议。接受是一个合理的选择,是一种自然共识,因为如果下一个幸运儿是他自己,那么他提出的区块可以被以相同的想法接受;不接受相对比较冒险,因为他要说服其他人接受他的观点。
原则就是:第一个被挖出的区块不包含个人喜好,因为 PoW 可以确保第一个发现的人是随机产生的。换句话说,在 PoW 协议中,第一个发现区块的人只能是因为运气。 而不是别的什么。因此,任何不接受该区块的行为都是很值得怀疑的。
“不利条件原理”
你可能也发现了 PoW 之所以可以帮助达成共识似乎并不是基于计算机原理,而是人或者社会学原理。
不利条件原理,Handicap Principle,可以用来解释 PoW 达成共识的原理。不利原理其实是一个生物学的概念,这个原理说,当两只动物有合作的动机时,他们必须很有说服力地向对方表达善意。为了打消对方的疑虑,他们向对方表达友好时必须附上自己的代价,使得自己背叛对方时不得不付出昂贵的代价。 即,表达方式本身必须是对自己不利的。
不利原理其实为囚徒困境提供了一个解答。囚徒困境的基本结论是:个体做出理性判断会导致集体非理性。造成这种困境的主要原因是,个体之间无法确认对方可以选择合作。不利原理就可以解决这个问题,我们只需要做一些事情证明我们愿意合作,或者证明背叛的代价比合作更大!
假设两个囚犯有机会与检察官在一起一段时间,其中一名对博弈论特别了解的囚犯对检察官说,“如果另一个囚犯有罪,那么我也同样有罪。”这个声明对他自己来说是一个明显的代价,因为它消除了他在其他囚犯合作时叛逃的能力。然后另一名囚犯可以选择重复陈述。如果他不这样做,那么他知道第一个囚犯唯一可行的选择是叛逃,但如果他这样做了,那么两个囚犯都可以合作。
这就是障碍原则。
其实,有人认为正是这种障碍原则,解释了道德和利他主义。
因为,比特币的 PoW 协议不应该被作为一种资源的浪费或是某种达成共识的黑魔法。他是一种非常自然且有用的通讯协议。当一个分布式系统由一个组织控制,那么系统中的所有节点都是诚实的,PoW 是无意义的。但是比特币网络不是这样的,因此为了达成共识,需要 PoW 协议。
障碍原则在互联网其实非常有意义,因为互联网的绝大部分节点都是自私的(人)。如果电子邮件需要工作量证明,那么我们可能不需要花钱去研究如何过滤垃圾邮件;通讯协议如果需要工作量证明,DDOS (分布式拒绝服务攻击)攻击可能不会存在。
比特币的工作量证明就可以类比成利他主义,或者囚徒的声明。生成区块的计算能力代表了一种实力,但是即使有如此能力,也同意认可社区已经产生的第一个区块就是一种利他和无私的表现。
说一千道一万,共识本身就是需要代价的。要么是信任第三方的协调,要么是障碍原则。信任第三方协调的优势是效率,劣势是第三方可能不道德;障碍原则的优势是不需要第三方,因此也不需要承担信任的风险,劣势是需要能量证明。
阳光下没有新鲜事:PoS
所罗门皇帝的名言:阳光下面没有新鲜事。
没有 PoS 的 PoW 讨论是不完整的!但是今天我们不说 ETH 2.0,我们来说说一个已经无人问津的币:PPCoin。
PPCoin 于 2012 年启动,是第一个提出并实现 PoS 的点对点加密货币实现4。这可以算是 PoS 的鼻祖了,有意思的是,作者们提出 PoS 的时候并没有放弃 PoW,他们在白皮书中这样写道:
我们使用 PoS 作为网络的安全模型,但是使用 PoW 作为初始代币分发模型,并且逐步降低 PoW 的重要性。
作者的愿景非常好,而且他们也充分意识到了 PoS 协议的问题:初始代币分发。在 PPCoin 的 PoS 协议中,节点不是跟随算力最多的节点,而是投资该代币最多的节点。每一个 PPCoin 的矿工生成新块后都会失去一些老币,得到一些新币,这也意味着这次出块的节点,下一次很可能不会出块。
工作量证明和权益证明在不同情况下具有不同的成本和收益。根据障碍原则,产生信号的成本必须与信息的含义相关。股权证明系统展示了对硬币本身的投资,而工作证明系统展示的是底层网络中的工作量。
所以,如果两个网络的市值相同,PoW 网络容量更大、流动性更好,但是价格波动也更大;而 PoS 网络的价格稳定性更好。PoW 网络依靠的是:矿工难以说服其他人跟随他,来对抗不诚实的节点;而 PoS 基本上只接受对网络友善的节点的贡献来对抗不诚实的节点。
结束
这篇随想就到这里把,关于 PoS 的讨论可能有点过于简单了,不过以后我可以给大家讲讲 PPcoin 的白皮书,扒一扒 PoS 的源头4。
本文部分内容翻译:https://nakamotoinstitute.org/mempool/the-proof-of-work-concept/. 并非全部原创。