密码学原语如何应用？解析单向哈希的妙用-41财经

密码学原语如何应用？解析单向哈希的妙用

收藏邀请

隐私数据如何验明真伪？区块链数据何以可信？如何快速检验海量数据是否被篡改？单向哈希在其中起到了什么作用？

隐私数据的价值很大程度上源自其真实性，如何防止数据被恶意篡改，是隐私保护方案设计中不可忽视的关键目标之一。为此，密码学领域提出了一系列基本组件，即密码学原语（Cryptographic Primitive）来实现这一目标，其中最常用的便是单向哈希。

在区块链中，单向哈希能够链接多个区块数据，形成可信的链式数据结构，在弱信任环境下，提供防篡改且经过多方共识的可信数据源。

这一特性对隐私保护方案的设计意义重大。隐私数据往往以密文形式表达，需要快速检验海量隐私数据的真伪，查验是否被恶意篡改。此时，单向哈希作为一项关键技术，大有用武之地。

为何单向哈希如此神奇？其常见的用法有哪些？又能具体解决哪些问题？以下将据此一一展开。

单向的哈希算法

哈希算法是信息科学中的基础算法组件，“快速实现数据比较和效验”是其设计初衷之一。

现实业务场景中，可能会涉及海量隐私数据，逐一比对数据原文，在很多场景中非常不现实，尤其是需要通过网络传输的数据，会大大增加网络带宽的负担。

哈希算法的出现，使得高效的数据验证成为了可能。

哈希算法的核心功能为，将任意长度的输入m映射为固定长度的输出H(m)，H(m)常称为哈希值、散列值或消息摘要。

一个精心设计的哈希算法具有以下特征：

输出确定性：同一种哈希算法，相同的输入，其输出固定不变。
输出长度不变性：同一种哈希算法，针对任意长度的输入，其输出长度不变。
输入敏感性：同一种哈希算法，即便输入数据有微小的改变，其输出哈希值也会发生巨大变化。

因此，只要比较数据的哈希值是否与预期的一致，就能大概率地判别隐私数据原文是否被篡改。其典型的实现有：各大主流编程语言中，HashMap数据结构所使用的哈希算法。

然而，只是大概率，在密码学协议中是不够的。我们需要更强的哈希算法，将实际的检验概率提升至接近100%。

与之对应的一个重要概念是『哈希碰撞』。哈希碰撞是指，存在两个不同的数据原文m1和m2，其哈希值完全相同，即H(m1) = H(m2)。

容易出现哈希碰撞的哈希算法在密码学协议中不安全，同时，密码学还进一步引入了单向性的要求。

一个密码学安全的哈希算法，在传统哈希算法的基础上，还需满足以下特性：

单向性：根据数据原文计算哈希值很容易，但要求难以根据哈希值计算数据原文，提供计算上的不对称性，以此防止攻击者轻易地从哈希值反推出可能的隐私数据原文，保护哈希值的机密性。
抗碰撞性：给定任意两个不同的数据原文，要求它们经哈希算法计算后得到相同哈希值的概率极低，以此防止攻击者轻易地为篡改之后的隐私数据原文构造出合法的哈希值，确保数据检验的有效性。

以上两个特性，赋予了密码学安全的哈希算法对数据内容公开可验证的约束能力。这一约束能力使得经过单向性转换获得哈希值，在一定程度上可以作为隐私数据原文的等价信息。

在隐私保护方案设计中，哈希算法的单向性是最常用的特性之一。相应地，密码学安全的哈希算法也常被称之为单向哈希。

目前主流的单向哈希有如下算法标准：

NIST标准：SHA（Secure Hash Algorithm）系列是由美国国家标准技术研究院（NIST）制定的SHA哈希算法系列，主要包括SHA-1、SHA-2和SHA-3三个系列。SHA-1由于安全问题已不再使用。
SHA-2系列包括SHA-224(表示哈希值长度为224位)、SHA-256、SHA-384、SHA-512等算法，其中SHA-256是目前使用最广泛的单向哈希。
SHA-3是最新算法标准，源自参与SHA-3竞赛的keccak算法。2015年，NIST在完成SHA-3的标准化时，调整了keccak的填充流程，因此，标准的SHA-3算法与原始的keccak算法并不兼容。
国密标准：国密哈希算法SM3，是我国制定的单向哈希算法标准，由国家密码管理局于2010年12月17日发布，其安全性和效率与SHA-2系列的SHA-256相当。

单向哈希的选型可以参考业务部署的地域性要求，建议在SM3和SHA-3之间做出选择，如果需要与现有系统进行兼容，也可酌情选用SHA-2系列中的SHA-256。

链式哈希结构

单向哈希的用途很广泛，最直接的应用就是构造链式哈希结构，即大家所熟知的区块链，提供难以篡改的可信数据源。

由于单向哈希的单向性，从结构上可以看出，从前一个数据块原文，很容易计算下一个数据块所用的哈希值输入，但已知一个哈希值输入，难以反推出所有可能的数据块原文。

区块链技术结合单向哈希和共识算法，当某一区块的数据共识确认后，下一区块将会记录前一区块数据的哈希值，从而实现整条链上所有数据块的难以篡改。

在隐私保护方案设计中，以区块链为代表的基于链式哈希结构的可信数据源，可以起到简化协议设计的作用，尤其对于第4论中提到的恶意模型特别有效。恶意模型下的密码学协议，为了防范内部参与者不遵守协议、随意篡改数据，不得不引入复杂的多方交互验证过程。

通过链式哈希结构，在现实系统中引入一个可信数据源，可以对关键的中间流程数据进行存证和溯源，一旦有参与方作恶，便能在第一时间检测出，且定位到对应责任方，有效保障隐私保护方案全流程的正确性。

哈希树

单向哈希不仅仅能构造简单的链式哈希结构，还能根据业务需要扩展为更复杂的数据结构，其经典的形态之一便是哈希树。

哈希树常称为Merkle Tree，最早由Ralph Merkle在1979年的专利申请中提出，为大数据量的完整性验证提供了高效灵活的解决方案。

这里的完整性验证是指，核实原始数据在使用和传输的过程中没有被篡改。

在真实的隐私保护业务中，隐私数据多为高价值数据，而且多以密文的形态保存和使用，一旦被篡改，在不知道明文的前提下，难以通过常规技术手段来有效识别真伪。

对于涉及多方协作、联合计算的隐私保护业务，隐私数据密文交换和共享通常是其中的核心流程。所以当这些隐私数据密文跨越系统边界时，数据接收方会有两方面数据检验需求：

整体完整：验证隐私数据中任意部分都未被篡改。
篡改定位：如果存在攻击，能够有效定位被篡改的数据位置，便于开展应对流程。

为了体现哈希树的设计优越性，我们以举例的形式展示其效果。

为了简化说明，以下分析假定：

发送方与接收方之间存在一个带宽有限的可信信道，如区块链上经过共识的数据，可以将简短的哈希值安全地传递给对方。
隐私数据相关的原始文件由于数据量过大，不得不通过低成本低密级信道传输，如公共网络，因此可能被攻击者篡改。

方案1：整体单次哈希

本方案中，发送方在发送原始文件之前，将所有的原始文件数据作为哈希算法的输入，计算哈希值，然后将哈希值与原始文件均发送给接收方。

当接收方收到哈希值和原始文件后，重复发送方计算哈希值的操作，然后将新计算得到的哈希值与从网络上接收到的哈希值进行比较，如果相同，就可以判断原始文件在传输过程中未被篡改。

方案2：分块多次哈希 + 哈希树

方案1对于满足整体完整需求十分有效，但对于第二条篡改定位需求就无能为力了。

基于哈希算法的输入敏感性，接收方可以知道至少有一个比特的数据被篡改了，但不知道具体在哪里。发送方不得不对所有数据进行重发，在这种情况下，攻击者很容易对隐私保护方案实施拒绝服务攻击。

为了解决这一点，本改进方案中，将原始文件分成一系列数据块，为每一个数据块分别计算哈希值。接收方验证的过程与方案1相似，区别在于可以对具体的数据块进行验证，一个数据块被篡改，导致的哈希值不匹配不会影响到其他数据块的验证，由此实现了篡改定位需求。

这里中间缺了关键的一步，即如何高效灵活地传输这些哈希值，并在原始文件很大时，灵活支持部分数据的获取和验证？

解决这些问题的要点，在于利用好哈希树的特性。

哈希树中，最底层的叶子层是各个数据块的哈希值，往树根的方向迭代哈希计算。即把相邻的两个节点的哈希值串连之后，再进行哈希运算，这样每两个哈希值就生成一个新的哈希值，重复以上计算过程，直到仅剩下一个哈希值（根哈希），最终形成一棵倒挂的树。

在哈希值传输方面，接收方只需要通过可信信道下载一个根哈希，其他数据都可以通过低成本低密级信道传输。

在支持部分数据的获取和验证方面，接收方只需要获取所需的部分数据块、根哈希，途经分支节点的哈希值，以O(log(n))的时间复杂度便可完成数据的验证，并实现被篡改数据块的快速定位。

除了哈希树之外，根据业务需求的差异，单向哈希还能用于构造有向无环图等更复杂的数据结构。一般而言，其作用相当于连接各个数据点的锁扣，为相关数据建立公开可验证的密码学约束，使之难以被篡改，以此保障数据的正确性。

正是：隐私数据真假难分辨，单向哈希守正不轻挠！

单向哈希是密码学中处于核心地位的密码学原语，可用于构建难以篡改的可信数据源、高效灵活的数据完整性验证机制等，以此来保障隐私保护方案中隐私数据的正确性。

本论中，我们介绍了单向哈希的基础应用，在往后的文章中，我们还会进一步介绍单向哈希的高级应用，包括构造密码学承诺、零知识证明等。

同时，作为密码学中久经考验的基本组件，除了单向哈希，密码学原语还包括数据编解码、对称加密、非对称加密、数字签名等，基础密码学原语还能进一步组成更高级的密码学组件。在这一系列中，我们将逐一展开与隐私保护密切相关的密码学原语的分享，欲知详情，敬请关注下文分解。

鲜花

握手

雷人

路过

鸡蛋

该文章已有0人参与评论

请发表评论

全部评论

本文作者2020-4-30 14:06

山海

粉丝0 阅读16949 回复0

新基建“风口”下区块链产业如何共享百亿红利发布时间：2020-04-30

千刀大阳线，一夜之间，比特币突破8900美元，2.9万人爆仓发布时间：2020-04-30

精彩阅读

第8届世界元宇宙大会在元宇宙

12月13日，由WMA世界元宇宙发展联盟主办的第8届世界元宇宙大会在...详情
「以代码作画」从数据角度剖析

作者：Mia Bao, co-founder of thepass.to, chief partner of WH...详情
一份假 Offer 盗走 Axie infin

今年早些时候，黑客诱骗 Axie Infinity 的一名高级工程师申请了...详情
元宇宙大幕拉开谁在“跑马圈

7月6日，元宇宙空间技术服务商构赛博宣布已于近日完成千万元人民...详情

< >

资讯 WSJ：Binance.US法务主管和首席风险官将离

WSJ：Binance.US法务主管和首席风险官将离

香港数码港：启动专责小组配合和监督管理层

马斯克：为反抗微软、谷歌的AI霸权而奋斗

香港虚拟保险公司OneDegree成立工作小组前

巴西加密诈骗公司向巴西前总统竞选活动捐赠

渣打香港与迪拜经济及旅游部签订合作协议，

新加坡一6旬退休公务员被诈骗团伙以投资虚

区块链游戏《Shrapnel》将针对美国玩家削减

排行榜

1 “抓捕浪潮”才刚拉开帷幕，首个一锅端案例

风雨将至，大浪淘沙。BISS一锅端据澎湃新闻11月24日晚报道，近日北京警方一举破获非法

阅读：242|2019-11-26

2 如何让区块链技术赋能劳动力调查？

习近平总书记在中共中央政治局集体学习时强调，要把区块链作为核心技术自主创新的重要

阅读：40595|2020-10-15

3 电子货币、数字货币，你分清了吗？

微信、支付宝平台转账使用的电子货币，我国发行在即的央行数字货币DCEP，Facebook或20

阅读：932|2019-12-30

4 区块链发展先行示范区揭牌仪式在广州市隆重

3月29日上午，区块链发展先行示范区揭牌仪式在广州市隆重举行，标志着广州在推动区块

阅读：5471|2020-03-30

5 拒绝腰斩、归零，什么才是最理想的投资

共同助力新基建的发展。由猎云财经主办，嘉楠、鱼池、点存科技、GSR、99Ex、100P算力

阅读：43728|2020-08-24

6 加密市场1年增200倍印度交易所缴税计划提

尽管印度监管层对加密货币的态度仍不明朗，但该国加密市场已从一年前的约2亿美元猛增

阅读：48348|2021-07-02

7 真正的区块链应用值怎样的？专家：要解决四

区块链相关的产业已经涉及到方方面面，「区块链+」也开发出了许多应用场景，但区块链

阅读：1305|2019-12-23

8 最新的PlusYoken报告显示：KYC有可能只是烟

关于PlusToken 旁氏骗局的新报告显示，尽管有严格的KYC验证认证规则，但仍有受监管的

阅读：1391|2020-03-12

9 ETH瞄准500美元，ETH 2.0第0阶段最终测试网

根据Glassnode报告显示，现在90％以上的流通中的ETH供应正处于盈利状态，即当前价格比

阅读：35429|2020-08-04

10 41秀time第25期“SATO，引领算法稳定币新浪

【主题】：SATO，引领算法稳定币新浪潮【时间】：2021年4月2日上午十点【嘉宾】：Yesb

阅读：7732|2021-03-31

专访

第8届世界元宇宙大会在元宇宙与杭州同步顺

「以代码作画」从数据角度剖析Art Blocks生

一份假 Offer 盗走 Axie infinity 5.4 亿美

元宇宙大幕拉开谁在“跑马圈地”？

41财经公众号码

扫码微信公众号
给你想要与成长

关注官方微博

加入官方Q群

密码学原语如何应用？解析单向哈希的妙用

单向的哈希算法

链式哈希结构

哈希树

请发表评论

全部评论

本文作者2020-4-30 14:06

上一篇：

下一篇：

精彩阅读

第8届世界元宇宙大会在元宇宙

「以代码作画」从数据角度剖析

一份假 Offer 盗走 Axie infin

元宇宙大幕拉开谁在“跑马圈

推荐视频

排行榜

专访

41财经公众号码

关于我们

区块链社区

品牌合作

密码学原语如何应用？解析单向哈希的妙用

单向的哈希算法

链式哈希结构

哈希树

请发表评论

全部评论

本文作者2020-4-30 14:06

上一篇：

下一篇：

精彩阅读

第8届世界元宇宙大会在元宇宙

「以代码作画」从数据角度剖析

一份假 Offer 盗走 Axie infin

元宇宙大幕拉开 谁在“跑马圈

推荐视频

排行榜

专访

41财经公众号码

关于我们

区块链社区

品牌合作

元宇宙大幕拉开谁在“跑马圈