jsencodeuriphp技巧_一文搞懂Web中隐蔽的密码学

文章目录 [+]

开拓网站登录功能时，如何担保密码在传输过程/储存的安全？

相信不少前后真个朋友，在口试时都会被问到类似的问题。

jsencodeuriphp技巧_一文搞懂Web中隐蔽的密码学

在我对密码学一无所知时，也仅会回答：“MD5加密啊。
”

（图片来自网络侵删）

诸不知，密码学在网络七层模型，乃至web开拓中的运用比我想象得多得多。

1. 什么是密码学？

密码学是各种安全运用程序所必需的，当代密码学旨在创建通过运用数学事理和打算机科学来保护信息的机制。
但比较之下，密码剖析旨在解密此类机制，以便得到对信息的造孽访问。

密码学具有三个关键属性：

机密性，为了防止未经授权的各方访问信息（换句话说，是要确保只有经由授权的人才能访问受限定的数据）。
完全性，是指保护信息不被随意修改真实性，与识别信息的所有者有关。

例如个人医疗数据：

机密性，个人医疗数据须要保密，这意味着只有年夜夫或医护职员才能访问它。
完全性，还必须保护其完全性，由于修改此类数据可能导致缺点的诊断或治疗，并给患者带来康健风险。
真实性，患者数据应与已识别的个人联系起来，且患者须要知道操作者（年夜夫）是谁。

在本文中，我们将从加密，哈希，编码和稠浊四种密码学根本技能来入门。

本文图片经由再制，方便看懂。

大纲和主体内容引自：How Secure Are Encryption, Hashing, Encoding and Obfuscation?[1]

2. 什么是加密？

加密定义：以担保机密性的办法转换数据的过程。

为此，加密须要利用一个保密工具，就密码学而言，我们称其为“密钥”。

加密密钥和任何其他加密密钥应具有一些属性：

为了保护机密性，密钥的值应难以预测。
该当在单个高下文中利用它，避免在不同高下文中重复利用（类比 JS 浸染域）。
密钥重用会带来安全风险，如果规避了其机密性，则影响更大，由于它“解锁”了更敏感的数据。

2.1 加密的分类：对称和非对称

加密分为两类：对称和非对称

对称加密：

用场：文件系统加密，Wi-Fi 保护访问（WPA），数据库加密（例如信用卡详细信息）

非对称加密：

用场：TLS，VPN，SSH。

其紧张差异是：所需的密钥数量：

在对称加密算法中，单个密用于加密和解密数据。
只有那些有权访问数据的人才能拥有单个共享密钥。
在非对称加密算法中，利用了两个密钥：一个是公用密钥，一个是私有密钥。
顾名思义，私钥必须保密，而每个人都可以知道公钥。
运用加密时，将利用公钥，而解密则须要私钥。
任何人都该当能够向我们发送加密数据，但是只有我们才能够解密和读取它。
常日利用非对称加密来在不屈安的通道上进行通信时，两方之间会安全地建立公共密钥。
通过此共享密钥，双方切换到对称加密。
这种加密速率更快，更适宜处理大量数据。

能被密码界承认的加密算法都是公开的：

某些公司利用专有或“军事级”加密技能进行加密，这些技能是“私有的”。
且基于“繁芜“算法，但这不是加密的事情办法。
密码界广泛利用和认可的所有加密算法都是公开的，由于它们基于数学算法，只有拥有密钥或前辈的打算能力才能办理。
公开算法是得到广泛采取，证明了其代价的。

3. 什么是哈希？

哈希算法定义：·一种只能加密，不能解密的密码学算法，可以将任意长度的信息转换成一段固定长度的字符串。

加密算法是可逆的（利用密钥），并且可以供应机密性（某些较新的加密算法也可以供应真实性），而哈希算法是不可逆的，并且可以供应完全性，以证明未修正特天命据。

哈希算法的条件很大略：给定任意长度的输入，输出特定长度的字节。
在大多数情形下，此字节序列对付该输入将是唯一的，并且不会给出输入是什么的指示。
换一种说法：

仅凭哈希算法的输出，是无法确定原始数据的。
取一些任意数据以及利用哈希算法输出，就可以验证此数据是否与原始输入数据匹配，从而无需查看原始数据。

为相识释这一点，请想象一个强大的哈希算法通过将每个唯一输入放在其自己的存储桶中而起浸染。
当我们要检讨两个输入是否相同时，我们可以大略地检讨它们是否在同一存储桶中。

散列文件的存储单位称为桶（Bucket）

3.1 例子一：资源下载

供应文件下载的网站常日会返回每个文件的哈希值，以便用户可以验证其下载副本的完全性。

例如，在Debian的图像下载做事中，您会找到其他文件，例如SHA256SUMS，个中包含可供下载的每个文件的哈希输出（在本例中为SHA-256算法）。

下载文件后，可以将其通报给选定的哈希算法，输出一段哈希值用该哈希值来与校验和文件中列出的哈希值作匹配，以校验是否同等。

在终端中，可以用openssl来对文件进行哈希处理：

同一个文件采取相同的hash算法时，就可以用来校验是否同源。

在强大的哈希算法中，如果有两个不同的输入，则险些不可能得到相同的输出。

而相反的，如果打算后的结果范围有限，就会存在不同的数据经由打算后得到的值相同，这便是哈希冲突。
（两个不同的数据打算后的结果一样）

这种称为：哈希碰撞（哈希冲突）。

如果两个不同的输入终极涌如今同一个存储桶中，则会发生冲突。
如MD5和SHA-1，就会涌现这种情形。
这是有问题的，由于我们无法区分哪个碰撞的值匹配输入。

强大的哈希算法险些会为每个唯一输入创建一个新存储桶。

3.2 例子二：网站上岸

在web开拓中，哈希算法利用最频繁的是在网站上岸运用上：

绝大多数的网站，在将上岸数据存入时，都会将密码哈希后存储。

这是为了避免他人盗取数据库信息后，还原出你的初始输入。
且下次登录时，Web 运用程序将再次对你的密码进行哈希处理，并将此哈希与之前存储的哈希进行比较。
如果哈希匹配，纵然 Web 运用程序中没有实际的密码存储，Web 运用程序也确信你知道密码。

上岸：

哈希算法的一个有趣的方面是：无论输入数据的长度如何，散列的输出始终是相同的长度。

从理论上讲，碰撞冲突将始终在可能性的范围之内，只管可能性很小。

与之相反的是编码。

4. 什么是编码？

编码定义：将数据从一种形式转换为另一种形式的过程，与加密无关。

它不担保机密性，完全性和真实性这三种加密属性，由于：

不涉及任何秘密且是完备可逆的。
常日会输出与输入值成比例的数据量，并且始终是该输入的唯一值。
编码方法被认为是公共的，普遍用于数据处理。
编码永久不适用于操作安全性干系。

4.1 URL编码

又叫百分号编码，是统一资源定位(URL)编码办法。
URL地址（常说网址）规定了：

常用的数字，字母可以直策应用，其余一批作为分外用户字符也可以直接用（/,:@等）剩下的其它所有字符必须通过%xx编码处理。

现在已经成为一种规范了，基本所有程序措辞都有这种编码，如：

js：encodeURI、encodeURIComponentPHP：urlencode、urldecode 等。

编码方法很大略，在该字节ascii码的 16 进制字符前面加%. 如空格字符，ascii码是 32，对应 16 进制是'20'，那么urlencode编码结果是:%20。

4.2 HTML实体编码

在HTML中，须要对数据进行HTML编码以遵守所需的HTML字符格式。
转义避免 XSS 攻击也是如此。

4.3 Base64/32/16编码

base64、base32、base16可以分别编码转化 8 位字节为 6 位、5 位、4 位。

16,32,64 分别表示用多少个字符来编码，

Base64常用于在常日处理文本数据的场合，表示、传输、存储一些二进制数据。
包括MIME的email，email via MIME,在XML中存储繁芜数据。

编码事理：

Base64编码哀求把 3 个 8 位字节转化为 4 个 6 位的字节之后在 6 位的前面补两个 0，形成 8 位一个字节的形式6 位 2 进制能表示的最大数是 2 的 6 次方是 64，这也是为什么是 64 个字符的缘故原由A-Z,a-z，0-9，+，/这 64 个编码字符，=号不属于编码字符，而是添补字符

Base64映射表，如下：

举个栗子：

引自：一篇文章彻底弄懂 Base64 编码事理[2]

第一步：“M”、“a”、\"大众n\"大众对应的ASCII码值分别为 77，97，110，对应的二进制值是01001101、01100001、01101110。
如图第二三行所示，由此组成一个 24 位的二进制字符串。
第二步：如图赤色框，将 24 位每 6 位二进制位一组分成四组。
第三步：在上面每一组前面补两个 0，扩展成 32 个二进制位，此时变为四个字节：00010011、00010110、00000101、00101110。
分别对应的值（Base64编码索引）为：19、22、5、46。
第四步：用上面的值在 Base64 编码表中进行查找，分别对应：T、W、F、u。
因此“Man”Base64编码之后就变为：TWFu。

上面的示例旨在指出，编码的用例仅是数据处理，而不为编码的数据供应保护。

4. 什么是稠浊？

稠浊定义：将人类可读的字符串转换难堪以理解的字符串。

与加密相反，稠浊处理不包含加密密钥。
与编码类似，稠浊不能担保任何安全性，只管有时会误将其用作加密方法

只管不能担保机密性，但稠浊仍有其它运用：

用于防止修改和保护知识产权。
APP 源代码常日在打包之前就被稠浊了由于源代码位于用户的设备中，可以从中提取代码。
由于稠浊后代码不友好，因此会阻挡逆向工程，从而有助于保护知识产权。
反过来，这可以防止修改代码并将其重新分发以供恶意利用。

但是，如此存在许多有助于肃清运用程序代码稠浊的工具。
那便是其它话题了。
。
。

4.1 例子一：JavaScript稠浊

JavaScript源代码：

稠浊后：

总结

从机密性，完全性，真实性剖析四种密码技能：

加密哈希编码稠浊机密性✅❌❌❌完全性❓✅❌❌真实性❓❌❌❌

加密，虽然是为了担保数据的机密性，但某些当代加密算法还采取了其他策略来担保数据的完全性（有时通过嵌入式哈希算法）和真实性。
哈希，只能担保完全性，但可以通过完全性比拟来做权限掌握，如：基于哈希的认证码（HMAC）和某些传输层安全性（TLS）方法。
编码，过去曾被用来表示加密，并在技能领域之外仍具有这种含义，但在编程天下中，它仅是一种数据处理机制，从未供应任何安全方法。
稠浊，可以用来提高抵御攻击的能力；但是，它永久不能担保数据的机密性。
狡猾的对手终极将绕过稠浊策略。
与编码一样，永久不要将稠浊视为可靠的安全掌握。

附录：哈希函数

常用的哈希函数：

MD5，一种被广泛利用的密码杂凑函数，可以产生出一个 128 位元（16 位元组）的哈希值，用于确保信息传输完全同等。
虽广泛，但过期。
SHA-256/SHA512 , \"大众加盐\"大众。
在比特币中，区块链利用SHA-256算法作为根本的加密哈希函数。
安全散列算法secure hash algorithm，是一个密码哈希函数家族。
SHA家族有五个算法，分别是SHA-1,SHA-224,SHA-256,SHA-384,SHA-512它们是美国确当局标准，后面的四个称之为SHA-2bcrypt：bcrypt算法相对来说是运算比较慢的算法。
在密码学界有句常话：越慢的算法越安全。
算法越算，黑客破解本钱越高：通过salt和const这两个值来减缓加密过程，ta 的加密韶光（百 ms 级）远远超过md5（大概1ms旁边）。
对付打算机来说，Bcrypt 的打算速率很慢，但是对付用户来说，这个过程不算慢。
bcrypt是单向的，而且经由salt和cost的处理，使其受rainbow攻击破解的概率大大降落，同时破解的难度也提升不少。
相对付MD5等加密办法更加安全，而且利用也比较大略.设计良好的密钥扩展算法，如PBKDF2，bcrypt，scrypt。

后记 & 引用

How Secure Are Encryption, Hashing, Encoding and Obfuscation?[3]CTF 中那些脑洞大开的编码和加密[4]散列文件的存储——‘桶’[5]

那么，如何担保密码在传输过程/储存的安全呢？

我们下回分解！

❤️ 看完三件事

如果你以为这篇内容对你挺有启示，我想约请你帮我三个小忙：

点赞，让更多的人也能看到这篇内容（收藏不点赞，都是耍泼皮）。
关注「前端劝退师」，不定期分享原创知识。
也看看其它文章

也可以来我的GitHub博客里拿所有文章的源文件：

前端劝退指南：https://github.com/roger-hiro/BlogFN

参考资料

[1]

How Secure Are Encryption, Hashing, Encoding and Obfuscation?: https://auth0.com/blog/how-secure-are-encryption-hashing-encoding-and-obfuscation/#What-is-Encoding-

[2]

引自：一篇文章彻底弄懂Base64编码事理: https://blog.csdn.net/wo541075754/article/details/81734770

[3]

How Secure Are Encryption, Hashing, Encoding and Obfuscation?: https://auth0.com/blog/how-secure-are-encryption-hashing-encoding-and-obfuscation/#What-is-Encoding-

[4]

CTF中那些脑洞大开的编码和加密: https://www.cnblogs.com/godoforange/articles/10850493.html

[5]

散列文件的存储——‘桶’: https://blog.csdn.net/Dearye_1/article/details/78492021