大部分人不理解协议的设计细节,更多利用已有协议进行运用层设计,例如:
(1)利用HTTP,设计get/post/cookie参数,以及json包格式;
(2)利用dubbo,而不用去穷究内部的二进制包头包体细节;

无论如何,理解协议设计的原则,对深入理解系统通信非常有帮助。
一、协议的分层设计所谓“协议”,是双方共同遵守的规则,例如:离婚协议,停战协议。协议有语法、语义、时序三要素:(1)语法,即数据与掌握信息的构造或格式;(2)语义,即须要发出何种掌握信息,完成何种动作以及做出何种相应;(3)时序,即事宜实现顺序的详细解释;
画外音:后文紧张讲语法设计。
协议设计常日分为三层:运用层协议、安全层协议、传输层协议。
下面分别看下这三层的协议该当如何选型。
二、运用层协议设计
运用层协议选型,常见的有三种:文本协议、二进制协议、流式XML协议。
文本协议
文本协议是指“贴近人类书面措辞表达”的通讯传输协议,范例的协议是HTTP协议,一个HTTP协议的要求报文样例如下:
GET / HTTP/1.1User-Agent: curlHost: musicml.netAccept: /
文本协议的特点是:(1)可读性好,便于调试;(2)扩展性较好,能通过key:value扩展;(3)解析效率不高,一行一行读入,按照冒号分割,解析key和value;(4)对二进制不友好 ,比如语音/视频等;
二进制协议二进制协议即binary协议,范例是IP协议,以下是IP协议的一个图示:
二进制协议一样平常包含:
(1)定长包头;
(2)可扩展变长包体;
(3)一样平常每个字段有固定的含义,以IP协议为例,前4个bit表示协议版本号(Version);
二进制协议的特点是:
(1)可读性差,难于调试;
画外音:打日志一样平常须要一个toString()函数增强可读性。
(2)扩展性不好,如果要扩展字段,旧版协议就不兼容了,以是设计时一样平常会有一个Version字段;(3)解析效率超高,险些没有解析代价,二进制流的每个字段表示固定含义;(4)天然支持二进制流 ,比如语音/视频;
这是一个范例的16字节二进制订长包头的例子:
//sizeof(cs_header)=16struct cs_header { uint32_t version; uint32_t magic_num; uint32_t cmd; uint32_t len; uint8_t data[];}__attribute__((packed));
个中:
(1)前4个字节表示版本号version;
(2)接下来4个字节表示邪术数字magic_num,用来办理数据错位或丢包问题;
画外音:例如,约定好邪术数字是0x01020304,收到的报文,邪术数字匹配,认为是正常报文,否则认为是报文非常,断开连接。
(3)接下来4个字节表示命令号command,不同的命令号对应不同的变长包体;(4)末了4个字节表示包体长度length,以确定变长包体有多少字节;
这是一个实际的二进制变长包体:
message CUserLoginReq { optional string username = 1; optional string passwd = 2;}message CUserLoginResp { optional uint64 uid =1;}
它利用的是Google的Protobuf协议,随意马虎看到:
(1)要求报文传入的是用户名与密码;
(2)相应包返回的是用户的uid;
PB是很盛行的二进制变长包体协议,其优点为:(1)通用,可以天生C++、Java、PHP等多措辞代码;
(2)自带压缩功能;
(3)对二进制友好;
(4)在工业界已广泛运用;
流式XML协议流式XML彷佛是文本协议的一个特例,亦可以单独作为一类。例如:xmpp便是范例的流式XML协议,下面是xmpp协议的一个范例报文:
<messageto=’romeo@example.net’from=’juliet@example.com’type=’chat’xml : lang=’en’><body>Wherefore art thou, Romeo?</body></message>
从xml标签中大致可以判断这是一个romeo发给juliet的谈天。
XML协议有几个特点:(1)可读性好,扩展性好,这是XML的特性;(2)解析代价超高,须要进行dom树剖析;
(3)有效数据传输率超低,有大量的标签;
(4)对二进制不友好 ,比如语音/视频等;
三、安全层协议设计
安全层协议设计,除了利用SSL,自行实现的话,常见的又有以下三种方案。
画外音:SSL秘钥管理是个问题。
固定密钥做事端和客户端约定好一个密钥,同时约定好一个加密算法(例如:AES),每次客户端发送报文前,就用约定好的算法,以及约定好的密钥加密再传输,做事端收到报文后,用约定好的算法,约定好的密钥再解密。
画外音:安全性低,安全性基于程序员的职业操守。
一人一密大略来说,便是一个人的密钥是固定的,但是每个人之间又不同。常见的实现办法是:
(1)固定加密算法;
(2)加密秘钥利用“用户的某一分外属性”,比如用户uid、手机号、qq号、用户密码等;
一次一密即动态密钥,一Session一密钥的安全性更高,每次会话前协商密钥。密钥协商的过程要经由2次非对称密钥的随机天生,1次对称加密密钥的随机天生,详细详情这里不展开。
四、传输层协议设计可选的协议有TCP和UDP,现在基本都是利用TCP,有了epoll等技能后,多连接就不是瓶颈了,单机几十万链接没什么问题。
本文转自“架构师之路”公众号,58沈剑供应。