mongodbdebugphp技巧_MongoDB络传输处理源码实现及机能调优

文章目录 [+]

开源mongodb代码规模数百万行，本篇文章内容紧张剖析mongodb网络传输模块内部实现及其性能调优方法，学习网络IO处理流程，体验不同事情线程模型性能极致设计事理。
其余一个目的便是勾引大家快速进行百万级别规模源码阅读，做到不同大工程源码”举一反三”快速阅读的目的。

此外，mognodb网络事情线程模型设计非常好，不仅非常值得数据库干系研发职员学习，中间件、分布式、高并发、做事端等干系研发职员也可以借鉴，极力推举大家学习。

mongodbdebugphp技巧_MongoDB络传输处理源码实现及机能调优

1. 如何阅读数百万级大工程内核源码

Mongodb内核源码由第三方库third_party和mongodb做事层源码组成，个中mongodb做事层代码在不同模块实现中依赖不同的third_party库，第三方库是mongodb做事层代码实现的根本(例如:网络底层IO实现依赖asio-master库, 底层存储依赖wiredtiger存储引擎库)，个中第三方库也会依赖部分其他库(例如：wiredtiger库依赖snappy算法库，asio-master依赖boost库)。

（图片来自网络侵删）

虽然Mongodb内核源码数百万行，工程量巨大，但是mongodb做事层代码实现层次非常清晰，代码目录构造、类命名、函数命名、文件名命名都非常一览无余，充分表示了10gen团队的专业精神。

解释：mongodb内核除第三方库third_party外的代码，这里统称为mongodb做事层代码。

本文以mongodb做事层transport实现为例来解释如何快速阅读全体mongodb代码，我们在走读代码前，建议遵照如下准则：

1.1 熟习mongodb基本功能和利用方法

首先，我们须要熟习mongodb的基本功能，明白mongodb是做什么用的，用在什么地方，这样才能表示mongodb的真正代价。
此外，我们须要提前搭建一个mongodb集群玩一玩，这样也可以进一步匆匆使我们理解mongodb内部的一些常用基本功能。
千万不要急于求成，如果连mongodb是做什么的都不知道，或者连mongodb的运维操作方法都没玩过，直接读取代码会非常不适宜，没有目的的走读代码不利于剖析全体代码，同时阅读代码过程会非常痛楚。

1.2 下载代码编译源码

熟习了mongodb的基本功能，并搭建集群大略体验后，我们就可以从github下载源码，自己编译源码天生二进制文件，编译文档存放于docs/building.md 代码目录中，源码编译步骤如下:

下载对应releases中对应版本的源码进入对付目录，参考docs/building.md文件内容进行干系依赖工具安装实行buildscripts/scons.py编译出对应二进制文件，也可以直接scons mongod mongos这样编译。
编译成功后的生产可实行文件存放于./build/opt/mongo/目录

在正在编译代码并运行的过程中，创造以下两个问题：

1)编译出的二进制文件占用空间很大，如下图所示：

从上图可以看出，通过strip处理工具处理后，二进制文件大小已经和官方二进制包大小一样了。

2)在一些低版本操作系统运行的时候出错，找不到对应stdlib库，如下图所示：

如上图所示，当编译出的二进制文件拷贝到线上运行后，创造无法运行，提示libstdc库找不到。
缘故原由是我们编译代码时候依赖的stdc库版本比其他操作系统上面的stdc库版本更高，造成了不兼容。

办理办法：编译的时候编译脚本中带上-static-libstdc++，把stdc库通过静态库的办法进行编译，而不是通过动态库办法。

1.3 理解代码日志模块利用方法，试着加打印调试

由于前期我们对代码整体实现不熟习，不知道各个接口的调用流程，这时候就可以通过加日志打印进行调试。
Mongodb的日志模块设计的比较完善，从日志中可以很明确的看出由那个功能模块打印日志，同时日志模块有多种打印级别。

1)日志打印级别设置

启动参数中verbose设置日志打印级别，日志打印级别设置方法如下：

Mongod -f ./mongo.conf -vvvv

这里的v越多，表明日志打印级别设置的越低，也就会打印更多的日志。
一个v表示只会输出LOG(1)日志，-vv表示LOG(1) LOG(2)都会写日志。

2)如何在.cpp文件中利用日志模块记录日志

如果须要在一个新的.cpp文件中利用日志模块打印日志，须要进行如下步骤操作：

添加宏定义 #define MONGO_LOG_DEFAULT_COMPONENT ::mongo::logger::LogComponent::kExecutor利用LOG(N)或者log()来记录想要输出的日志内容，个中LOG(N)的N代表日志打印级别，log()对应的日志全记录到文件。

例如: LogComponent::kExecutor代表executor模块干系的日志，参考log_component.cpp日志模块文件实现，对应到日志文件内容如下：

1.4 学会用gdb调试mongodb代码

Gdb是linux系统环境下精良的代码调试工具，支持设置断点、单步调试、打印变量信息、获取函数调用栈信息等功能。
gdb工具可以绑定某个线程进行线程级调试，由于mongodb是多线程环境，因此在用gdb调试前，我们须要确定调试的线程号，mongod进程包含的线程号及其对应线程名查看方法如下:

把稳：在调试mongod事情线程处理流程的时候，不要选择adaptive动态线程池模式，由于线程可能由于流量低引起事情线程不饱和而被销毁，从而造成调试过程由于线程销毁而中断，synchronous线程模式是一个链接一个线程，只要我们不关闭这个链接，线程就会一贯存在，不会影响我们理解mongodb做事层代码实现逻辑。
synchronous线程模式调试的时候可以通过mongo shell链接mongod做事端端口来仿照一个链接，因此调试过程相比拟较可控。

在对事情线程调试的时候，创造gdb无法查找到mongod进程的符号表，无法进行各种gdb功能调试，如下图所示：

上述gdb无法attach到指定线程调试的缘故原由是无法加载二进制文件符号表，这是由于编译的时候没有加上-g选项引起，mongodb通过SConstruct脚本来进行scons编译，要启编译出新的二进制文件后，就可以gdb调试了，如下图所示，可以很方便的定位到某个函数之前的调用栈信息，并进行单步、打印变量信息等调试：

1.5 熟习代码目录构造、模块细化拆分

在进行代码阅读前还有很主要的一步便是熟习代码目录及文件命名实现，mongodb做事层代码目录构造及文件命名都有很严格的规范。
下面以truansport网络传输模块为例，transport模块的详细目录文件构造：

从上面的文件分布内容，可以清晰的看出，全体目录中的源码实现文件大体可以分为如下几个部分：

message_compressor_网络传输数据压缩子模块service_entry_point做事入口点子模块service_executor做事运行子模块，即线程模型子模块service_state_machine做事状态机处理子模块Session回话信息子模块Ticket数据分发子模块transport_layer套接字处理及传输层模式管理子模块

通过上面的拆分，全体大的transport模块实现就被拆分成了7个小模块，这7个小的子模块各自大责对应功能实现，同时各个模块相互衔接，整体实现网络传输处理过程的整体实现，下面的章节姑息这些子模块进行大略功能解释。

1.6 从main入口开始大体走读代码

前面5个步骤过后，我们已经熟习了mongodb编译调试以及transport模块的各个子模块的干系代码文件实现及大体子模块浸染。
至此，我们可以开始走读代码了，mongos和mongod的代码入口分别在mongoSMain()和mongoDbMain()，从这两个入口就可以一步一步理解mongodb做事层代码的整体实现。

把稳：走读代码前期不要深入各种细节实现，大体理解代码实现即可，先大体弄明白代码中各个模块功能由那些子模块实现，千万不要穷究细节。

1.7 总结

本章节紧张给出了数百万级mongodb内核代码阅读的一些建议，全体过程可以总结为如下几点：

提前理解mongodb的浸染及事情事理。
自己搭建集群提前学习下mongodb集群的常用运维操作，可以进一步帮助理解mongodb的功能特性，提升后期代码阅读的效率。
自己下载源码编译二进制可实行文件，同时学会利用日志模块，通过加日志打印的办法逐步开始调试。
学习利用gdb代码调试工具调试线程的运行流程，这样可以更进一步的匆匆使快速学习代码处理流程，特殊是一些繁芜逻辑，可以大大提升走读代码的效率。
正式走读代码前，提前理解各个模块的代码目录构造，把一个大模块拆分成各个小模块，先大体浏览各个模块的代码实现。
前期走读代码千万不要深入细节，捋清楚各个模块的大体功能浸染后再开始一步一步的深入细节，理解深层次的内部实现。
从main()入口逐步开始走读代码，结合log日志打印和gdb调试。
跳过整体流程中不熟习的模块代码，只走读本次想弄明白的模块代码实现。
2. mongodb内核网络传输transport模块实现事理

从1.5章节中，我们把transport功能模块细化拆分成了网络传输数据压缩子模块、做事入口子模块、线程模型子模块、状态机处理子模块、session会话信息子模块、数据分发子模块、套接字处理和传输管理子模块，统共七个子模块。

实际上mongodb做事层代码的底层网络IO实现依赖asio库完成，因此transport功能模块该当是7+1个子模块构成，也便是做事层代码实现由8个子模块支持。

2.1 asio网络IO库实现事理

Asio是一个精良网络库，依赖于boost库的部分实现，支持linux、windos、unix等多平台，mongodb基于asio库来实现网络IO及定时器处理。
asio库由于为了支持多平台，在代码实现中用了很多C++的模板，同时用了很多C++的新语法特性，因此整体代码可读性比较mongodb做事层代码差很多。

做事端网络IO异步处理流程大体如下：

调用socket()创建一个套接字，获取一个socket描述符。
调用bind()绑定套接字，同时通过listen()来监听客户端链接，注册该socket描述符到epoll事宜集列表，等待accept对应的新连接读事宜到来。
通过epoll_wait获取到accept对应的读事宜信息，然后调用accept()来接管客户的连接，并获取一个新的链接描述符new_fd。
注册新的new_fd到epoll事宜集列表，当该new_fd描述符上有读事宜到来，于是通过epoll_wait获取该事宜，开始该fd上的数据读取。
读取数据完毕后，开始内部处理，处理完后发送对应数据到客户端。
如果一次write数据到内核协议栈写太多，造成协议栈写满，则添加写事宜到epoll事宜列表。

做事端网络IO同步办法处理流程和异步流程大同小异，少了epoll注册和epoll事宜关照过程，直接同步调用accept()、recv()、send()进行IO处理。

同步IO处理办法相比拟较大略，下面仅剖析和mongodb做事层transport模块结合比较紧密的asio异步IO实现事理。

Mongodb做事层用到的Asio库功能中最主要的几个构造有io_context、scheduler、epoll_reactor。
Asio把网络IO处理任务、状态机调度任务做为2种不同操作，分别由两个继续自operation的类构造管理，每种类型的操作也便是一个任务task。
io_context、scheduler、epoll_reactor最主要的功能便是管理和调度这些task有序并且高效的运行。

2.1.1 io_context类实现及其浸染

io_context 高下文类是mongodb做事层和asio网络库交互的枢纽，是mongodb做事层和asio库进行operation任务交互的入口。
该类卖力mongodb干系任务的入队、出队，并与scheduler调度处理类合营实现各种任务的高效率运行。
Mongodb做事层在实现的时候，accept新连接任务利用_acceptorIOContext这个IO高下文成员实现，数据分发及其相应回调处情由_workerIOContext高下文成员实现。

该类的几个核心接口功能如下表所示：

Io_context类成员/函数名功能备表明释impl_type& impl_;Mongodb对应的type类型为scheduler通过该成员来调用scheduler调度类的接口io_context::run()卖力accept对应异步回调处理1.mongodb中该接口只针对accept对应IO异步处理 2.调用scheduler::run()进行accept异步读操作io_context::stop()停滞IO调度处理调用scheduler::stop()接口io_context::run_one_until()1. 从全局行列步队上获取一个任务实行 2. 如果全局行列步队为空，则调用epoll_wait()获取网络IO事宜处理调用schedule::wait_one()io_context::post()任务入队到全局行列步队调用scheduler::post_immediate_completion()io_context::dispatch()1.如果调用该接口的线程已经运行过全局行列步队中的任务，则直接连续由本线程运行该入队的任务 2.如果不知足条件1条件，则直接入队到全局行列步队，等待调度实行如果条件1知足，则直接由本线程实行如果条件1不知足，则调用scheduler::do_dispatch ()

总结：

从上表的剖析可以看出，和mongodb直接干系的几个接口终极都是调用schedule类的干系接口，全体实现过程参考下一节scheduler调度实现模块。
上表中的几个接口按照功能不同，可以分为入队型接口(poll、dispatch)和出队型接口(run_for、run、run_one_for)。
按照和io_context的关联性不同，可以分为accept干系io(_acceptorIOContext)处理的接口(run、stop)和新链接fd对应Io(_workerIOContext)数据分发干系处理及回调处理的接口(run_for、run_one_for、poll、dispatch)。
io_context高下文的上述接口，除了dispatch在某些情形下直接运行handler外，其他接口终极都会间接调用scheduler调度类接口。
2.1.2 asio调度模块scheduler实现

上一节的io_context高下文中提到mongodb操作的io高下文终极都会调用scheduler的几个核心接口，io_context只是起衔接mongodb和asio库的链接桥梁。
scheduler类紧张事情在于完成任务调度，该类和mongodb干系的几个紧张成员变量及接口如下表：

scheduler类紧张成员/接口功能备表明释mutable mutex mutex_;互斥锁，全局行列步队访问保护多线程从全局行列步队获取任务的时候加锁保护op_queue<operation> op_queue_;全局任务行列步队，全局任务和网络事宜干系任务都添加到该行列步队3.1.1中的5种类型的任务都入队到了该全局行列步队bool stopped_;线程是否可调度标识为true后，将不再处理epoll干系事宜，参考scheduler::do_run_oneevent wakeup_event_;唤醒等待锁得线程实际event由旗子暗记量封装task_operation task_operation_;分外的operation在链表中没进行一次epoll获取到IO任务加入全局行列步队后，都会紧接着添加一个分外operationreactor task_;也便是epoll_reactor借助epoll实现网络事宜异步处理atomic_count outstanding_work_;套接字描述符个数accept获取到的链接数fd个数+1(定时器fd)scheduler::run()循环处理epoll获取到的accept事宜信息循环调用scheduler::do_run_one()接口scheduler::do_dispatch()任务入队任务入队到全局行列步队op_queue_scheduler::do_wait_one()任务出队实行如果行列步队为空则获取epoll事宜集对应的网络IO任务放入全局op_queue_行列步队scheduler::restart()重新启用调度实际上便是修正stopped_标识为falsescheduler::stop_all_threads()停滞调度实际上便是修正stopped_标识为true

2.1.3 operation任务行列步队

从前面的剖析可以看出，一个任务对应一个operation类构造，asio异步实现中schduler调度的任务分为IO处理任务(accept处理、读io处理、写io处理、网络IO处理回调处理)和全局状态机任务，统共2种任务小类。

此外，asio还有一种分外的operation，该Operastion什么也不做，只是一个分外标记。
网络IO处理任务、状态机处理任务、分外任务这三类任务分别对应三个类构造，分别是：reactor_op、completion_handler、task_operation_，这三个类都会继续基类operation。

1. operation基类实现

operation基类实际上便是scheduler_operation类，通过typedef scheduler_operation operation指定，是其他三个任务的父类，其紧张实现接口如下：

operation类紧张成员/接口功能备表明释unsigned int task_result_Epoll_wait获取到的事宜位图信息记录到该构造中在descriptor_state::do_complete中取出位图上的事宜信息做底层IO读写处理func_type func_;须要实行的任务scheduler_operation::complete()实行func_()任务的内容在func()中运行

2. completion_handler状态机任务

当mongodb通过listener线程接管到一个新链接后，会天生一个状态机调度任务，然后入队到全局行列步队op_queue_，worker线程从全局行列步队获取到该任务后调度实行，从而进入状态机调度流程，在该流程中会触发epoll干系得网络IO注册及异步IO处理。
一个全局状态机任务对应一个completion_handler类，该类紧张成员及接口解释如下表所示：

completion_handler类紧张成员/接口功能备表明释Handler handler_;全局状态机任务函数这个handler就相称于一个任务，实际上是一个函数completion_handler(Handler& h)布局初始化启用该任务，等待调度completion_handler::do_complete()实行handler_回调任务的内容在handler_()中运行

completion_handler状态机任务类实现过程比较大略，便是初始化和运行两个接口。
全局任务入队的时候有两种办法，一种是io_context::dispatch办法，另一种是io_context::post。
从前面章节对这两个接口的代码剖析可以看出，任务直接入队到全局行列步队op_queue_中，然后事情线程通过scheduler::do_wait_one从行列步队获取该任务实行。

把稳：状态机任务入队由Listener线程(新链接到来的初始状态机任务)和事情线程(状态转换任务)共同完成，任务出队调度实行由mongodb事情线程实行，状态机详细任务内容在后面《状态机实现》章节实现。

3. 网络IO事宜处理任务

网络IO事宜对应的Opration任务终极由reactor_op类实现，该类紧张成员及接口如下：

reactor_op类紧张成员/接口功能备表明释asio::error_code ec_;全局状态机任务函数这个handler就相称于一个任务，实际上是一个函数std::size_t bytes_transferred_;读取或者发送的数据字节数Epoll_wait返回后获取到对应的读写事宜，然后进行数据分发操作enum status;底层数据读写状态标识读写数据的状态perform_func_type perform_func_;底层IO操作的函数指针perform()中运行status perform()；运行perform_func_函数perform实际上便是数据读写的底层实现reactor_op(perform_func_type perform_func, func_type complete_func)类初始化这里有两个func: 1. 底层数据读写实现的接口，也便是perform_func 2. 读取或者发送一个完全mongodb报文的回调接口，也便是complete_func

从reactor_op类可以看出，该类的紧张两个函数成员：perform_func_和complete_func。
个中perform_func_函数紧张卖力异步网络IO底层处理，complete_func用于获取到一个新链接、吸收或者发送一个完全mongodb报文后的后续回调处理逻辑。

perform_func_详细功能包含如下三种如下：

通过epoll事宜集处理底层accept获取新连接fd。
fd上的数据异步吸收fd上的数据异步发送

针对上面的三个网络IO处理功能，ASIO在实现的时候，分别通过三个不同的类(reactive_socket_accept_op_base、reactive_socket_recv_op_base、reactive_socket_send_op_base)实现，这三个类都继续父类reactor_op。

这三个类的功能总结如下表所示：

类名功能解释reactive_socket_accept_op_base1. Accept()系统调用获取新fd 2. 获取到一个新fd后的mongodb层逻辑回调处理Accept()系统调用由perform_func()函数处理获取到新链接后的逻辑回调由complete_func实行reactive_socket_recv_op_base1. 读取一个完全mongodb报文读取 2. 读取完全报文后的mongodb做事层逻辑回调处理从一个链接上读取一个完全mongodb报文读取由perform_func()函数处理读取完全报文后的mongodb做事层逻辑回调处情由complete_func实行reactive_socket_send_op_base1. 发送一个完全的mongodb报文 2. 发送完一个完全mongodb报文后的mongodb做事层逻辑回调处理Accept()系统调用由perform_func()函数处理获取到新链接后的逻辑回调由complete_func实行

总结： asio在实现的时候，把accept处理、数据读、数据写分开处理，都继续自公共基类reactor_op，该类由两个操作组成：底层IO操作和回调处理。
个中，asio的底层IO操作终极由epoll_reactor类实现，回调操作终极由mongodb做事层指定，底层IO操作的回调映射表如下：

底层IO操作类型Mongodb做事层回调处释Accept(reactive_socket_accept_op_base)ServiceEntryPointImpl::startSession，回调中进入状态机任务流程Listener线程获取到一个新链接后mongodb的回调处理Recv(reactive_socket_recv_op_base)ServiceStateMachine::_sourceCallback，回调中进入状态机任务流程吸收一个完全mongodb报文的回调处理Send(reactive_socket_send_op_base)ServiceStateMachine::_sinkCallback，回调中进入状态机任务流程发送一个完全mongodb报文的回调处理

解释：网络IO事宜处理任务实际上在状态机任务内运行，也便是状态机任务中调用asio库进行底层IO事宜运行处理。

4. 分外任务task_operation

前面提到，ASIO库中还包含一种分外的task_operation任务，asio通过epoll_wait获取到一批IO事宜后，会添加到op_queue_全局行列步队，事情线程从行列步队取出任务有序实行。
每次通过epoll_wait获取到IO事宜信息后，除了添加这些读写事宜对应的底层IO处理任务到全局行列步队外，每次还会额外天生一个分外task_operation任务添加到行列步队中。

为何引入一个分外任务的Opration？

事情线程变量全局op_queue_行列步队取出任务实行，如果从行列步队头部取出的是分外Op操作，就会立马触发获取epoll网络事宜信息，避免底层网络IO任务永劫光不被处理引起的"饥饿"状态，担保状态机任务和底层IO任务都能”平衡”运行。

asio库底层处理实际上由epoll_reactor类实现，该类紧张卖力epoll干系异步IO实现处理，鉴于篇幅epoll reactor干系实现将在后续《mongodb内核源码实现及调优系列》干系章节详细剖析。

2.2 message_compressor网络传输数据压缩子模块

网络传输数据压缩子模块紧张用于减少网络带宽占用，通过CPU来换取IO花费，也便是以更多CPU花费来减少网络IO压力。

鉴于篇幅，该模块的详细源码实现过程将在《mongodb内核源码实现及调优系列》干系章节分享。

2.3 transport_layer套接字处理及传输层管理子模块

transport_layer套接字处理及传输层管理子模块功能紧张如下:

套接字干系初始化处理结合asio库实现异步accept处理不同线程模型管理及初始化