ML紧张分为监督学习、无监督学习、半监督学习和强化学习等种别[3],包括支持向量机(SVM)、K隔壁(KNN)算法、决策树(DT)、随机森林(RF)、AdaBoost、K-means聚类、卷积神经网络(CNN)、人工神经网络(ANN)等算法。而深度学习(DL)是基于ANN算法在机器学习领域中的一种分支,二者都是实现AI的详细方法,也是AI和数据科学的核心。
中医药药性理论、配伍理论等是传统中医临床履历的高度概括和总结,蕴含着弘大且繁芜的知识系统。同样,中药物质根本的繁芜性也对中医药当代化研究带来了巨大寻衅。虽然当代实验方法对中医药研究有一定实用性,从化学身分研究到药效评价及药理浸染机制研究取得了巨大造诣,但是在深入研究中医药配伍等繁芜知识体系方面,传统实验方法彷佛很难得到打破性成果。随着中医药领域数据化的不断完善,ML这种处理大型、繁芜和不同数据的能力正是中医药当代化研究所须要的[4]。
Zhao等[5]构建多图卷积网络(MGCN)的处方推举模型,仿照了中医诊治中方-症之间的“多元”(n-ary)关系,显著提高了中药处方预测的准确性,具有很大的实用代价。Wang等[6]建立症-病-药的三者联合剖析的非对称概率模型,以创造和供应中医的潜在知识。舒琛洁等[7]构建了“气虚”证候要素-症状数据,以受试者事情曲线(ROC)曲线下面积等作为评价指标,比拟了分类回归树、RF、KNN、反向传播神经网络和SVM共5种ML算法模型,优选RF最适于构建“气虚”赞助诊断模型的算法,为证候要素赞助诊断供应方法学根本。

以上可得,ML在明确中医方-证关联、中药质量标准掌握、精准医疗等领域具有很强的辅导浸染[8-9]。本文就ML在中医药根本理论研究中的运用进行综述,以期为中医药研究及中医药当代化的客不雅观性、科学性供应一定的依据。
1 ML在中医药研究中的一样平常流程运用在中医药研究的ML紧张采取监督学习方法,即通过对带有标签的数据集进行演习,学习输入和输出之间的关联模式,进行预测或分类,紧张包括以下关键步骤[10-11]。(1)建立纳排标准进行数据网络(资料来源于中医药数据库、专家辨证、临床中医病案、教材等)和数据预处理;(2)特色选择和编码:选择最干系的特色,将数据转换成ML可以处理的形式;(3)模型的构建、演习与评估:选择适宜任务的ML算法(SVM、KNN、RF、BP神经网络等),利用ROC曲线下面积、准确率等指标进行评估;(4)预测与模型优化:将演习好的模型用于新数据的预测,不断迭代,优化模型性能。
2 ML在中医药根本理论研究中的运用2.1 ML运用于中药药性理论研究中药具有四气五味、升降浮沉和归经等特性,一样平常因此复方形式利用发挥治疗效果。中药药性理论在辅导临床遣方用药方面具有主要代价,中药药性与临床药效的发挥关系密切,存在干系性。然而中药药性紧张是根据药物浸染于机体后患者的觉得,干系表述抽象、模糊,难以量化表示。如关联规则挖掘、SVM、KNN、马尔可夫决策过程(MDP)、概率神经网络(PNN)等在该领域运用广泛。
王伟斌等[12]利用古今医案云平台对《医案类聚》中364条郁证医案的439条处方进行频次统计、聚类剖析、关联剖析、繁芜网络剖析创造治疗郁证以药性温、平、微寒中药为主,温性最高;以苦味、辛味为主,以苦味药物频次最高;多归于脾、肺、心经,以归脾经最高,为郁证的临床治疗供应一定的参考。张喜科等[13]构建XGBoost模型对61味中药在无水乙醇、蒸馏水、氯仿、石油醚4种溶剂下的中药紫外光谱数据进行寒热药性识别,通过稳定性评价和外推评价等办法评价模型的性能,为中药寒热药性识别研究供应了一种新的思路和方法。
邓乐等[14]探索了一种基于多层前馈神经网络的药向量演习模型,利用中药学教材中整理得到的474味中药的药性数据对模型进行初始化,利用干系药物对应的功效-药性数据进行演习,得到能够更好反响中药属性的BP药向量,并且药相量在欧几里得间隔方面能够表示中药功效差异。刘莉萍等[15]环绕办理中药药性和药效关联的问题,在经典关联分类算法的根本上通过垂直数据格式对其进行改进,选取补虚药和清热药2类功效药物为代表构建数据集,证明了改进关联分类算法在规则天生韶光、有效性及准确率方面具有明显提升,提高了算法的鲁棒性。
随着当代中药提取技能的不断发展,人们越来越多的关注和探索中药身分或组分的药性属性,中药药性与其物质根本的关系也成为药性理论创新发展的主冲要破点。利用当代算法技能可以对海量身分构造特色信息进行特异性提取,贾荣浩等[16]环绕中药化合物药性识别问题,基于中药化合物的构造决定其药性的假说,构建了一种基于K-隔壁算法(KNN)的中药化合物寒热平药性预测模型,通过提取2 012个中药化合物的构造特色,利用KNN度量中药化合物的相似性,构建药性预测模型,并利用交叉验证的办法验证了中药化合物药性预测模型的有效性。
张冰冰等[17]利用中医药综合数据库(TCMID,http://www.megabionet.org/tcmid/)、中医药数据库(ETCM,http://www.tcmip.cn/ETCM/index.php/Home/Index/index.html)网络646味中药,10 053个化合物身分,运用图卷积神经网络实现了中药化合物分子的寒热属性预测,并通过细胞增殖-毒性测尝尝验检测梯度加权得分的寒性中药身分对大鼠肾上腺髓质嗜铬瘤(PC-12)细胞氧糖剥夺再贯注(OGD/R)模型的保护浸染,为进一步探究中药“性-构”关系供应算法支持。ML算法技能在中药药性研究方面的运用不仅有利于中药药性理论的量化,还对拓展现代组分中药药性理论具有主要代价,更好地促进中医药传承创新发展。
2.2 ML运用于方剂配伍理论研究中药方剂是中医临床用药的基本形式,方剂配伍规律的剖析与挖掘是中医药研究的主要课题,是中医药传承创新的主要抓手之一。方剂资源紧张涉及历代医家临床经典方剂的积累与总结,紧张涉及方剂组成、治法治则、主治病症及其证候特色、各药味间的配伍关系等内容。方剂配伍规律紧张包括方剂相似性比较、治疗某一特定病症药物的配伍规律等,明确方剂配伍规律对临床遣方用药具有主要辅导代价。中药及其复方功效的相似性是中医药的明显特色之一,针对同一病症的治疗每每存在多个构成和功效相似的中药复方,通过对复方中药相似性比较,可以更好地创造中药处方的共性特色,在辅导临床灵巧用药和创新中药研发方面具有主要意义。
郭文龙等[18]通过对7 710首不同类型方剂的整理,基于统计学方法事理,运用TF-IDF(term frequence-inverse document frequence)算法构建了中药方剂数据挖掘系统,可直不雅观展示方剂之间的相似度,并且创造相似度高的方剂在功能主治方面具有相似性,实现了相似度和方剂信息、方剂与药物间的关联关系等信息可视化展示。
针对特定疾病的处方用药规律剖析有利于创造优效处方,王慧敏等[19]以治疗失落眠的处方为例,利用层聚类剖析方法对《方剂大辞典》中治疗失落眠的处方进行了探索性剖析,针对干系单味药的药性理论信息,通过单连接、全连接和均匀连接3种判断相似度的度量办法评估簇间相似性,创造基于全连接的层次聚类分组符合中医理论,相对较为合理。方剂配伍规律剖析多依托《方剂大辞典》等,以及名家医话医案等为数据来源,通过爬虫框架以及手工录入等办法获取一定数量的经典方剂,利用贝叶斯、TF-IDF、K均值聚类、层聚类、Louvain,搜索(Tabu)平分类算法等进行方剂配伍用药规律的挖掘[20],对中医药传承创新发展具有主要参考代价。
2.3 ML运用于中医毒性理论研究中医药历来重视临床用药的安全性,在临床实践过程中逐渐发展并完善了中药的大毒、有毒、小毒毒性分级理论,配伍禁忌、受孕禁忌、证候禁忌、饮食禁忌等用药禁忌理论,然而当代实验研究在中药安全性评估方面受到化学身分繁芜、物种差异等诸多成分的限定,难以知足临床需求。
基于打算机算法技能的虚拟预测评价技能越来越多地被开拓并运用于中药安全性预测,针对药物的不良反应预测,张文青等[21]基于模式识别分类事理,整合ANN和SVM算法进行预测模型的构建,利用数据库筛选得到的125个具有明确药源性肾炎的药物和122个未导致药源性肾炎的药物作为预测模型的演习集,同时各选择45种药物进行验证,终极运用于对10种中药的药源性肾炎进行评价,结果创造该方法的预测准确度可达90%以上。
此外,针对用药禁忌预测,姜皓等[22]环绕受孕期中药“禁忌慎”的判别,利用ANN、SVM、RF和朴素贝叶斯4种ML算法建立预测模型,用224种受孕禁忌分类明确的药物作为建模药物,对442种禁忌表述不明确的中药进行了预测,对辅导临床安全用药具有一定实用代价。
3 ML在中药学研究中的运用3.1 ML运用于中药药效研究传统中药的功效理论紧张是历代医家基于临床履历总结得到,当代研究多基于实验药理学方法,利用实验动物、细胞等实验模型评价中药及其复方的药理浸染,一方面只管通过高通量筛选等技能的不断开拓,对中药及其复方效应快速评价取得了很大进展,但是由于中药多身分、多靶点、多环节的浸染特点,每每会面临耗资大、耗时长等问题,并且受其“身分组合爆炸”的限定,使得一些研究的可行性存在很大问题。另一方面当代药理实验难以很好地兼顾与传统功效理论的干系性,基于实验药理学的方法已不敷以知足中药当代研究的需求。快速、高效地评估中药的化学身分与传统功效理论的干系性对中医药当代化发展具有主要代价,随着当代打算机算力及算法技能的不断开拓,基于虚拟算法技能预测中药及其复方药效已成为当前及未来中药及其复方研究的主要方向。
为解析中药化学身分与传统功效之间的关系,雷蕾等[23]提出“化学功效组学”的观点,以26个止血功效的中药和38个活血化瘀功效的中药为示范,通过网络化学身分并规范功效及药理浸染表述,利用KNIME 4.3.2软件CDK算法和RDKit算法包识别了止血和活血化瘀功效干系的身分Murcko骨架,结果分别创造了止血药和活血化瘀药功效代表性身分共性特色,如止血药核心身分紧张包含特有的萘醌、四环三萜等Murcko骨架,而活血化瘀药核心身分紧张为生物碱Murcko骨架,为中药化学身分的功效研究供应了一定借鉴。
孙飞等[24]采取偏最小二乘(PLS)算法对山楂炮制与否的化学身分与消食健脾功效的“谱-效”关系进行了较为系统的研究,通过对山楂和焦山楂不同提取部位分离制备并进行身分含量测定,在功效评价的根本上进行谱效关系研究,初步明确了山楂、焦山楂炮制前后的消食健脾功效身分变革,揭示了山楂炒焦炮制缓和药性,增强消食导滞浸染的炮制机制。Ouyang等[25]通过MBPLS建模来识别碳化蒲黄花粉(CTP)中对止血效果有贡献的关键化学身分类型,分别建立PLS和SVM模型,磋商关键化学身分与药效之间的“谱-效”关系,鉴定了CTP的潜在活性身分,并在体外进一步验证了其止血生物活性。
Kong等[26]利用相似性剖析(SA)和分层聚类剖析(HCA)评估UPLC指纹图谱,采取范例干系剖析(CCA)研究了UPLC指纹图谱与黄连抗菌活性之间的“谱-效”关系。Chen等[27]利用紫外-可见分光光谱法和UHPLC/Q-TOF-MS数据,通过PLS回归剖析来预测了熊果叶片的总酚含量和抗氧化能力。目前,CCA、PLS、灰度干系剖析(GCA)、SVM已被证明对付建立“谱-效”关系模型是可行的,为阐明中药药效物质根本供应方法。
3.2 ML与中药制药过程工艺优化在当代中药制药工业领域,常环绕中药材提取进行生产过程工艺参数进行优化设置,可以有效保障中药材的提取效率、批次同等性、药效及安全性等。均匀设计、正交实验设计等传统实验设计方法常用于进行工艺条件的摸索,然而存在可探索的成分水平有限、仅能产生局部最头等诸多不敷。通过数字建模剖析,人工神经网络等当代算法技能可对中药提取制备工艺过程中的多参数进行随机非线性优化,对促进当代中药制药工业智能化发展具有主要现实意义。
薛启隆等[28]提出了一种基于深度强化学习的中药制药工艺动态优化策略,紧张包含模型的离线演习和工艺的在线决策两部分,关于模型的准确性与泛用性紧张取决于数据集的规模与质量,其数据可来源于中药制药工艺知识库。通过迁移学习方法可快速完成模型的演习,在实际生产过程中不断地扩充知识库并且决策精度也会逐渐提高。仲怿等[29]以去壁灵芝孢子粉制药过程为例,将贝叶斯网络、卷积神经网络、帕累托多目标优化算法等前辈打算工具与精益六西格玛剖析工具相结合,提出了基于精益理念的中药制药工业数据挖掘及生产工艺持续改进策略,基于当代算法的中药制药工艺优化策略具有较高的工业运用代价,可为当代中药生产工艺的持续改进供应实用方法。
3.3 ML运用于中药饮片质量等级分类中药饮片质量对保障临床用药的有效性及安全性至关主要,传统的中药饮片质量掌握多依赖于履历,主不雅观性强,缺少客不雅观统一的标准。随着打算机和影像学技能的不断发展,图像识别技能在中药饮片识别和质量掌握方面得到很好的运用。有学者对不同实际运用处景下一百多种常用中药饮片进行了图像数据库的构建,在图像采集过程中通过人为增加不同光照强度、不同拍摄角度等繁芜背景成分以增强算法泛化能力,在此根本上利用YOLO模型进行特色提取、模型演习,结果创造该算法对小目标检测效果较好,通过特色金字塔网络思想的引入提高了模型的泛化能力。吴冲等[30]以山楂、半夏等饮片为代表,通过建立中药饮片图像数据库,以深度学习为手段对中药饮片外在性状特色进行智能剖析,建立深度卷积神经网络模型对中药饮片进行识别,为中药饮片质量的检测供应了技能支持。
4 ML在中医药临床用药规律挖掘研究中的运用针对特定医家或特定学术流派治疗特定疾病的用药规律剖析有利于履历的挖掘与传承,关联规则挖掘算法常用于中医药治疗疾病的组方配伍规律的研究,王利娟等[31]以清初以来16位孟河医派代表性医家的治疗头痛的医话医案为根本,利用Apriori关联规则算法其用药规律进行了挖掘,明确了孟河医家治疗头痛的用药规律。秘红英[32]利用贝叶斯分类算法对吴以岭教授346例治疗冠心病心绞痛的用药规律进行了挖掘,剖析了其证型、药物功效、用药频次、药性特色等,有利于名医大师学术思想及临证履历传承发扬。
此外,关联规则算法也常用于中西药联合用药的用药规律剖析,马雪骄等[33]以林洪生教授诊治肺癌的有效方剂为例,利用Apriori关联规则算法对其200个有效方剂进行了挖掘,创造肺癌分子靶向治疗过程中医药利用多以扶正固本为纲领,并加以祛邪之品以增强化学药疗效。
此外,当代AI算法技能也常用于中西药联合运用方案的优化,吴丽娜等[34]利用Apriori关联规则算法剖析了却肠恶性肿瘤患者的中西药联合运用特色,创造肿瘤化疗过程中中西药联合运用效果优于单独运用化学药,针对临床用药的优效方案评估预测。席俊羽等[35]进行了临床联合用药提高临床疗效预测的探索性研究,以生脉注射液治疗心肌梗去世为例,环绕心肌梗去世的病因、症状以及并发症等问题的联合用药情形,利用Louvain算法对1 208名心肌梗去世患者的用药信息数据进行繁芜网络剖析,创造生脉注射液联合其他中成药和化学药治疗心肌梗去世的用药规律,为临床中西药联合运用供应了一定支撑。
针对影响临床用药安全性条件的预测,蒋程等[36]以参麦注射剂药物不良反应为选题,通过剖析涌现与否药物不良反应患者的个体信息和临床用药信息,构建多变量数据矩阵建立偏最小二乘-判别剖析算法模型,评估了病史、药物过敏史、年事、溶媒等成分对参麦注射液不良反应发生的影响,对辅导临床安全用药具有主要意义。
临床用药规律剖析多环绕名家医话医案或特定医学流派履历等为数据来源,对特定疾病的用药履历获取一定数量的经典方剂及病症特色,利用关联规则(Apriori、FP-growth)、搜索(Tabu)、社区创造算法(Louvain)等进行临床用药规律的挖掘,对辅导临床用药、优化临床用药方案等具有较强的实用代价。
5 ML在中医药治疗事理及药效机制解析研究中的运用中医药在临床治疗疾病过程中形成了其独特的理论体系,包括药性理论、辨证论治、调和阴阳平衡等。然而由于在其理论形成及发展过程中受限于解剖、生理、病理等微不雅观认知,其治疗多是依据临床证候征象的调理,受限临床效应的当代分子机制及治疗事理难以有效阐释,极大地限定了中医药的创新发展。利用当代科学措辞对传统中医药治疗事理进行阐释可以更好地促进其与当代医学领悟发展,更好地促进当代医学发展。
针对中医药治疗事理,近日国内外学者联合研究宣布利用蛋白质网络拓扑临近关系解析中药与疾病症状的关联[37],对中药“辨证论治”治疗原则的当代科学内涵进行了探索性研究,首先确认了症状关联基因在人类蛋白质网络上具有形成显著的集聚模块的征象,在此根本上进一步创造具有特定疗效的中药针对的症状也存在普遍性的网络临近关系,终极提出人类蛋白质网络上的网络临近关系可以作为中药疗效预测的指标,该方法极大的丰富了中医药治疗事理解析的方法学策略。
针对中医药关键浸染环节及药效机制,以免疫浸润关键病理环节所介导的干系疾病剖析为例,王朴等[38]利用CIBERSORT反卷积算法对皮肌炎免疫浸润机制进行了剖析,首先对康健与皮肌炎患者的差异基因进行了剖析,并将差异基因与免疫浸润细胞进行Pearson干系性剖析,终极明确了皮肌炎发病过程中巨噬细胞以及CD8+ T细胞的特色性变革,创造关键基因靶点并对潜在的中药治疗效果进行了预测,对基于病理机制的中药治疗研究有一定参考代价。
刘洋等[39]针对环绕结直肠癌“炎癌转化”过程进行了研究,整合ML和神经网络模型的算法对公共数据库中正常结肠、炎症结肠(溃疡性结肠炎)以及肠癌干系疾病信息进行了关键基因的筛选及挖掘,通过构建蛋白质-蛋白质相互浸染(PPI)网络进一步筛选核心基因,利用梯度提升树、随机森林和决策树3种分类ML算法进行结局的预测学习,构建深度学习框架下的人工神经网络模型并验证,在此根本上创造具有潜在治疗浸染的中药。
中医药治疗事理及浸染机制解析研究多利用公共数据库,通过蛋白质网络拓扑临近关系解析、人工神经网络等策略,进行疾病关键病理环节识别、疾病早期诊断及潜在治疗药物创造等,对中医药传承创新发展具有主要代价。
6 结语与展望当前ML在中医药领域中的运用逐渐广泛,在安全性评价、中药质量评估、中药配伍预测、处方中药配比、医案数据处理等方面具有显著成果。传统ML方法因其小样本适应性、可阐明性已在方剂领域取得很多成果,而DL技能目前运用虽少,但其构造、学习办法适用于拟合中医辨证论治、组方配伍思想,近年来在中医面诊、中药鉴定等方面展开运用研究。传统的中医药研究方法并不智能,同时比较于ML方法效率偏低,ML模型与中医的交叉领悟为打破中医药当代化的发展瓶颈、探索中医药科技创新发展供应了可能。
与传统的中医药研究方法比较,基于ML的研究方法存在数据可靠性、模型选择以及可阐明性等问题。其一是深度学习方法须要大量的样本数据演习模型,目前通过古书、网络爬虫等方法网络的中医药样本数据质量并不能得到担保;其二是ML算法的适用性,明确算法事理,针对不同的中医药数据特色优选适用的算法。对付模型框架、模型中各种参数的选择须要根据特定中医药领域中的问题进行不断考试测验与改进,具有较大的事情量;其三是深度学习方法针对中医药问题构建的模型多为黑盒模型,模型的可阐明性较差。
随着大数据技能、AI技能在药物研究和创造中运用越来越广泛[40],传统ML方法已无法全面阐释中医药研究的全部规律。深度学习方法具有其强大的拟合能力、良好的泛化能力,是中医药当代化研究的一定趋势。其余,随着AI领域中大模型的不断发展,基于大模型的中医药研究也是未来的一大趋势。
来 源:王志杰,樊薛津,王豫骞,庄朋伟,赵婷婷.机器学习方法在中医药研究中的运用进展 [J]. 药物评价研究, 2024, 47(8): 1906-1913.