中医证候研究的人工神经网络方法探析

时间
2008-12-09

中医药学理论体系的特点是基础理论和临床实践的密切结合,证候是联系两者的纽带,是将理论付诸实践的关键环节,证候研究是发展中医理论、提高临床疗效的有效途径和必由之路,也是制约中医发展的瓶颈。人工神经网络(Artificial Neural Network,ANN)是80年代中后期以来迅速发展起来的一门集计算机科学、信息科学、工程科学以及医学、生物、数学、物理等诸多学科为一体的边缘交叉学科,以其强大的非线性映射特性已逐渐成为人们研究非线性世界、探索某些复杂系统的有力工具,笔者尝试探讨将人工神经网络方法引入中医证候研究的可行性。1人工神经网络的原理及应用 人工神经网络模拟神经系统的生物实际(以解剖、生理、生化的研究成果为基础),建立近似于生物原型的信息处理数学模型,从而构成了一种新型的智能信息处理系统。该系统具有大规模的并行处理方式、良好的鲁捧容错性、独特的信息存储方式以及强大的自学习、自组织和自适应能力,这使得它在模式识别、控制优化、信息处理、故障诊断以及预测等方面应用广泛,其理论与技术方法在工程、医疗卫生等领域显示出巨大的吸引力,并具有广阔的应用前景。在医学领域中,已成功地应用于疾病预报、临床诊断分类、药物分析、中药质量的评价、医学信号处理、图像分析等各个方面。人工神经网络的原理是通过模拟生物的神经网络结构和功能,实现对各种信息的有效处理。它通常包含一个输入层、输出层以及一个或几个隐含层,它的基本组成单位为神经元,输入层接受外界信号,不对其进行加工和处理,直接将其引入神经网络;隐含层位于网络的输入层和输出层之问,可包括多层,对输入的信息进行处理并将其处理后的信息传给输出层(或下一个隐含层);输出层则输出经隐含层处理后的结果。人工神经网络的一个显著特征是它通过自动学习来解决问题,对样本的学习过程,即为对网络中的神经元问的联系强度(即权重系数)逐步确定的过程,通过对样本的学习,可以学会识别自变量与应变量问的复杂的非线性关系。经过充分学习后的神经网络获取了样本的特征规则。并将这些规则以数字的形式分布存贮在网络的连接权中,从而构成了系统的非线性映射模型。这样的网络不仅可以对其学习过的样本能够准确识别,而且对未经学习的样本也可以准确识别,它甚至可以充分逼近任意复杂的非线性映射关系。可见,人工神经网络不需要精确的数学模型,而是通过模拟人的联想推理和抽象思维能力,来解决传统自动化技术无法解决的许多复杂的、不确定性的、非线性的自动化问题。2中医证候体系的非线性特征“线性”和“非线性”是区别事物复杂性程度的标尺,在数学中,当两个变量(自变量和应变量)的关系成正比时就称为线性关系,否则就是非线性关系。在生命科学中,由上述概念推广而来的线性和非线性逻辑则更具实用意义,非线性逻辑表征事物各组分之间是相互作用的。而不是相互独立的、正则的、无限可微的和平滑的,即总体不等于部分之和,它是复杂系统的典型特征之一。人体是一个复杂的自适应系统,能够随内外环境变化而相应地调整内部运行机制,这种自适应性是生命得以繁衍生存的基本能力。当内外环境的变化超出机体的自适应能力时,机体就处于一种过度调整的病理状态,这种状态的总体概括就是证候。证候是机体在疾病发生发展过程中截取其某一个时间断面功能状态的综合反映,可分“证”和“候”两个方面,“证”是指对疾病所处的某一时点的病因、病机、病位、病性、病势的总体概括,反映该病理状态的实质;“候”是指这种病理状态表现在外的物理征象(症状、体征等)。人体是一个复杂系统,中医理论体系中以五脏为中心的功能结构系统也具有复杂系统的特征,属于复杂系统。复杂系统中一个典型的特性是整体涌现性,涌现性指在具有层级结构的复杂系统中,高层级系统质的某些功能特性是由低层级系统因子的相互作用激发、提升而“涌现”出来的,这些较高层级的功能特性在还原为低层级时已不复存在,这种现象称为“涌现现象”。五脏功能系统中各系统的功能是分子、细胞、器官、组织等各层级结构逐级涌现的结果,在涌现的过程中,既有各种各样的空间分布形式,又有瞬息万变的时间存在方式,当用先进的科学手段逐级还原直至基因、蛋白质水平等较为低级的结构以探索五脏的实质时,各层级结构通过复杂的时空联结方式逐级涌现形成的基本生命机制已荡然无存。中医理论框架中的证候体系也同样具有涌现特性,那些可观测的物理表象所表达的就是人体各层级结构的功能失调逐级涌现的结果。任何一个低层级的结构或功能失调,均可通过“涌现”形成高一级的结构或功能失调,直至上升为整体层次的可被观测的功能失序状态,表现出各种外在的候。在这里,通过涌现形成的证候系统具有典型的时空结构特征,当用各种先进的还原方法探寻其实质时,证候的时空结构早已被破坏,本质特征当然也随之消失殆尽,这也许就是目前证候实质研究陷入困境的根源所在。可见,证候很好地把握了人体复杂系统在疾病发展的各个时点的涌现特性,证与候的关系是“以候为证”.证决定候,候表征证。证是实质,候是表象。实质与表象之间存在各层级涌现现象,因此,证候是非线性的复杂系统。同时,由于机体的病理状态会随自身抗病能力的调整、病程进展和药物干预的影响而发生不断的变化,所以,同一种疾病在不同时间断面上会表现出不同的证候,而不同的疾病在某一个时间断面上有时也可以呈现出相同的证候。另外,医者通过不同的角度、方法、环境进行观察时,证候也常呈现给观察者以不同的界面,从而表现出不同的证候。再者,每个个体的体质、性情、人格特征、生活习惯和生存环境以及医生的经验、直觉、感悟等不确定性因素也是导致证候多样性的重要原因。这表明证候是动态的、多变的、复杂的。辨证实际上就是通过观察外在的候来确定机体内在的证(病机状态)的过程,因此,中医证候诊断系统是一个非线性的、多维多阶的、可以无限组合的复杂巨系统。3人工神经网络用于证候研究的可行性 证候的非线性、复杂性特征为证候的规范化研究及证候实质的研究增加了相当大的难度,甚至目前还不能利用还原分析的方法揭示证候的本质特征,对其进行数学建模更是难以实现。那么,是否可以设想建立一种模型。在不必知道内部结构的情况下能够充分模拟证与候的非线性映射关系。基于黑箱结构的人工神经网络有可能可以实现这种设想,利用网络的自动学习能力,在充分辨识表现于外的“候”的表征信息的基础上,自动抽提出这些信息蕴含的内在规律,并将其分布在网络的联接权中,从而建立“候”与“证”的非线性映射函数。在这里,样本(证候)被概括为一对输入与输出的抽象的数学映射关系,“候”(各种物理表征信息)为输入单元,“证”为最终的输出结果。医学诊断的过程被看作一个映射问题.通过症状找出对应的证候诊断,神经网络把“候”与“证”的对应关系通过输入与输出的映射转化成了,一个非线性优化问题。虽然不清楚网络模型的内部结构,但这种模型却可以充分逼近证与候的非线性映射关系,近似真实地反映证候的全貌,是在不打开黑箱的前提下,建立证候模型、反映证候的内在规律和特征的有效方法。尽管证候的规范化研究开展了大量的基本证型规范、复合证型规范和病证结合的证型规范等研究.然而,令人困惑的是经过定性或定量化规范后的一系列证候诊断标准在学术界并未达成共识,长期以来病证同称、证症不分、证型繁杂、标准不一的混乱状况依然存在。困惑的关键症结就在于目前实施规范的技术方法很难全面反映证候系统的真实面貌,如此规范后的标准当然也就难以被广泛执行。一般认为。在科学领域中存在这样一个认知规律:规则可以通过归纳产生,当用充分的样本集表达时,可产生充分正确的规则。中医证候的诊断规律蕴含在足够多的样本集合中,利用神经网络的自主学习能力从大量的样本中进行证候特征的规则提取,则能够抽提出比较全面的内在规律;同时,网络的自组织、自适应能力又能加强对边缘相似病例的辨识能力,这样的证候诊断模型必将更加逼近证候的真实面貌,对今后证候规范化的研究不啻为一种可行的方法。当然,用人工神经网络建立的证候模型是否具有强大的推广能力,取决于训练样本的含量以及样本所含信息的全面程度。因此,必须保证训练样本的含量足够大、样本所蕴含的证候诊断信息足够全面,这样才能尽量真实地展示证候全貌。综上,证候研究可以尝试用大量的临床观察病例作为研究数据.采用人工神经网络技术,通过网络的训练和学习,从样本中自动获取规则,建立证候的网络模型,并将这种模型用于对新病例的判别,成为“辨证智能专家”。4基于神经网络的证候研究方法 人工神经网络的类型多种多样,从功能特性和学习能力来分,典型的神经网络模型主要包括感知器、线性神经网络、多层前向神经网络、自组织映射网络和反馈神经网络等…。笔者认为,比较适合应用于中医证候诊断的是BP神经网络以及在此基础上发展起来的模糊神经网络。BP神经网络的应用 BP神经网络(Back-Propa-gation Network)是指基于误差反向传播算法(BP算法)的多层前向神经网络。是目前应用最为广泛的神经网络学习算法。BP网络神经元采用的传递函数通常是非线性Sigmoid型可微函数,因此可以实现输入和输出间的任意非线性映射,由于误差反向传播网络及其算法增加了中间隐含层并且有相应的学习规则可循,使其对非线性模式具有较强的识别能力。网络除输入输出节点外,有一层或多层的隐含层节点。同层节点之间无连接,每层节点的输出只对下一层节点的输出有影响。网络的训练过程,就是不断将计算输出与期望输出值的误差反传给网络,从而调整输出层与隐含层及隐含层与输入层间的权重大小,直至计算输出与期望输出值的误差最小为止。该算法中的每一个训练样本在网络中都经过两遍传递计算:一遍向前传播计算,从输入层开始传递到各层,经过处理后产生一个输出,并得到一个实际输出和所需输出之间的差错向量:一遍反向传播计算,从输出层到输入层,使用误差梯度下降法,修改各层神经元的联接权值,最终使误差达到期望目标。但经典的BP学习算法还存在一些缺点,比如收敛速度比较慢,在有限的时问内难以达到预定的目标,以及完成训练的网络的推广能力不强、局部极小问题等。针对上述缺陷,可以对网络进行必要的改进。如通常采用一些全局最优化算法与之相结合的方法,使实际的输出更加精确。模糊神经网络的应用 与神经网络模拟人脑的结构以及对信息的记忆和处理功能、擅长从输入输出数据中学习有用的知识不同,模糊控制则是模拟人的思维和语言中对模糊信息的表达和处理方式,擅长利用和表达人的经验知识,可以处理带模糊性的信息。模糊控制技术以模糊逻辑为基础,模仿人的模糊综合判断推理能力,来处理常规方法难以解决的模糊信息处理问题。中医证候系统具有非线性复杂性特征,可以利用人工神经网络,在不了解其黑箱结构的前提下,通过对证候各组成要素内在规律的自动提取,建立输入与输出的非线性映射关系,从而建立证候的神经网络模型。但中医证候学的物理表征信息(症状、体征等)通过医生的望、闻、问、切而获得,属于经验性知识,具有典型的模糊性、不确定性特征,更适合于利用模糊系统来表达,但是模糊系统的规则集和隶属函数等设计参数却只能靠经验来选择,很难自动设计和调整,这是模糊系统的缺点。若用神经网络来构造模糊系统,就可以利用神经网络的学习方法,根据输入输出样本来自动设计和调整模糊系统的设计参数,实现模糊系统的自学习和自适应功能。这种模糊神经网络集中了模糊控制技术和人工神经网络的双重优点,扩大了系统处理信息的范围,是当今智能控制领域的研究热点,也更适合用于中医证候的研究。在这里,模糊系统和神经网络的连接可以采用串联型和网络学习型两种结构结合在一起的形式,先用神经网络对训练样本证候的物理表征信息进行充分学习,得到它们对证候诊断的隶属函数,构造模糊系统,并将这个系统与神经网络相连,从而建立证候的模糊神经网络模型。实现证候的智能化诊断。目前,我们正在进行的基于模糊神经网络的糖尿病肾病中医证候规范研究,其方法就是利用模糊多层感知器网络(FMLP),构建糖尿病肾病中医证候的模糊神经网络模型。我们并同时利用基于BP算法的多层前馈神经网络(BP),以相同的观察资料为研究对象,构建糖尿病肾病中医证候的BP神经网络模型,从解决实际问题的能力比较两种模型的性能,以确立较优糖尿病肾病中医证候神经网络模型。样本集采用国家中医药管理局课题“中医药治疗糖尿病肾病临床疗效评价信息处理研究”所获得的一组糖尿病肾病临床病例资料,先对样本所涉及的所有症状和体征(症、舌、脉等)进行模糊聚类分析,初步获得基本证型,从上述证型中取2/3样本并配以相同样本数的正常样本作为训练样本集,剩余1/3配以相同样本数的正常样本作为测试样本集。依据基本证型所涵盖的症状设定输入节点数目,依据基本证型确立输出节点数目,首先根据各个输入节点的模糊隶属度函数(通过神经网络学习而获得)对输入信息进行模糊化处理.建立模糊系统。并将这个系统与BP网络相连,针对输入信息所具有的特点,选取相应的函数作为教师,来指导神经网络对训练样本利用梯度下降法进行训练,利用网络的自学习能力不断调整网络的联接权值,直至网络的模糊隶属度函数趋稳,结束训练,即建立了糖尿病肾病证候的模糊神经网络模型,用训练好的模糊神经网络对测试样本集进行检验,得出输出向量值,并与期望输出结果相比较,以判断网络模型的综合性能。目前这项工作正在进行中,预试验结果令人满意。在现阶段证候诊断标准没有规范化以前,这种集模糊系统和神经网络于一身的模糊神经网络技术,能更有效地表达和处理中医领域专家的非确定性、模糊性经验知识,很可能将为今后中医证候规范化的研究提供可行性方法。5结语 一门学科只有不断地吸纳先进的思想与技术,在继承的基础上发展创新,才能真正具有生命力,中医现代化研究,呼唤多种边缘学科、交叉学科理论和技术方法的介入,理论上的探讨和不断切实可行的实践探索并行,才能使中医证候研究从量的积累上升到质的飞跃。当然,人工神经网络的知识处理能力还需进一步提高,还需围绕如何提高学习能力、收敛速度、可塑性以及普化能力等方面展开深入研究。但是,目前在中医理论指导下,采用神经网络技术建立中医证候神经网络模型,对中医证候的系统化和规范化研究不啻是一种可行的方法。随着研究工作的进一步发展,我们相信一定会有更多、更好的神经网络用于证候系统的诊断研究,使中医证候的诊断技术更能提高一步。摘自:《中医药学刊》文/白云静 申洪波 之道:孟庆刚