> 职称论文 > 2500字职称论文数据挖掘技术在医学研究中的应用

2500字职称论文数据挖掘技术在医学研究中的应用

论文类型:职称论文
论文字数:2500字
论点:诊断,训练,属性
论文概述:

随着电子信息技术的发展,人们对医学数据挖掘常用的用于分类和预测的智能化方法有粗糙集理论、决策树、人工神经网络等。 本文就数据挖掘技术如神经网络、决策树以及粗糙集理论等几种

论文正文:

1人工神经网络在医学研究中的应用

人工神经网络已广泛应用于各个领域,并已成功应用于航空航天、智能识别、地震预测等诸多领域。人工神经网络在医学领域已经应用了30多年,但仅在最近10年才得到快速发展。目前,国内外对人工神经网络在临床工作中的应用进行了大量的研究。人工神经网络在疾病诊断中具有很高的实用价值。早在1991年,Baxt工作组就将人工神经网络应用于心肌梗死的诊断。经适当训练的人工神经网络诊断心肌梗死的敏感性和特异性分别为97.2%和97.5%,明显高于临床医生(77.7%和84.7%)。El solhoa等人将人工神经网络应用于活动性肺结核的诊断。结果:训练集中人工神经网络对肺结核正确诊断的敏感性和特异性分别为100%和72%。医生的敏感性和特异性分别为47%和75%。人工神经网络在测试集中的灵敏度和特异性分别为100%和69%。医生的敏感性和特异性分别为64%和79%。显然,人工神经网络诊断活动性肺结核的能力高于医生的临床评价。测试结果还表明,人工神经网络可以很好地推广到新患者的诊断中。此外,人工神经网络在临床诊断中具有较高的灵敏度和特异性。Tourassi GD等人将人工神经网络应用于肺栓塞的诊断。从PIOPED研究数据中随机选取1064例临床资料(肺栓塞387例,非肺栓塞681例)进行人工神经网络训练和测试,并将人工神经网络的诊断结果与医生的诊断结果进行比较。结果表明,人工神经网络诊断的准确性高于内科医生。同时,还指出,用于训练的训练集越多,网络的诊断能力越强,准确率越高。应用
BP人工神经网络对网络进行训练,利用424例患者的一般情况、危险因素、症状、体征等7类59项数据构建帕金森病诊断模型。模型诊断出113名患者(包括33名帕金森病患者)。结果表明,人工神经网络具有良好的诊断价值,漏诊率为8.3%,误诊率为6.4%,准确率为92.9%。
通过对1,200例患者的培训,在培训期间使用了300例进行测试,模拟了167例进行诊断,并与实际结果进行了比较。网络诊断的准确率、灵敏度和特异性分别为91.02%、92.79%和87.5%。巫勇军等人将12项血清学指标应用于BP网络肺癌诊断的研究。数据组成为50例肺癌患者、40例良性肺部疾病(如肺结核、支气管炎等)患者的癌胚抗原、CA125、神经元特异性烯醇化酶等12项血清学指标。)和50个正常人。其中,随机抽取100名患者进行网络培训,其余30名患者用于检测。研究结果表明,人工神经网络对肺癌的识别率和预测率分别为100%,能够同时区分正常、良性疾病或肺癌。
目前,人工神经网络已用于多种疾病的诊断,包括帕金森病、阿尔茨海默病、癫痫、孤立性肺结节的鉴别诊断、肌肉萎缩、膀胱出口梗阻、尿路结石、肺栓塞等。

2决策树在医学研究中的应用

决策树是一种通过树突显示数据并受各种变量影响的分析和预测模型。它是一种基于对目标变量不同影响的分类规则,也是一种基于信息论的数据分类方法。此外,它首先通过一批已知的训练数据构建决策树,然后使用构建的决策树来预测数据。决策树的建立过程就是生成数据规则的过程,因此该方法实现了数据规则的可视化,其输出结果易于理解,具有较好的准确性和效率,因此被广泛应用。为满足数据挖掘的样本量要求,采用引导带方法对
406个样本进行扩展,并采用基于信息熵的决策树C4.5算法建立中医辨证模型。通过决策树C4.5算法,筛选出对辨证分型有重要意义的26个因素,按其重要性进行排序,生成清晰易懂的可用于分类的决策规则,建立辨证模型。模型的分类符合率为:训练集83.6%,验证集80.67%,测试集81.25%;该模型用于区分各种类型综合征的敏感性和特异性也很高。认为决策树C4.5算法建立的模型效果良好,可用于慢性胃炎中医证候的鉴别诊断。

3粗糙集数据挖掘技术在医学研究中的应用

粗糙集理论可以有效地分析和处理各种不完整的信息,如不精确、不一致和不完整的信息,从中发现隐藏的知识并揭示潜在的规律。近年来,它得到了迅速发展和完善。粗糙集理论的出发点是根据给定问题的现有知识划分给定问题的领域,然后在划分后确定每个组件对某个概念的支持程度:绝对支持这个概念,绝对不支持这个概念,可能支持这个概念。在粗糙集理论中,上述三种情况分别用三个近似集表示为正域、负域和边界。在粗糙集理论中,决策表被用来描述宇宙中的物体。这是一个二维表,每行描述一个对象,每列描述一个对象的属性。属性分为条件属性和决策属性。根据不同的条件属性,宇宙中的对象被划分为具有不同决策属性的决策类。对于分类,并非所有条件属性都是必要的,有些是多余的。删除这些属性不会影响原始分类效果。
粗糙集理论用于中医类风湿综合征的诊断。共收集到224个病例,每个病例有81个属性。从224例病例中随机抽取180个学习样本,预测和诊断44例。他们利用属性约简,得出寒湿阻络、湿热阻络、痰阻络、气阴两虚、寒热混杂五种证候的一定规律和可能规律。在44例预测诊断中,诊断准确率达到90%以上,高于传统的模糊数学方法。粗糙集理论被认为是中医诊断研究的动态理想工具。肺良恶性肿瘤的诊断是临床医学中一个非常重要的问题。
有许多常规检查方法可用于此类诊断,如胸部x光透视、计算机断层扫描、支气管镜检查等。然而,这些测试特征的灵敏度和鉴别不明显,并且基于通过上述测试方法获得的数据很难诊断肿瘤是良性的还是恶性的。目前,挖掘技术已经在世界范围内应用于肺癌的诊断,学者们在这方面做了大量的研究。根据上述常规试验,选择年龄、CT图像中肿瘤最大半径、肿瘤位置、钙化程度等18项医学检查指标作为特征值。利用这些特征值训练基于粗糙集理论的自主判别算法模型,然后利用特征值不完全的新记录进行测试。诊断精度非常高。
综上所述,数据挖掘技术在许多疾病的诊断中发挥了积极作用,并取得了一定的成果。

参考资料:
[1]http://sblunwen.com/lcyx/:人工神经网络在心肌梗死诊断中的应用[J]。安·实习生医学,1991,115 (11):
843-848。
[2]埃尔·索亚,肖克·布,古德诺,等.利用人工神经网络预测活动性肺结核[[]。胸部,1999,116(4):968-973。
[3]图拉西岛、弗洛伊德岛、索斯特曼岛、埃塔1号。引用该论文[。放射学,1993,189 (2): 555-558。
[4]张王充,高国栋,陈红。等人人工神经网络在帕金森病诊断中的应用研究[。中国临床康复,2003,7 (28): 3818-3819。[/BR/] [5]赵炳郎,胡蓓蕾,秦琴,等.人工神经网络在冠心病诊断中的作用[.天津医药,2002,30 (9): 575-576