糖尿病患者用药分析模型
发布日期: 2016/06/23 浏览次数:
-
业务背景及目标
在现代社会中,随着居民生活水平的提高,糖尿病已成为严重威胁人类生命健康的重要疾病之一,据统计糖尿病人群中80%的患者属于2型糖尿病。对于2型糖尿病患者的诊疗,通用的治疗方案已经很多,拟从临床数据中挖掘出有价值的群体化质量方案是本文要解决的问题。
本文主要以临床2型唐脑病患者的住院诊疗数据为基础,以2型糖尿病的治疗指南为依据,通过一定的数据挖掘技术,尝试能找到不同特征的群体,研究其药物治疗情况,希望能在不同特征的新的2型糖尿病患者群的药物治疗上提供参考。
模型介绍
基本方法
聚类分析是无监督的学习过程,依据数据之间的相似度进行分类,要求不同类之间的对象差别较大,同一类别的对象之间具有较高的相似度。经典常用的聚类算法是K-means算法,它是数据点到原型的某种距离作为优化的目标函数,利用函数求极值的方法得到迭代运算的调整规则。该算法对原始数据的正态分布要求不高,对样本容量的要求也没有严格的标准,本次数据样本比较适合采用此算法。
关联规则算法作为一种发现事物之间的潜在联系的算法,被广泛应用到各类商业场景中用于发现消费习惯、产品推荐等,其中,Apriori算法作为其中最有影响力的算法之一,有着算法简单明了、易于实现落地等优点,其核心思想是通过迭代循环,仅保留满足制定最小支持度与置信度的频繁项集。
-
简要步骤
-
-
-
-
-
-