糖尿病患者用药分析模型
发布日期: 2016/06/23 浏览次数:
  1. 业务背景及目标

          在现代社会中,随着居民生活水平的提高,糖尿病已成为严重威胁人类生命健康的重要疾病之一,据统计糖尿病人群中80%的患者属于2型糖尿病。对于2型糖尿病患者的诊疗,通用的治疗方案已经很多,拟从临床数据中挖掘出有价值的群体化质量方案是本文要解决的问题。
         本文主要以临床2型唐脑病患者的住院诊疗数据为基础,以2型糖尿病的治疗指南为依据,通过一定的数据挖掘技术,尝试能找到不同特征的群体,研究其药物治疗情况,希望能在不同特征的新的2型糖尿病患者群的药物治疗上提供参考。

     

    模型介绍

     
     

    基本方法

     

      聚类分析是无监督的学习过程,依据数据之间的相似度进行分类,要求不同类之间的对象差别较大,同一类别的对象之间具有较高的相似度。经典常用的聚类算法是K-means算法,它是数据点到原型的某种距离作为优化的目标函数,利用函数求极值的方法得到迭代运算的调整规则。该算法对原始数据的正态分布要求不高,对样本容量的要求也没有严格的标准,本次数据样本比较适合采用此算法。
     关联规则算法作为一种发现事物之间的潜在联系的算法,被广泛应用到各类商业场景中用于发现消费习惯、产品推荐等,其中,Apriori算法作为其中最有影响力的算法之一,有着算法简单明了、易于实现落地等优点,其核心思想是通过迭代循环,仅保留满足制定最小支持度与置信度的频繁项集。

 

  1.  

    简要步骤

     
     
        数据处理:噪声平滑、缺失值处理、脏数据清洗。
  2.  
        数据集成:实体识别、冗余剔除。
  3.  
        数据变化:即对属性值量纲的归一化处理,本文对进入模型的各个属性采取Z-score标准化方式进行规格化。
  4.  
        2型糖尿病常用降糖药物识别。
  5.  
        指标概要分析与选取:依据临床知识和数据特征,选定肥胖程度、血脂、血压等指标。
  6.  
        k-means分群:根据选取的10个指标z标准后的值对2型糖尿病患者进行聚类分析,得到在血脂血糖指标和用药方案上差异明显的几个群体。
  7.  
        Apriori治疗方案分析:根据上述分群过程,通过Apriori算法提取各个群体的常用诊疗方案,有效从大量病例中得到医生的临床治疗意见。



 

 

(京)网药械信息备字(2022)第00006号

京公网安备 11010802038577号

京ICP备14036407号-2