动静健康丨【新技术应用】余光雷——基于电子病历的冠心病亚型危险因素分层抽取-凯发k8国际首页

大健康事业部转载自中国数字医学 | 2022-05-14 16:24

基于电子病历的冠心病亚型危险因素分层抽取

余光雷 张琳琳 张颖 李昕遥 毕雪华

作者单位:830017 乌鲁木齐,新疆医科大学医学工程技术学院(余光雷、毕雪华);新疆大学信息科学与工程学院(张琳琳、李昕遥);新疆医科大学第一附属医院(张颖)

摘要

目的:分析电子病历中的患者特征,实现冠心病患者亚型下危险因素的分层抽取。

方法:提出改进的labeled lda模型,以多项分布生成冠心病亚型类别标签,然后从亚型类别标签生成危险因素分层这一隐含主题,构建冠心病亚型—患者—危险因素分层—患者特征的4层结构主题模型。该模型通过建立亚型类别标签与危险因素分层之间的映射关系,首先对冠心病亚型进行多分类预测,然后实现患者危险因素在不同亚型下的分层自动抽取。

结果:使用真实临床环境采集的电子病历数据进行验证,准确率达到了83.23%,macro-f1值达到了82.31%。

结论:实验结果表明,通过约束患者亚型类别与危险因素分层隐含主题之间的映射,改进的labele lda模型具有较高的模型可解释性,且准确率均高于逻辑回归、支持向量机、随机森林和lightgbm等4种对比模型。

关键词

labeled lda;分层抽取;危险因素;冠心病

基金项目

新疆维吾尔自治区自然科学基金项目(2019d01c205,2019d01c041)