买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:吉林大学;长春通达数据技术有限责任公司
摘要:本发明提出了一种基于聚类分析算法的皮肤基底细胞癌细粒度分型方法,本发明将收集的多源、多模态、海量的皮肤基底细胞癌数据和kmeans聚类方法结合,通过迭代计算将数据划分为K个不重叠的聚类,为挖掘皮肤基底细胞癌细粒度分型提供了可行性方案。通过细粒度分型,医生可以更加精确地了解皮肤基底细胞癌患者的疾病状态,为皮肤基底细胞癌的精准医学提供重要支持,帮助医生选择更加适合患者的针对性的治疗方案,提高治疗效果并减少不必要的副作用,还有助于监测疾病的复发和转移情况,及时发现并采取相应的干预措施,为医学研究和临床实践提供新的工具和方法。
主权项:1.一种基于聚类分析算法的皮肤基底细胞癌细粒度分型方法,其特征在于,该方法的具体步骤如下:S1、构建皮肤基底细胞癌多模态规范数据集,并进行数据预处理;S1-1收集并整合来自不同医疗机构的皮肤基底细胞癌数据,仅保留确诊为皮肤基底细胞癌的病例数据,排除诊断不明确或有争议病例数据;所述的病例数据为多模态数据,包括病例文本数据和医疗图片数据;其中病例文本数据包含:①人口学信息,包含自然情况:患者基本信息、嗜好等;环境因素:患者生活环境、工作环境等;②临床病历资料,包含主诉:症状、病程等;病史:现病史、既往史、家族史等;生命体征:血压、心率、血氧、呼吸;体格检查:临床全面查体;实验室检查:血型、血常规、肿瘤标志物等;医疗图片数据包含:①临床图片,包含临床表现及分型等;②病理学图片,包含病理表现及分型等;③影像学图片,包含皮肤镜、皮肤CT、皮肤超声、皮肤OCT、皮肤RCM等;S1-2进行数据预处理和数据增强,确保数据的质量和一致性;对于病例文本数据,采用平均值填充和回归算法进行缺失值处理,并使用归一化方法进行特征缩放,确保特征具有相同的尺度;使用空间变换算法进行图像数据增强,图像通过旋转、水平翻转和剪切变换进行变换;S2、采用k-means算法挖掘皮肤基底细胞癌细粒度分型,并进行准确性验证;S2-1依托皮肤基底细胞癌多模态规范数据集,首先将数据集中的数据特征分为逻辑、分类和定量三种类型,将逻辑类型转化为0、1,将分级类型转化为0,1,2,3,…,将定量类型进行标准化处理,转化为R+;然后利用上述处理后的数据构造皮肤基底细胞癌临床特征向量X={k1x1,k2x2,k3x3,…},其中x1,x2,x3,…表示标准化处理后的逻辑、分类和定量三种类型的数据,k1,k2,k3,…表示该特征所对应的权重值,权重值的设定通过对Y=k1x1+k2x2+k3x3…进行多元回归分析获得;S2-2基于欧氏距离,采用k-means算法,对特征向量X进行聚类分析,挖掘、归纳皮肤基底细胞癌特征统计分布,即为皮肤基底细胞癌细粒度分型;k-means算法中的最优的聚类数k使用Elbow方法来确定;S2-3使用验证性因子分析、混合聚类因子分析和或FP-growth算法验证聚类分析的准确性;其中,使用验证性因子分析评估和验证测量模型的适配度,以确定观察变量与潜在因子之间的关系,通过拟合度指标评估模型与数据的拟合度,拟合度高的聚类分析模型的准确性也较高;采用混合聚类因子分析结合聚类分析和因子分析方法,同时考虑样本之间的相似性和变量之间的关联性;采用拟合指标评估模型与数据的拟合程度,所述的拟合指标包括卡方拟合指数、CFI和RMSEA;使用FP-growth算法分析数据集中频繁出现的模式和项集,将挖掘到的频繁模式和关联规则应用于数据分析,同时验证聚类分析的准确性;S3、对准确性未达到标准的聚类分析模型数据进行主成分分析或因子分析,剔除影响聚类分析准确度的离群值,然后重新进行聚类分析直至达到标准,保存聚类分析模型;S4、皮肤基底细胞癌患者数据与聚类分析模型中的分型匹配,从而获得该患者对应的细粒度分型,并根据该分型制定精准临床治疗方案S5、结合皮肤基底细胞癌患者的预后情况验证细粒度分型的可靠性与充分性,并根据验证结果调整收集的临床诊断分型的因子及特征。
全文数据:
权利要求:
百度查询: 吉林大学 长春通达数据技术有限责任公司 一种基于聚类分析算法的皮肤基底细胞癌细粒度分型方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。