首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于机器学习的化合物迁移性筛查方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:中国科学院广州地球化学研究所

摘要:本发明公开一种基于机器学习的化合物迁移性筛查方法,采用多种机器学习算法与数据不平衡算法两两组合,形成不同的算法组合,将训练集进行交叉验证划分,划分为第一训练子集和第一验证子集,在第一训练子集上对不同的算法组合进行训练,并在第一验证子集上进行测试,选择最优的算法组合作为最终算法骨架。本发明的有益效果是:考虑中性化合物和离子型化合物迁移性标准的差异,通过筛选不同机器学习算法与数据不平衡算法的最优组合,构建了可以准确预测化合物迁移性的多分类模型,提高分类速度和分类准确度。

主权项:1.一种基于机器学习的化合物迁移性筛查方法,其特征在于,包括以下步骤:从公共领域获取化合物的数据,根据迁移性划分条件为化合物打上标签,构建数据库;计算所述数据库中全部化合物的分子描述符;将所述数据集随机划分为训练集和测试集;采用多种机器学习算法与数据不平衡算法两两组合,形成不同的算法组合,将所述训练集进行交叉验证划分,划分为第一训练子集和第一验证子集,在所述第一训练子集上对不同的所述算法组合进行训练,并在所述第一验证子集上进行测试,选择最优的算法组合作为最终算法骨架;基于解释机器学习模型在所述训练集上对所述分子描述符的重要性进行排序,按照预设规则选择所述分子描述符组成不同的描述符数据集,采用所述最终算法骨架对所述描述符数据集进行测试,得到最优特征组合;基于所述最终算法骨架和所述最优特征组合进行超参数调优,得到最优超参数;在所述训练集中使用所述最优特征组合,根据所述最终算法骨架和最优超参数构建和训练预测模型,根据所述预测模型预测化合物是否具有迁移性。

全文数据:

权利要求:

百度查询: 中国科学院广州地球化学研究所 一种基于机器学习的化合物迁移性筛查方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。