一种面向化合物建模的集合表示学习方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：北京航空航天大学

摘要：本发明通过人工智能领域的方法，实现了一种面向化合物建模的集合表示学习方法。方法针对化合物分子建模过程，提出原子群的概念，并在原子群的概念上建立基于集合表示学习的化合物标签预测通用模型。原子群用于建模化合物分子，集合表示学习的化合物标签预测通用模型包含五个模块：输入层、交互层、排列不变层、集合表示层和输出层。本发明提供的方法实现了根据不同粒度聚集临近元素组成多阶元素，这些元素的向量表示根据邻接关系通过信息传递来不断地更新迭代。最后对同阶元素池化等操作解决了化合物建模的集合表示问题。

主权项：1.一种面向化合物建模的集合表示学习方法，其特征在于：针对某一化合物，通过构建一个低维稠密向量来表示的原子群对化合物进行多粒度建模，构成集合表示学习方法的一个特性，并在此基础上，构建集合表示学习的化合物标签预测模型CombiSet预测化合物标签；所述原子群用于建模化合物分子的方法为：其中分别代表一阶、二阶和三阶原子群，表示原子群内的原子与存在关联信息，多阶群体的最大阶数不会超过原有集合的元素数量，并且仅有一个最大阶的群体；所述原子群用于建模化合物标签预测值的方法为：其中的为所有单原子对待预测值的贡献，通过原子的向量表示、特征和原子之间的结构特征计算得到；表示两阶原子群对待预测值的贡献，所述两阶原子群指具有关联信息的两个一阶原子群组合而成的整体，将所有两阶原子群作为顶点组成一个新图，新图的边定义为两个两阶原子群都共享同一个一阶原子群，在新图中的顶点贡献同样是通过顶点的向量表示、特征和原子之间的结构特征计算得到，两阶原子群的向量表示通过该原子群内部包含原子的向量表示进行哈达玛积计算得到，它的顶点和边的特征向量需要通过特征工程得到，两阶原子群视为对化合物的化学键的建模，它的结构特征是化学键之间的夹角；进而，表示三个具有关联信息的原子群对待预测值的贡献，大于二阶的原子群建模化合物的官能团，它们的结构特征是面夹角；所述集合表示学习的化合物标签预测模型CombiSet包含五个模块：输入层、交互层、排列不变层、集合表示层和输出层；所述输入层包含一个嵌入查找表和神经网络，对每个原子共享，用于获取的首轮向量表示，输入原子群的低维稠密向量，首先原子的离散特征通过嵌入查找表得到特征对应的嵌入表示，该向量之后与原子预训练得到的初始向量表示进行连接操作，接着通过神经网络计算出首轮向量表示；所述交互层用于对原子向量表示进行多轮训练迭代，迭代次数为，将不同粒度的相邻原子整体建模成对应阶数的原子群，同阶的原子群包含相同的低阶原子群时具有邻接关系，同阶原子群对应的向量表示在交互层进行连接操作，之后送入到神经网络中；对于不同阶的原子群将它们向量表示累加起来，送入到神经网络中；进入神经网络后的中间向量会求和，得到下一轮的向量表示，所述交互层对每个原子群进行次迭代计算，形成轮训练迭代；排列不变层对每个原子群的首轮向量表示计算得到，经过轮训练迭代后原子群的影响会传递到-阶邻近度的原子；所述集合表示层对每一阶的原子群的低维稠密向量表示求和，然后以纵向连接方式组成一个矩阵，之后通过卷积层操作得到集合的向量表示所述输出层包含三层神经网络，其中的输出层维度取决于待解决问题需要的维度，所述输出层最后将预测数值与判断结果对应，对每个标签取值都输出它的预测的可能性，然后最大可能性的标签的判断结果取值作为输出结果；所述输入层的具体结构为：对于当前输入特征向量是第阶中的第个原子，该原子的原始特征向量分别为连续型的特征向量、离散型的特征向量，使用嵌入查找表来将映射成，隐向量将与初始表示向量连接起来一起输入到一个全连接神经网络中，计算得到初始向量表示，的计算方式为：式中、是全连接层中可训练参数，是向量连接符号，是激励函数；所述交互层具有两个阶段：信息的传递和节点的更新；同阶原子群表示的更新过程为：其中表示原子群的邻接原子群，表示原子群的邻接原子群的第轮向量表示，表示向量拼接；不同阶原子群表示的更新过程为：其中表示原子群最大阶数，中的表示除第阶外其他阶次序的序数，表示除第阶外第个其他阶的次序，表示原子群的邻接原子群的第轮向量表示，其中原子群的阶数是；向量表示的更新在交互层还依赖于原子群的连续型特征向量与之前聚集同阶、非同阶信息得到的中间变量和分别通过对应的神经网络，最后以求和的形式得到下一轮向量表示，计算过程为：每一个原子群都被交互层处理多轮；所述排列不变层中每一层都输入前一层输出向量表示，首层的输入是原子群的初始向量表示经过输入层的计算得到，排列不变层中每层更新所有原子群的向量表示，并将更新后的表示传入到下一层，k层堆砌共同组成了排列不变层；每一层迭代计算结束，原子群的向量表示都得到更新，随着k轮更新，得到最终训练后各原子群的向量表示；所述集合表示层对每一阶原子群的向量表示分别求和：每一阶原子群的向量表示进过聚集操作后会对应一个列向量，每一个列向量都对应一个阶数的所有原子群，视为一个包含阶原子群的集合，并将所有的连接起来组成一个矩阵：连接后的矩阵将通过卷积层操作，用于对不同阶原子群赋权，该卷积层输入通道数和输出通道数均为1，卷积核大小取决于原子群最大阶数和纵向视野的宽度，卷积层输出的向量长度一般固定为原始向量长度的一半，通过设置步长和填充来调整，通过卷积层操作后，最后得到集合的向量表示：式中的表示卷积操作，表示卷积核；所述输出层由三层神经网络组成，输出的维度依靠具体任务而定，模型训练时，使用交叉熵损失函数作为目标训练函数，如式所示：式中，指的是模型输出实际值，取值为指的是期望输出。

全文数据：

权利要求：

百度查询：北京航空航天大学一种面向化合物建模的集合表示学习方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种变分量子线路的构造方法、装置、介质及电子装置

下一篇：一种集成化电控机械自动变速箱及其控制方法

相关技术

一种变分量子线路的构造方法、装置、介质及电子装置

一种集成化电控机械自动变速箱及其控制方法

一种含有温湿度检测装置的氮气柜及其使用方法

压电负载的驱动控制方法、装置、空调器及介质

一种用于特种车辆的智能检测系统

一种多线程的VCD文件数据统计工具及其应用方法

一种基于安全存储机制的安全芯片架构及关键数据读写方法

一种用于非洲地区小样本精细水体遥感提取的对抗样本生成方法

一种表达蛙皮素magainin 2基因的重组枯草芽孢杆菌及其构建方法

烘干消毒装置以及消毒柜

一种基于光子膜实现LED屏的三维立体光学展示系统及方法

一种虫情测报模型的训练方法、装置、介质和计算设备

集合相关技术

一种集合式垂直喂料装置_苏州天启粉体设备有限公司_202323602377.8

目标位置点集合确定方法及相关设备_杭州海康威视数字技术股份有限公司_202411298193.3

用于获得非概率性集合包括性的可分发散列过滤器_慧与发展有限责任合伙企业_202410475692.9

集合通信处理方法、装置、计算机设备和存储介质_腾讯云计算(北京)有限责任公司_202410218312.3

一种极大集合的挖掘方法、装置和电子设备_支付宝(杭州)信息技术有限公司_202410981949.8

目标节点集合的划分方法、电子设备、计算机程序产品_山东云海国创云计算装备产业创新中心有限公司_202411372932.9

一种基于尺度融合的区域集合预报初值扰动方法_北京城市气象研究院_202410878203.4

一种基于观测扰动的对流尺度集合预报方法及系统_北京城市气象研究院_202410865350.8

一种基于集合模式的样式变量设置方法及相关装置_北京创作美好科技有限公司_202410566805.6

一种面向化合物建模的集合表示学习方法_北京航空航天大学_202111524100.0

建模相关技术

参数化驱动建模方法和建模系统、电子设备及存储介质_司空定制家居科技有限公司_202410899623.0

一种建模辅助装置_吴伟强_202420733479.9

压电式快速倾斜镜建模方法_哈尔滨工业大学_202411106694.7

一种电力系统建模方法_江西科晨洪兴信息技术有限公司_202411006558.0

一种多径生灭建模方法及装置_中国人民解放军军事科学院系统工程研究院_202410746761.5

用于对热电路进行建模的系统和方法_德尔福技术知识产权有限公司_202010710847.4

一种用于牙髓血运重建模拟的训练教具_沧州市人民医院_202410977602.6

一种基于Kirchhoff理论的相干探测建模方法_西安电子科技大学_202410857738.3

一种基于BIM技术的钢网架参数化建模和计算方法_中建六局土木工程有限公司_202410643501.5

需求侧可调节市场竞标建模方法与系统、介质和电子设备_国网电力科学研究院武汉能效测评有限公司_202410857862.X

表示相关技术

一种可调整缺口长度的适爬型尖轨表示杆_上海惟斯迪信息科技有限公司_202410989119.X

基于半侧线混蒙皮神经辐射场的数字人表示方法及系统_广州大学_202410907734.1

一种面向化合物建模的集合表示学习方法_北京航空航天大学_202111524100.0

故障树中的环闭合和规范化表示_西门子工业软件有限责任公司_202080050848.9

基于球面测度表示和深度学习的球面图像压缩方法及装置_北京工业大学_202410820879.8

基于规范化表示空间提示微调的自然语言理解方法_天津大学_202410702273.4

一种基于分层对齐数据块的图表示方法_浙江大学_202410889205.3

一种面向机器翻译的藏文抽象语义表示解析方法_青海师范大学_202410869766.7

面向负荷检测的脑电信号表示学习方法及装置_清华大学_202410847166.0

基于表示学习命名实体识别方法、系统、设备和存储介质_西安交通大学_202111161680.1

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种面向化合物建模的集合表示学习方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务