首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于无监督生成网络的多编码体系互迁移方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:浙江浙能数字科技有限公司;浙江浙能技术研究院有限公司

摘要:本发明涉及一种基于无监督生成网络的多编码体系互迁移方法,包括步骤:通过采集设备获取编码规则A下的编码与语义描述的数据集;由两种规则编码数据集分别进行等量的随机采样。本发明的有益效果是:本发明采用无监督多编码体系互迁移模型,通过采集设备获取数据集,对数据集中数据进行随机采样,并划分为训练集和测试集,用于训练无监督多编码体系互迁移模型,绕开人工标注的流程,工作量小、求证简单、出错率低;本发明通过无数据标注方法实现无监督的多编码体系互相迁移,克服了传统底层数据治理标准化、统一化方法仅用于设备编码,尚未提出解决方案破解不同编码体系下的自动映射问题。

主权项:1.一种基于无监督生成网络的多编码体系互迁移方法,其特征在于,包括以下步骤:步骤1、通过采集设备获取编码规则A下的编码与语义描述的数据集: ,其中为编码,为语义描述,m为编码规则A下的数据集总量;通过采集设备获取编码规则B下的编码与语义描述的数据集:,其中为编码,为语义描述,n为编码规则B下的数据集总量;步骤2、由步骤1获得的编码数据集和分别进行等量k的随机采样,得到编码规则A下的训练集、编码规则B下的训练集、编码规则A下的测试集和编码规则B下的测试集,其中指实数空间,为编码规则A下的编码与语义描述的数据集的采样总数,为训练集采样数量,为编码规则A下的训练集采样数量,为编码规则B下的编码与语义描述的数据集的采样总数,为编码规则B下的训练集采样总数,将数据集、、、保存在存储装置的存储单元内;步骤3、根据步骤2得到的数据集、、、,对编码和语义描述进行分词,建立编码实体字典,其中q为编码实体编号,为编码实体词;对语义描述建立语义描述实体字典,其中p为描述实体编号,为描述实体词;步骤4、根据步骤2得到的数据集、、、,步骤3获得的编码实体字典、语义描述实体字典,对编码与语义描述进行文本向量化表征,得到编码向量和描述向量;步骤5、通过由步骤2获得的编码规则A下的训练集和编码规则B下的训练集,训练无监督多编码体系互迁移模型,无监督多编码体系互迁移模型由编码网络与解码网络组成;步骤6、将无监督多编码体系互迁移模型部署计算模块,并将编码规则A下的编码与语义描述进行输入,得到编码规则B下的编码与语义描述;或将编码规则B下的编码与语义描述进行输入,得到编码规则A下的编码与语义描述。

全文数据:

权利要求:

百度查询: 浙江浙能数字科技有限公司 浙江浙能技术研究院有限公司 一种基于无监督生成网络的多编码体系互迁移方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。