恭喜中国银行股份有限公司徐晓健获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜中国银行股份有限公司申请的专利一种基于多重语义信息的资讯分类方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN113434686B 。
龙图腾网通过国家知识产权局官网在2025-02-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202110768661.9,技术领域涉及:G06F16/35;该发明授权一种基于多重语义信息的资讯分类方法及系统是由徐晓健设计研发完成,并于2021-07-07向国家知识产权局提交的专利申请。
本一种基于多重语义信息的资讯分类方法及系统在说明书摘要公布了:本发明提出了一种基于多重语义信息的资讯分类方法及系统,涉及自然语言处理及机器学习技术领域,该方法包括:采集资讯数据,对资讯数据进行预处理;建立资讯分类模型,将预处理后的资讯数据输入至资讯分类模型中,将资讯数据映射到高维空间,缩小语义信息相同的空间距离,并扩大语义信息存在差异的空间距离,并输出映射后的文本数据;利用多个卷积核分别对映射后的文本数据进行特征提取,提取文本与文本间的依赖关系信息,根据资讯数据的文本信息以及文本与文本间的依赖关系信息,优化资讯分类模型;设置训练集及测试集,对优化后的资讯分类模型进行训练、测试;利用训练完成的资讯分类模型对待分类的资讯数据进行类别划分,得到分类结果。
本发明授权一种基于多重语义信息的资讯分类方法及系统在权利要求书中公布了:1.一种基于多重语义信息的资讯分类方法,其特征在于,该方法包括:采集资讯数据,对所述资讯数据进行预处理;建立资讯分类模型,将预处理后的资讯数据输入至资讯分类模型中,通过资讯分类模型将资讯数据映射到高维空间,缩小语义信息相同的空间距离,并扩大语义信息存在差异的空间距离,并输出映射后的文本数据;利用多个卷积核分别对映射后的文本数据进行特征提取,提取文本与文本间的依赖关系信息,根据资讯数据的文本信息以及文本与文本间的依赖关系信息,优化所述资讯分类模型;根据预处理后的资讯数据设置训练集及测试集,对优化后的资讯分类模型进行训练,并利用测试集对训练模型进行测试;获取待分类的资讯数据,利用训练完成的资讯分类模型对待分类的资讯数据进行类别划分,得到分类结果;其中,采集资讯数据,对所述资讯数据进行预处理,包括:对收集的资讯数据进行筛选和标注,提取资讯的标题文本并标注资讯类别;其中,建立资讯分类模型,将预处理后的资讯数据输入至资讯分类模型中,通过资讯分类模型将资讯数据映射到高维空间,缩小语义信息相同的空间距离,并扩大语义信息存在差异的空间距离,并输出映射后的文本数据,包括:设置输入文本条数为A,文本长度限制为B;根据预处理后的资讯数据,输入模型的数据为E条长度为F的文本数据,维度为[A,B];通过资讯分类模型将资讯数据映射到高维空间,输出的映射后的文本数据维度为[E,F,G];其中,G为表示文本中每个文字经过映射后对应的维度;其中,利用多个卷积核分别对映射后的文本数据进行特征提取,提取文本与文本间的依赖关系信息,根据资讯数据的文本信息以及文本与文本间的依赖关系信息,优化所述资讯分类模型,包括:利用第一尺度的卷积核提取文本与文本对应的一定区域范围以外的文本间的依赖关系,利用第二尺度的卷积核提取文本与文本对应的一定区域范围以内文本间的依赖关系;其中,第一尺度大于第二尺度;将多个卷积核提取的特征进行拼接,得到最终特征,并将最终特征输入到分类器中得到最终的分类结果,根据所述最终的分类结果对所述资讯分类模型进行优化;其中,利用多个卷积核分别对映射后的文本数据进行特征提取,提取文本与文本间的依赖关系信息,根据资讯数据的文本信息以及文本与文本间的依赖关系信息,优化所述资讯分类模型,包括:利用每个卷积核分别对映射后的文本数据进行卷积后,输出的数据维度为[E,F,G];分别对输出的数据按照文本中每个文字经过映射后对应的维度G计算最大值和均值,并将最大值和均值拼接后得到每个卷积核对应的最终特征,维度为[E,F,2];将所有卷积核的最终特征进行拼接得到最终的特征,维度为[E,F,2*N];N为卷积核的数量;将拼接的特征输入到分类器中得到最终的分类结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国银行股份有限公司,其通讯地址为:100818 北京市西城区复兴门内大街1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。