恭喜航空工业信息中心;北京中科闻歌科技股份有限公司;中国科学院自动化研究所王婧宜获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜航空工业信息中心;北京中科闻歌科技股份有限公司;中国科学院自动化研究所申请的专利面向多级标签的文本分类方法、装置、设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114691866B 。
龙图腾网通过国家知识产权局官网在2025-05-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210225366.3,技术领域涉及:G06F16/353;该发明授权面向多级标签的文本分类方法、装置、设备及存储介质是由王婧宜;禹宁;冯昊;孔庆超;王宇琪;许刚刚;曹家;罗引设计研发完成,并于2022-03-09向国家知识产权局提交的专利申请。
本面向多级标签的文本分类方法、装置、设备及存储介质在说明书摘要公布了:本公开实施例涉及一种面向多级标签的文本分类方法、装置、设备及存储介质。本公开实施例通过获取文本以及文本中关键词对应的标签;基于预设的面向多级标签的文本分类模型中的文本编码模型对文本进行编码处理,得到文本的特征向量,文本的特征向量对文本的关键词进行敏感表征,基于预设的面向多级标签的文本分类模型中的标签编码模型,对标签进行编码处理,得到标签的向量;分别计算文本的特征向量与每个标签的向量之间的余弦相似度;将余弦相似度大于预设阈值的标签确定为文本的标签。通过对文本和现有类别标签进行编码处理和余弦相似度计算处理,选择出文本内容相匹配的标签,可减轻对人工标注标签的依赖,降低人工标注和标签体系的维护成本,提高标签标注的准确率,使文本分类结果更准确。
本发明授权面向多级标签的文本分类方法、装置、设备及存储介质在权利要求书中公布了:1.一种面向多级标签的文本分类方法,其特征在于,所述方法包括:获取文本以及文本中关键词对应的标签;基于预设的面向多级标签的文本分类模型中的文本编码模型对所述文本进行编码处理,得到所述文本的特征向量,所述文本的特征向量对所述文本的关键词进行敏感表征,基于预设的面向多级标签的文本分类模型中的标签编码模型,对所述标签进行编码处理,得到标签的向量;分别计算所述文本的特征向量与每个标签的向量之间的余弦相似度;将所述余弦相似度大于预设阈值的标签确定为所述文本的标签;所述基于预设的面向多级标签的文本分类模型中的文本编码模型对所述文本进行编码处理,得到所述文本的特征向量,所述文本的特征向量对所述文本的关键词进行敏感表征,包括:基于所述文本编码模型,将所述文本的关键词注入到所述文本编码模型内的关键词嵌入层中,以形成对所述文本的关键词的敏感表征;基于所述文本编码模型,将所述文本转化为所述文本的特征向量,所述文本的特征向量对所述文本的关键词进行敏感表征。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人航空工业信息中心;北京中科闻歌科技股份有限公司;中国科学院自动化研究所,其通讯地址为:100029 北京市朝阳区安外小关东里14号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。