Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜中国烟草总公司郑州烟草研究院宗国浩获国家专利权

恭喜中国烟草总公司郑州烟草研究院宗国浩获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜中国烟草总公司郑州烟草研究院申请的专利一种热词提取方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN113988053B

龙图腾网通过国家知识产权局官网在2025-02-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111235555.0,技术领域涉及:G06F40/216;该发明授权一种热词提取方法及装置是由宗国浩;冯伟华;王锐;王永胜;王迪;刘亚丽;胡斌;郑新章设计研发完成,并于2021-10-22向国家知识产权局提交的专利申请。

一种热词提取方法及装置在说明书摘要公布了:本发明属于软科学技术领域,具体涉及一种热词提取方法及装置。该方法首先获取所有候选词,统计各个候选词在不同时间段内出现的频率数据;对于每个候选词,按照时间顺序对频率数据进行排序得到原始序列,按照频率大小关系对频率数据进行排序得到排序序列;进而计算每个候选词的增长量能和重排损失,以计算得到每个候选词的热度,从中挑选出热度高的候选词作为热词。该方法热词提取精准度较高;而且,该方法基于排序序列进行分析,排除了噪声性波动的干扰,进一步提升了热词提取的准确性;另外,该方法不依赖任何数据集,对参数不敏感,普适性较高。

本发明授权一种热词提取方法及装置在权利要求书中公布了:1.一种热词提取方法,其特征在于,包括如下步骤:1获取所有候选词,统计各个候选词在不同时间段内出现的频率数据;2对于第i个候选词,按照时间顺序对频率数据进行排序得到原始序列Vi,按照频率大小关系对频率数据进行排序得到排序序列V′i;3采用如下方法计算第i个候选词的增长量能Ei:提取第i个候选词的排序序列V′i的不同观察组,一个观察组包括两个不同的子序列,分别为第一子序列和第二子序列,第一子序列中频率数据的最大值大于等于第二子序列中频率数据的最大值、且第一子序列中频率数据的最小值大于等于第二子序列中频率数据的最小值;计算一个观察组中第一子序列与第二子序列之间的差异;根据各个观察组中两个子序列之间的差异,计算得到第i个候选词的增长量能Ei;4采用如下方法计算第i个候选词的重排损失Ri:将第i个候选词从原始序列Vi变换至排序序列V′i过程中,确定每做一次频率数据互换时两个被互换的频率数据之间的位置间隔和频率差异;根据每一次频率数据互换所对应的位置间隔和频率差异,计算得到第i个候选词的重排损失Ri:5将第i个候选词的增长量能Ei和重排损失Ri代入至构建的热度模型中,计算得到第i个候选词的热度Hi;所述热度模型体现的关系为:增长量能Ei与热度Hi呈正相关关系,重排损失Ri与热度Hi呈负相关关系;6按照步骤2~步骤5的方式计算得到每个候选词的热度,挑选热度大于热度阈值的候选词作为提取出的热词。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国烟草总公司郑州烟草研究院,其通讯地址为:450001 河南省郑州市高新区枫杨街2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。