Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜中图科信数智技术(北京)有限公司刘铭获国家专利权

恭喜中图科信数智技术(北京)有限公司刘铭获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜中图科信数智技术(北京)有限公司申请的专利一种文本摘要生成方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115905510B

龙图腾网通过国家知识产权局官网在2025-03-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211392513.2,技术领域涉及:G06F16/34;该发明授权一种文本摘要生成方法及系统是由刘铭;张鹤;李沄沨;许若华;田阳杰;吴冠昊;崔赫;候学杰;蔡欣达设计研发完成,并于2022-11-08向国家知识产权局提交的专利申请。

一种文本摘要生成方法及系统在说明书摘要公布了:本发明是关于一种文本摘要生成方法及系统。该方法包括:对文本进行预处理;提取所述文本中的关键词;采用BERTopic方法预训练类标签分类器,提取所述文本的类标签;根据所述关键词和类标签对所述文本中的句子进行排名,提取排名靠前的关键句;结合所述关键句在所述文本中的位置信息进行重新排序,并根据排序结果输出摘要。本发明提供的技术方案,基于信息论中的信息瓶颈技术,通过融合关键词提取,聚类和预训练语言模型的表示学习,对长文本进行自动通顺摘要生成。不仅对任何领域的长文档都有效,包括学术文章政府报告等,同时不需要人工构建训练语料,且不依赖于文本的语言种类。

本发明授权一种文本摘要生成方法及系统在权利要求书中公布了:1.一种文本摘要生成方法,其特征在于,包括:对文本进行预处理;提取所述文本中的关键词;采用BERTopic方法预训练类标签分类器,提取所述文本的类标签;根据所述关键词和类标签对所述文本中的句子进行排名,提取排名靠前的关键句;结合所述关键句在所述文本中的位置信息进行重新排序,并根据排序结果输出摘要;所述采用BERTopic方法预训练类标签分类器,提取所述文本的类标签,具体包括:将预训练语言模型BERT在所述文本上进行微调;利用微调好的BERT对所述文本进行向量表示;利用UMAP降维算法对所有文本向量进行降维处理,然后利用DBSCAN算法对降维后的文本向量进行聚类;根据聚类结果提取每个簇下面tfidf值超过预设阈值的词语作为每个簇的类标签;所述根据所述关键词和类标签对所述文本中的句子进行排名,提取排名靠前的关键句,具体包括:循环判断所述文本中每个句子含有所述关键词的数量并进行平滑操作得到的第一概率值,以及所述句子输入所述类标签分类器得到对应正确类标签的第二概率值,将所述第一概率值和第二概率值相乘得到该句子的选择值;提取选择值排名靠前的句子作为关键句;所述结合所述关键句在所述文本中的位置信息进行重新排序,并根据排序结果输出摘要,具体包括:从位置靠前的句子依次向位置靠后的句子进行滑动,通过BERT计算每两个位置之间的句子连贯值,该连贯值是BERT中下句话预测策略的附属输出结果;基于所有的连贯值进行beam检索,得出不同的检索路径;对beam检索的结果进行排序,挑选出排名最靠前的句子路径;按照挑选出的句子路径输出相应的句子,作为所述文本的摘要。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中图科信数智技术(北京)有限公司,其通讯地址为:100043 北京市石景山区石景山路68号金安桥1号楼二层215;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。