Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜杭州电子科技大学陈信获国家专利权

恭喜杭州电子科技大学陈信获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜杭州电子科技大学申请的专利一种基于多示例学习的工业互联网专利识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114330314B

龙图腾网通过国家知识产权局官网在2025-05-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111593675.8,技术领域涉及:G06F40/258;该发明授权一种基于多示例学习的工业互联网专利识别方法是由陈信;俞东进;蔡鑫鑫;徐忆航设计研发完成,并于2021-12-22向国家知识产权局提交的专利申请。

一种基于多示例学习的工业互联网专利识别方法在说明书摘要公布了:本发明涉及一种基于多示例学习的工业互联网专利识别方法,利用自然语言处理技术,将专利中的摘要信息切分成句子,并利用基于句子关系图的文本主题句抽取算法来抽取摘要中的主题句,可以有效减少计算开销。同时通过结合标题和摘要中抽取的主题句,将专利转换为为句子包,其中每个专利看作包,包中的每个句子看作示例。最后,通过采用K近邻算法KNearestNeighbors,KNN来预测新样本的类别。通过本发明方法能有效提高工业互联网专利识别效果,极大地减少人工审查代价,对专利检索有着非常重要的意义。

本发明授权一种基于多示例学习的工业互联网专利识别方法在权利要求书中公布了:1.一种基于多示例学习的工业互联网专利识别方法,其特征在于:包括以下步骤:步骤一、从数据集中获取专利数据P=P1,P2,…,Pn,n为专利的件数,将每个专利样本表示为Pi=id,pnun,title,abstract,其中id表示专利的编号,pnun表示专利的申请号,title表示专利的标题,abstract表示专利摘要;步骤二、数据过滤:通过专利的申请号pnum对专利数据去重,仅保留一个专利申请号的相关专利;步骤三、句子切分:对于专利中的abstract文本内容,根据“。”、“;”、“!”、“?”等将其划分为句子,并将摘要表示为句子的集合abstract=s1,s2,…,sm,其中m表示abstract包含的句子数量;步骤四、数据预处理:利用在线分词工具LTP对专利中的文本内容进行分词;后删除文本内容中包含的噪音信息;再利用停用词表去除文本内容中包含的停用词;经过预处理后每个样本表示为Pi=id,pnum,preTitle,preAbstract,其中preTitle和preAbstract分别表示预处理后的标题信息和摘要信息;步骤五、句子相似度计算:采用Jaccard系数来计算相似度,将样本表示为词袋模型,根据两个样本包含的相同的词的个数与所有不同词的个数的比例来度量相似度;步骤六:abstract主题句抽取:采用基于句子关系图的文本主题句抽取算法来抽取主题句,对于句子sjj=1,2,…,m,得到主题句的集合topSen={s1,s2,…sm'},m'为最终选择的主题句的数量;步骤七:句子包表示:对于每个专利Pi,用句子包来表示专利;将title看作是单独的主题句,与topSen中主题句进行合并,将专利Pi表示为从而专利Pi看作包,Pi中的每个句子看作一个示例,li为包Pi中示例的个数;步骤八:包间相似度计算:对于任意两个句子包Pa和Pb,la和lb分别表示包Pa和Pb中示例的个数,则Pa和Pb的相似度为: 且 其中SimPa,Pb表示Pa和Pb的相似度;步骤九:训练集划分:将数据集划分为正样本集和负样本集,其中工业互联网专利作为正样本,非工业互联网专利作为负样本:步骤十:分类预测:对于新的专利样本Pu,对标题和摘要进行预处理,然后对预处理后的摘要进行主题句抽取,将标题当作一个单独的主题句,将专利Pu表示为句子包形式;利用K近邻算法来预测Pu的类别;所述步骤六包括以下步骤:步骤6-1:对于abstract=s1,s2,…,sm,根据Jaccard系数计算所有句子之间的相似度Simsj,sk,其中j≠k且j,k=1,2,…,m,构建相似度矩阵Xm×m;步骤6-2:设定相似度阈值δ1δ1=0.3,构建矩阵Ym×m,其中每个元素YjkYjk∈Ym×m的值为: 步骤6-3:构造一个行向量Z1×m,对应分量Zjj=1,2,…,m代表句子sj的重要程度,与Ym×m的每一行对应;Zj的值为Ym×m中第j行元素值大于0的元素的个数;步骤6-4:将句子按重要程度从大到小进行排序,选定阈值δ2δ2=0.5以及压缩比率RR=0.2,初始化集合topSen={},依次按照句子重要程度处理每个句子sj;步骤6-5:若待处理的句子sj未被标记为“已处理”,则将sj放入topSen,并标记为“已处理”,同时扫描矩阵Ym×m第j行,如果Yjk≥δ2,则将句子sk也标注为“已处理”;若待处理的句子sj已经标注为“已处理”,则不操作;步骤6-6:重复步骤6-5,直到无待处理句子或者topSen中包含的句子数量已经达到R×m;步骤6-7:得到abstract的主题句集合topSen={s1,s2,…sm'},m'为最终选择的主题句的数量。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人杭州电子科技大学,其通讯地址为:310018 浙江省杭州市钱塘新区白杨街道2号大街1158号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。