Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜集智学园(北京)科技有限公司胡乔获国家专利权

恭喜集智学园(北京)科技有限公司胡乔获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜集智学园(北京)科技有限公司申请的专利一种文本分类与术语网络生长的共演化方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114416997B

龙图腾网通过国家知识产权局官网在2025-05-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210078144.3,技术领域涉及:G06F16/35;该发明授权一种文本分类与术语网络生长的共演化方法是由胡乔;周莉;徐恩峤设计研发完成,并于2022-01-24向国家知识产权局提交的专利申请。

一种文本分类与术语网络生长的共演化方法在说明书摘要公布了:本发明公开了一种文本分类和术语网络生长的共演化方法。一方面,对文本构建术语子图,基于术语网络的特征对术语子图进行评分,从而实现文本分类;另一方面,从分类的文本中提取术语子图,并使用术语子图对某个领域术语网络进行扩充和优化。该方法文本分类和术语网络生成两个任务之间的共同优化,可以实现在给定少量领域文本和大型通用术语网络的基础上,得到适用于某个领域的文本分类器和可生长的领域术语网络。进一步地,该方法可以用来建立某个领域的知识图谱、实现某个领域文章推荐等现实需求。

本发明授权一种文本分类与术语网络生长的共演化方法在权利要求书中公布了:1.一种文本分类与术语网络生长的共演化方法,其特征在于,该方法将文本分类与术语网络生长过程有机结合,具体步骤包括:1基于术语子图和术语网络对文本进行分类;1-1构造算法的输入,包括通用术语网络G=VG,EG、其中VG表示通用术语网络的节点集合,EG表示通用术语网络的连边集合,少量带目标领域标签的文本T=[t1,t2,...,tn],n≥1和待分类文本U=[u1,u2,...,un],n≥1,初始化的领域术语网络其中表示领域术语网络的节点集合,表示领域术语网络的连边集合;1-2根据待分类文本U=[u1,u2,...,un],n≥1,构建术语子图g=Vg,Eg;1-3术语子图领域相关性评分,包括术语子图中节点的领域相关性评分,术语子图中连边的领域相关性评分和术语子图中三阶超图的领域相关性评分;1-4文本分类,根据术语子图的节点、连边和超边的得分判定待分类文本是否属于目标领域D,判定方法可以是无监督分类或有监督分类;2基于分类的文本提取术语子图并更新领域术语网络;2-1构建样本子图,使用上述文本分类算法将待分类文本U=[u1,u2,...,un],n≥1分类,得到正样本Pos={ui|Cui≥thresh}和负样本Neg={ui|Cuithresh},将所有正样本的子图聚合为正样本子图将所有负样本的子图聚合为负样本子图2-2样本子图正则化,对正负样本子图分别计算每个节点的kcore值,删掉kcore小于2的节点及其连边,保留kcore大于等于2的节点及其连边,正样本子图GP正则化后得到负样本子图GN正则化后得到2-3更新术语网络,将步骤2-2中得到的正样本子图添加到现有的领域术语网络G*中,并从G*中减去2中得到的负样本子图减法表示对应连边的权重值相减,当被减后的连边权重小于等于0时,删除该条连边,当删除连边后节点的度为0时,删掉该节点;3基于更新的领域术语网络优化文本分类器;4利用优化的文本分类器对文本进行分类;上述步骤迭代进行能够实现文本分类器与术语网络的共同演化,得到分类精度更高的文本分类器与规模更大的领域术语网络。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人集智学园(北京)科技有限公司,其通讯地址为:102300 北京市门头沟区石龙经济开发区永安路20号3号楼A-8204室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。