Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜中国人民大学严承希获国家专利权

恭喜中国人民大学严承希获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜中国人民大学申请的专利基于深度主动学习策略的中文古籍实体抽取方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119761372B

龙图腾网通过国家知识产权局官网在2025-06-20发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510247071.X,技术领域涉及:G06F40/295;该发明授权基于深度主动学习策略的中文古籍实体抽取方法是由严承希设计研发完成,并于2025-03-04向国家知识产权局提交的专利申请。

基于深度主动学习策略的中文古籍实体抽取方法在说明书摘要公布了:本发明提供一种基于深度主动学习策略的中文古籍实体抽取方法,涉及自然语言处理领域。本发明中,将主动学习策略与基于深度神经网络的实体抽取模型进行模型整合,既能够充分发挥深度网络学习器的模型拟合能力,而且充分利用改进的主动学习策略进一步缓解标注数据不足以及专家标注成本较高的问题。同时,采用融合不确定性、最小边界性和多空间特征表征性的查询策略进行数据池选择,有效提升了学习效率。进一步的,对于实体抽取网络模型,设计一个双编码器结构,将基于预训练学习的全局编码器与基于字符级嵌入的局部编码器进行整合,获取句子的融合语义表示,以全面捕捉句子更加全面的上下文语义知识,从而提升基于深度神经网络实体抽取模型的性能。

本发明授权基于深度主动学习策略的中文古籍实体抽取方法在权利要求书中公布了:1.一种基于深度主动学习策略的中文古籍实体抽取方法,其特征在于,包括:获取原始的古籍文本资源,选出一部分文本进行实体标注,获取标注数据集,并将其他未标注的文本作为未标注数据集;其中未标记文本的数量大于标记文本;配置模型运行和计算的超参数,并基于初始的标注数据集,对预先构建的基于深度神经网络的实体抽取网络模型进行训练、预测与性能评估,获取初始评估分数;若当前评估分数超过达标阈值或者迭代次数达到最大迭代次数,则输出最终的实体抽取网络模型,否则反复执行以下主动学习查询策略,包括:对当前未标记数据集进行池抽样,利用当前实体抽取网络模型,采用融合不确定性和最小边界性的查询策略,预测相应的复合分数;基于所述复合分数,采用多空间特征表征性的查询策略,从当前未标记数据集中选择一批具有信息价值的未标记文本,并作为查询样本池;接受专家对所述查询样本池的人工标注,获取标注后的查询样本池;将所述标注后的查询样本池加入当前标记数据集,并从当前未标记数据集中剔除;将当前标记数据集对当前实体抽取网络模型进行训练、预测与性能评估,获取更新后的模型以及评估分数,以用于下一次迭代过程;所述实体抽取网络模型采用双编码器-解码器的深度神经序列标注网络,包括用于实体序列标注的主学习通道和句子表征的类学习通道;所述配置模型运行和计算的超参数,并基于初始的标注数据集,对预先构建的基于深度神经网络的实体抽取网络模型进行训练、预测与性能评估,获取初始评估分数,包括:对于主学习通道:采用基于预训练学习的全局编码器,对输入的标记文本进行句子嵌入编码,获取全局向量表示;采用基于字符级嵌入的局部编码器,对输入的标记文本进行字符级上下文相关词嵌入,并进行平滑优化,获取局部向量表示;拼接所述全局向量表示和局部向量表示并进行多层编码映射,获取最终语义表示;对于类学习通道:引入并随机赋值一个聚类隐变量,以增强句子编码特征的内聚性;基于所述最终语义表示定义主体通道损失函数,基于所述聚类隐变量和最终语义表示定义类别通道损失函数;基于所述主体通道损失函数和类别通道损失函数,构建模型的混合损失函数;在配置模型运行和计算的超参数后,采用小批量梯度下降方法求解所述混合损失函数,以对模型进行训练、预测与性能评估,获取初始实体抽取网络模型、初始聚类隐变量和初始评估分数。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国人民大学,其通讯地址为:100086 北京市海淀区中关村大街59号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。