Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜中国科学院信息工程研究所曹聪获国家专利权

恭喜中国科学院信息工程研究所曹聪获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜中国科学院信息工程研究所申请的专利一种基于提示学习的半结构化网页属性值抽取方法和系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116628303B

龙图腾网通过国家知识产权局官网在2025-03-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310462355.1,技术领域涉及:G06F16/951;该发明授权一种基于提示学习的半结构化网页属性值抽取方法和系统是由曹聪;冯佳丽;曹亚男;袁方方;李保珂;卢毓海;刘燕兵设计研发完成,并于2023-04-26向国家知识产权局提交的专利申请。

一种基于提示学习的半结构化网页属性值抽取方法和系统在说明书摘要公布了:本发明公开了一种基于提示学习的半结构化网页属性值抽取方法和系统,涉及互联网领域,首先根据DOM树简化算法检索变量节点的DOM树视角提示,然后设计包含任务描述的任务模板获得模板视角提示信息,最后引入基于encoder‑decoder结构的预训练语言模型,并以“提示”为核心操作,全面分析领域数据特点和目标任务特点,设计两种视角的提示信息,通过模板填充融合双视角提示信息,通过提示学习的方式在语义层面和任务层面联合引导预训练语言模型进行任务学习,实现预训练语言模型和属性值抽取任务的有效结合,实现了领域标注数据稀缺场景下优越的模型性能。

本发明授权一种基于提示学习的半结构化网页属性值抽取方法和系统在权利要求书中公布了:1.一种基于提示学习的半结构化网页属性值抽取方法,其特征在于,包括以下步骤:对于半结构化网页,网页DOM树中的文本节点包含固定节点和变量节点,针对每个变量节点,检索其语义层面的DOM树视角提示;设计任务模板来为变量节点的文本内容添加任务提示,得到任务层面的模板视角提示;通过任务模板对每个变量节点的文本内容及其DOM树视角提示进行改写,并mask任务模板中的标签映射文本,实现将DOM树视角提示与模板视角提示进行融合,得到双视角提示;利用基于encoder-decoder结构的预训练语言模型,将双视角提示信息输入到encoder端,由decoder端预测出mask位置的文本,该文本由预训练语言模型的词表单词组成,并根据文本与预定义属性的映射关系确定属性类型;对所述预训练语言模型进行训练,计算decoder端输出的文本与标签映射文本的匹配概率,并根据匹配概率计算损失函数,对损失函数进行优化;对于待处理的半结构化网页,使用训练好的预训练语言模型对变量节点的属性类型进行预测,获取decoder端每个位置的归一化概率输出,根据该概率计算每个属性类型的得分,将得分最高的属性类型作为预测结果。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学院信息工程研究所,其通讯地址为:100085 北京市海淀区树村路19号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。