Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜浙江工业大学李永强获国家专利权

恭喜浙江工业大学李永强获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜浙江工业大学申请的专利一种基于管道式方案的政务三元组抽取方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114861668B

龙图腾网通过国家知识产权局官网在2025-05-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210589675.9,技术领域涉及:G06F16/36;该发明授权一种基于管道式方案的政务三元组抽取方法是由李永强;赵永智;冯远静;范陈强;姚辉;李文伟;林栋;吴毕亮;叶衍统;汤家睿;薛志豪设计研发完成,并于2022-05-26向国家知识产权局提交的专利申请。

一种基于管道式方案的政务三元组抽取方法在说明书摘要公布了:一种基于管道式方案的政务三元组抽取方法,包括以下步骤:1获取某个问政平台在数据库中的社情民意描述文本,预先确定好实体的schema和关系的schema;2将文本转化为向量放入BERT模型里进行实体起始边界的预测;3预先设定好span的最大宽度,从预测出来的起始边界开始,逐一生成实体span,直到span的宽度等于设定的最大宽度;4对生成的span进行实体类型的预测;5将识别出的实体两两配对,构成若干条句子,每种实体类型用特殊的token字符表示;6将文本中的实体替换为对应的token字符,得到新的句子;7将新句子放到另外一个BERT模型里,得到句子向量;8将句子向量里的头尾实体向量进行拼接,送入前馈神经网络,进行关系预测,从而完成文本的三元组抽取任务。

本发明授权一种基于管道式方案的政务三元组抽取方法在权利要求书中公布了:1.一种基于管道式方案的政务三元组抽取方法,其特征在于,所述方法包括以下步骤:1获取某个问政平台在数据库中的社情民意描述文本,预先设定好需要标注的实体的schema和关系的schema;2根据上述的标注schema,在web端的标注平台上人工标注出描述文本中的三元组关系,并生成确定格式的标注文本作为训练数据和验证数据;3首先对文本数据进行命名实体识别,过程如下:3.1给定token化的文本X=[x1,x2.......xn],其中xt为在文本t位置的token,将X输入BERT模型后,得到文本的隐藏表示H=[h1,h2......hn],其表示的过程为:H=BERTX3.2采用一个二进制分类器,为每个向量分配二进制标记01来分别检测对象是否为实体的起始位置,当该对象的概率超过某个阈值时,则将对象分配标签1,否则就分配标签0,其表示过程为:Pistart_s=σWstarthi+bstartPistart_s表示输入序列中的第i个token识别为实体的开始位置的概率,σ是sigmoid激活函数,Wstart是可训练的权重,bstart是偏差;3.3预先设定好一个span的最大宽度,将上述标记为1的对象作为实体的起始位置,依次生成span实体,直到span的宽度与最大宽度相等,每个实体span的表示过程为:hesi=[hSTARTi;hENDi;φsi]hSTARTi是span的起始索引,hENDi是span的结束索引,φsi是span的宽度特征嵌入;3.4将上述生成的实体span送入前馈神经网络,进行实体类型的预测,如下所示:Pee|si=softmaxWehesiWe是可训练的权重;3.5命名实体识别的交叉熵损失函数如下所示: s是实体span的集合,si为集合里的元素,为gold实体类型;4对上述完成了命名实体识别的句子,将其句子中识别出来的实体span两两配对构成span头尾实体对,生成若干句子,将每一种实体类型用特殊的token字符来表示;5将生成句子中的span头尾实体替换成对应的实体类型token,从而构造一个新的句子;6对这个新生成句子中的头尾实体做关系的分类,过程如下:6.1将这个新的句子放入到另外一个BERT模型里,生成句子向量,如下所示:B={b1,b2......bn}6.2将该句子向量里对应的头尾实体向量拿出来进行一个拼接,如下所示:hrsi,sj=[bi;bj]si为头实体,sj为尾实体,bi是头实体在句子中对应的向量,bj是尾实体在句子中对应的向量;6.3将拼接后的向量送入前馈神经网络进行关系的预测,从而完成三元组的抽取任务,如下所示:Prr|si,sj=softmaxWrhrsi,sjWr是可训练的权重;7关系模型训练的损失函数如下所示: SG是gold实体集合,是实体对的gold关系类型。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江工业大学,其通讯地址为:310014 浙江省杭州市拱墅区潮王路18号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。