首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于多任务学习的词性标注与标点恢复方法及模型 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:昆明理工大学

摘要:本发明涉及基于多任务学习的词性标注与标点恢复方法及模型,属自然语言处理领域。通过采用多任务学习策略,同时处理标点恢复和词性标注,从而允许模型在学习过程中共享相关的表征。这种融合词性特征的方法使得模型能更深入地理解文本的句法结构,更准确地预测标点符号位置。本发明模型包括:编码层、词性标注层和标点恢复层。这种多任务学习框架允许模型在不同的语言学层面上进行联合训练,从而在词性标注和标点恢复两个任务上都取得更好性能。这种多任务学习方法不仅提高模型的预测精度,还增强其对复杂语言现象的处理能力。本发明能显著提升缅甸语音转录文本中标点恢复的整体性能,证明多任务学习方法在提升缅甸语标点恢复准确性方面的有效性。

主权项:1.一种基于多任务学习的词性标注与标点恢复方法,其特征在于:所述方法包括:步骤1、提取原始文本中的丰富上下文信息,为后续任务执行提供必要的输入数据;步骤2、进行词性标注任务;接收来自编码器的单词向量作为输入,通过一系列的线性变换和非线性激活函数对输入向量进行处理,实现对数据的抽象和映射;步骤3、进行标点预测任务,把标点恢复任务构建为一个序列标注问题,对标点预测任务进行优化,采用负对数似然损失函数作为训练过程中的损失指标;步骤4、通过目标损失联合训练标点恢复模型。

全文数据:

权利要求:

百度查询: 昆明理工大学 一种基于多任务学习的词性标注与标点恢复方法及模型

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。