恭喜浙江百应科技有限公司周艺恺获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜浙江百应科技有限公司申请的专利文本数据增强方法、装置、计算机设备和存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114238557B 。
龙图腾网通过国家知识产权局官网在2025-01-07发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111312250.5,技术领域涉及:G06F16/334;该发明授权文本数据增强方法、装置、计算机设备和存储介质是由周艺恺设计研发完成,并于2021-11-08向国家知识产权局提交的专利申请。
本文本数据增强方法、装置、计算机设备和存储介质在说明书摘要公布了:本申请涉及人工智能技术领域,特别是涉及一种文本数据增强方法、装置、计算机设备和存储介质,所述方法包括:将标签数据与文本数据输入至语言模型中,输出与所述文本数据相关联的增强文本数据;其中,所述语言模型基于标签数据与文本数据合并生成的线性化数据、基于标签数据构建的转移矩阵训练得到,所述转移矩阵包含所述标签数据间的转移关系。本发明的语言模型基于标签数据与文本数据合并生成的线性化数据、基于标签数据构建的转移矩阵训练得到,对生成的增强文本数据的合理性有效性进行了控制,从而提升了增强文本数据的质量。
本发明授权文本数据增强方法、装置、计算机设备和存储介质在权利要求书中公布了:1.一种文本数据增强方法,其特征在于,包括:将标签数据与文本数据输入至语言模型中,输出与所述文本数据相关联的增强文本数据;其中,所述语言模型基于标签数据与文本数据合并生成的线性化数据、基于标签数据构建的转移矩阵训练得到,所述转移矩阵包含所述标签数据间的转移关系;所述线性化数据基于将所述标签数据置于所述文本数据中对应的词语后得到;所述语言模型具体通过下述方式训练得到:使用线性化数据作为初始语言模型的输入,计算第一损失值;使用初始语言模型最后一层作为转移矩阵的输入,计算第二损失值;基于GradNorm算法对第一损失值与第二损失值进行合并后训练初始语言模型,得到训练完成的语言模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江百应科技有限公司,其通讯地址为:311121 浙江省杭州市余杭区仓前街道梦想小镇天使村11幢101;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。