恭喜杭州电子科技大学申兴发获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜杭州电子科技大学申请的专利一种中文拼写纠错模型获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN112861517B 。
龙图腾网通过国家知识产权局官网在2025-04-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202011549372.1,技术领域涉及:G06F40/232;该发明授权一种中文拼写纠错模型是由申兴发;赵庆彪;徐胜;李树丰;刘立立设计研发完成,并于2020-12-24向国家知识产权局提交的专利申请。
本一种中文拼写纠错模型在说明书摘要公布了:本发明公开了一种中文拼写纠错模型。本发明是一个输入步长和输出步长一致的编解码模型;将待纠错的句子X={x1,x2,x3…xn},输入到混淆字图卷积神经网络和依存句法关系图卷积神经网络中,输出带有混淆字和关系信息的上下文向量;并将该上下文向量输入到编解码模型中,得到纠正后的句子Y={y1,y2,y3…yn}。本发明充分考虑到字与字之间的上下文关系、依存句法关系和混淆字之间的关系,提出了一种新颖的中文拼写纠错模型。
本发明授权一种中文拼写纠错模型在权利要求书中公布了:1.一种中文拼写纠错方法,其特征在于将待纠错的句子X={x1,x2,x3…xn},输入到混淆字图卷积神经网络和依存句法关系图卷积神经网络中,输出带有混淆字和依存句法关系信息的上下文向量;并将该上下文向量输入到一个输入步长和输出步长一致的编解码模型中,得到纠正后的句子Y={y1,y2,y3…yn};所述的混淆字图卷积神经网络具体实现如下:将现有混淆集中的每一个字当作节点,字与字之间的关系当作边,构造出邻接矩阵A∈RN*N,N指的是混淆集的大小;如果A[i][i]与A[i][j]是字形相似或发音相似的混淆字,则A[i][j]=1,否则A[i][j]=0,0≤i,j≤n-1;然后将邻接矩阵A正则化;公式如下: 其中,I是单位矩阵,是的度矩阵; 通过混淆字图卷积神经网络,捕获混淆字之间相似的信息,将混淆字映射到相同的向量空间,每一层的图卷积公式如下: 其中,H∈RN*D,D是字向量的维度,它是隐藏层向量;用Bert预训练的上下文字向量初始化H0;Wl∈RD*D,是可训练的参数;为了保持原始语义,进行叠加操作,公式如下:
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人杭州电子科技大学,其通讯地址为:310018 浙江省杭州市下沙高教园区2号大街;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。