买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明涉及一种数学公式识别模型用数据增强方法,包括如下步骤:获取CROHME数据集中的在线公式数据,并获取在线公式数据中每个字符的类别和位置;对在线公式数据中的样本进行数据预处理;对在线公式数据中每个字符做判断,并进行字符替换,再公式整体做缩放、旋转变换,并更新当前公式对应的LaTeX序列。本发明是基于字符标注数据集的数据增强方法,充分利用了CROHME在线数据集带有字符位置和类别标注的特性,通过降噪处理和规范化,去除了数据的噪声,减少模型受到错误信息的影响,更易于模型学习和提取特征,对局部字符和全局公式做形变,模拟了手写公式的不同风格,改变了公式的语义信息,扩充了数据样本语义的多样性,有助于提升模型的泛化能力。
主权项:1.一种数学公式识别模型用数据增强方法,其特征在于,包括如下步骤:S1.获取CROHME数据集中的在线公式数据,并获取所述在线公式数据中每个字符的类别和位置;S2.对所述在线公式数据中的样本进行数据预处理;S3.对所述在线公式数据中每个字符做判断,并进行字符替换;S4.对进行字符替换后的公式整体做缩放、旋转变换,并更新当前公式对应的LaTeX序列。
全文数据:
权利要求:
百度查询: 大连理工大学人工智能大连研究院 大连鞍利科技有限公司 一种数学公式识别模型用数据增强方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。