买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:平安银行股份有限公司
摘要:本发明实施例涉及人工智能领域,公开了一种表格数据处理方法、装置、设备及存储介质,该方法包括:获取一个或多个非标准表格的样本表格训练图片;对各个样本表格训练图片添加线条标签;将添加线条标签的各个样本表格训练图片输入预设的深度神经网络模型进行训练,得到表格数据处理模型;将目标表格图片输入表格数据处理模型,得到目标表格图片的线条信息;通过预设的深度神经网络模型对确定线条信息的目标表格图片的目标表格中的文本进行检测和识别,得到目标表格的文本内容,实现了对非标准表格的内容的抽取以及表格的复现,提高了对非标准表格数据处理的效率和准确性。本发明涉及区块链技术,如可将数据写入区块链中,以用于数据取证等场景。
主权项:1.一种表格数据处理方法,其特征在于,包括:获取样本训练集,所述样本训练集中包括一个或多个样本表格训练图片,所述一个或多个样本表格训练图片中包括非标准表格的图片,所述非标准表格是指表格线条不完整的表格;对所述样本训练集中各个样本表格训练图片添加线条标签,所述线条标签用于指示与所述各个样本表格训练图片对应的样本表格的线条信息;将所述样本训练集中添加线条标签的各个样本表格训练图片输入预设的深度神经网络模型进行训练,得到表格数据处理模型;将待处理的目标表格图片输入所述表格数据处理模型,得到所述目标表格图片对应的线条信息;通过预设的深度神经网络模型对确定线条信息的所述目标表格图片对应的目标表格中的文本进行检测和识别,得到所述目标表格中的文本内容;所述对所述样本训练集中各个样本表格训练图片添加线条标签,包括:确定所述样本训练集中各个样本表格训练图片中样本表格的线条信息,所述线条信息包括一种或多种类别的线条以及每种线条的位置坐标,所述线条的类别包括与水平面平行的第一隐藏线条、与水平面垂直的第二隐藏线条、与水平面平行的第一显示线条以及与水平面垂直的第二显示线条;根据所述各个样本表格训练图片中样本表格的线条的类别以及每种线条的位置信息对所述各个样本表格训练图片添加对应的线条标签;所述将所述样本训练集中添加线条标签的各个样本表格训练图片输入预设的深度神经网络模型进行训练,得到表格数据处理模型,包括:从所述添加线条标签的各个样本表格训练图片中提取表格特征向量,并将所述表格特征向量输入所述预设的深度神经网络模型,得到损失函数值;当所述损失函数值不满足预设条件时,根据所述损失函数值调整所述预设的深度神经网络模型的模型参数,将所述添加线条标签的各个样本表格训练图片输入调整模型参数后的深度神经网络模型进行重新训练;当重新训练得到的损失函数值满足预设条件时,确定得到所述表格数据处理模型;所述将所述表格特征向量输入所述预设的深度神经网络模型,得到损失函数值,包括:将所述表格特征向量输入所述预设的深度神经网络模型,通过所述预设的深度神经网络模型中的ResNet骨干网络模块和tensorflow的slim模块得到所述各个样本表格训练图片对应的样本表格中每一种类别的线条的损失函数值;根据所述各个样本表格训练图片的每一种类别的线条的损失函数值,确定各个类别的线条的损失函数值的平均值为所述各个样本表格训练图片的损失函数值。
全文数据:
权利要求:
百度查询: 平安银行股份有限公司 一种表格数据处理方法、装置、设备及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。