买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本申请涉及人工智能技术领域,特别涉及图文模型训练方法、识别样本生成方法、设备及介质。该图文模型训练方法包括:获取训练数据,训练数据包括与商品相关的文本和图片;从与商品相关的图片中提取商品的图片信息,并且从商品的图片信息中识别第一字符串;对于第一字符串,从与商品相关的文本中提取第二字符串,其中,相比于从文本中所提取的其它字符串,第二字符串与第一字符串之间的编辑距离最小;利用与第一字符串对应的商品的图片信息、第一字符串、第一字符串中的每个字符的识别置信度以及第二字符串来训练预先构建的模型,获得经训练的图文模型。本申请能够进一步提升OCR识别的准确率,并且能够快速生成兼具丰富性和真实性的识别样本。
主权项:1.一种图文模型训练方法,用于电子设备,其特征在于,所述方法包括:获取训练数据,所述训练数据包括与商品相关的文本和图片;从与所述商品相关的所述图片中提取所述商品的图片信息,并且从所述商品的图片信息中识别第一字符串;对于所述第一字符串,从与所述商品相关的所述文本中提取第二字符串,其中,相比于从所述文本中所提取的其它字符串,所述第二字符串与所述第一字符串之间的编辑距离最小;利用与所述第一字符串对应的所述商品的所述图片信息、所述第一字符串、所述第一字符串中的每个字符的识别置信度以及所述第二字符串来训练预先构建的模型,获得经训练的所述图文模型,其中,将与所述第一字符串对应的所述商品的所述图片信息、所述第一字符串、所述第一字符串中的每个字符的识别置信度以及所述第二字符串输入到所述预先构建的模型中以计算所述第一字符串的预测概率,并且其中,所述预先构建的模型融合与所述第一字符串对应的所述商品的所述图片信息、所述第一字符串、所述第一字符串中的每个字符的识别置信度以及所述第二字符串。
全文数据:
权利要求:
百度查询: 小红书科技有限公司 图文模型训练方法、识别样本生成方法、设备及介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。