买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:天翼云科技有限公司
摘要:本发明公开了一种文本无关、用户无关的中文手写字迹鉴别系统及方法,涉及字迹鉴别技术领域内领域,本发明将手写中文字迹鉴别过程系统化,主要目的为解决用户相关算法产生的高计算开销问题、用户无关算法中需要字迹相关信息的不足,同时解决底库无当前需要鉴别的文字无法鉴别,用户撰写时形成行间交错、同行多字连笔等难于鉴别,连笔字迹难以单字分割输入字数较少时,无法充分利用字迹信息,样本数据较少而无法鉴别等问题并填充当前手写中文字迹鉴别系统化案例空白,提高字迹鉴别的准确率等。
主权项:1.一种文本无关、用户无关的中文手写字迹鉴别系统,其特征在于:包含设备管理模块、AI算法能力模块和算法处理模块;其中,设备管理模块,具体包含如下步骤:步骤A1,输入各手写中文字迹采集设备信息,以设备ID-设备名称-设备位置-rtsp流地址”的结构,存储于HIVE集群中;步骤A2,抽取采集设备即写字板写入的中文字迹,并以书写者的人员编号命名,以图形图像的形式存储于分布式系统存储Ceph集群中;步骤A3,建立并嵌入一套基于写字板的自有信息的初级数据信息库,当有设备新增时,Ceph图像库及Hive设备信息库将同步更新;AI算法能力模块,具体包含如下步骤:步骤B1,获取数据库中存储含有人员编号的图像;步骤B2,调用算法处理模块,对数据图像进行处理,CNN算法字迹特征提取;步骤B3,调用AI算法能力中的算法训练能力,新增底库数据能力、新增对比底库数据能力、底库数据分类能力、算法模块替换能力进行底库数据新增、分类等能力的优化;算法处理模块,具体包含如下步骤:步骤C1,处理需要鉴别的手写中文图像,包括图像二值化、基于抽象字迹信息的字迹行切割、字迹列切割,用户无关、字迹无关的CNN训练架构,CNN算法字迹特征提取;步骤C2,将提取的特征调用AI算法能力的底库分类能力与底库中数据进行对比鉴别,鉴别完成使用科学阈值筛选,输出预测标签。
全文数据:
权利要求:
百度查询: 天翼云科技有限公司 一种文本无关、用户无关的中文手写字迹鉴别系统及方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。