首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于显著性检测的智能图文排版方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:安徽省医学情报研究所

摘要:本发明公开了基于显著性检测的智能图文排版方法及系统,解决了现有文本识别技术只能对单一文本类型或通用领域的文本进行识别排版,无法应用于更广泛的领域并提高图文排版准确性和效率的问题,方法包括获取图文数据,提取文本数据中全局语义和关键词特征;基于预训练的排版拼接模型对文本数据中全局语义和关键词特征进行一次拼接,得到第一预测结果,计算第一预测结果以及第二预测结果的排版平衡值;本发明实施例通过预训练的显著性检测模型对预处理集中文本数据进行显著性检测,从而可以有效提取不同类型文本数据中的全局语义和关键词特征,同时结合排版拼接模型对文本排版进行预测,使得排版结果更为精准有效。

主权项:1.基于显著性检测的智能图文排版方法,其特征在于,所述基于显著性检测的智能图文排版方法包括:获取图文数据,并对获取到的图文数据预处理,生成预处理集;加载预处理集,基于预训练的显著性检测模型对预处理集中文本数据进行显著性检测,提取文本数据中全局语义和关键词特征;基于预训练的排版拼接模型对文本数据中全局语义和关键词特征进行一次拼接,得到第一预测结果;加载文本数据中全局语义和关键词特征,基于预训练的排版拼接模型对全局语义和关键词特征进行二次拼接,得到第二预测结果;计算所述第一预测结果以及第二预测结果的排版平衡值,以排版平衡值高的预测结果为输出;基于深度学习确定图像数据中像素点特征值,根据像素点特征值生成排版预测队列,计算所述排版预测队列中多组排版版式的显著度,得到图文排版结果;所述提取文本数据中全局语义和关键词特征的方法,具体包括:卷积模块对输入的文本数据进行多级卷积,提取多组文本特征,得到文本特征卷积结果,其中,卷积结果记为:(1)其中,所述表示卷积层中卷积核,卷积核大小为,而为卷积矩阵,且每组所述的卷积矩阵具有个维度,且每层维度包含有个特征因素;获取卷积结果,基于卷积结果对特征进行池化处理,然后基于S变换激活函数进行非线性映射,采用取最大值的方式进行下采样,获得特征全连接输出向量,其中,所述S变换激活函数通过式(2)表示;(2)其中,所述为激活参数曲率,而激活参数曲率变化幅度在0.8-0.85之间;特征检测模块中特征隐藏层对全连接输出向量进行特征隐藏,得到特征隐藏向量,判断特征隐藏向量是否大于预设隐藏阈值,若大于预设隐藏阈值,则保留当前特征向量,若小于预设隐藏阈值,则隐藏当前特征向量; (3)其中,分别为特征隐藏向量函数的前置环绕尺度以及后置环绕尺度,且预设隐藏阈值为0.65,取值区间为;基于分类层中GloVe词嵌入模型提取特征向量中关键词向量以及文本分类向量;加载关键词向量以及文本分类向量,基于加权输出层中BiLSTM模型合并关键词向量以及文本分类向量,得到全局语义特征;所述基于预训练的排版拼接模型对文本数据中全局语义和关键词特征进行一次拼接,得到第一预测结果的方法,具体包括:加载全局语义以及关键词特征,通过排版拼接模型对全局语义以及关键词特征进行拼接,得到具有全局语义以及关键词特征的文本数据集;调取预建立的动态文本数据库中全局语义以及关键词特征对应的排版分类模板以及映射关系;基于排版分类模板以及映射关系对文本数据集进行序列排版,得到第一预测结果;其中,计算所述第一预测结果以及第二预测结果的排版平衡值的方法,具体包括:解析序列排版架构,加载全局语义特征以及序列排版,对序列排版中分句进行拆解,得到分句集,计算分句集与全局语义特征之间的分句平衡值; (4)其中,表示排版分类函数,为分句总数; (5)其中,表示排版分类函数迭代次数,为当前序列排版中段落数目,为映射不对称变量,全局语义特征的函数表达式(6)为: (6)其中,为关键词向量,表示文本分类向量,而文本分类向量基于LDA模型进行文本分类; (7)。

全文数据:

权利要求:

百度查询: 安徽省医学情报研究所 基于显著性检测的智能图文排版方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。