一种多模态知识分层识别和受控对齐方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：烟台海颐软件股份有限公司

摘要：本发明属于多模态知识对齐技术领域，具体涉及一种多模态知识分层识别和受控对齐方法。所述方法包括：获取业务领域关键词，构建领域词向量模型；对服务场景进行归类，基于领域词向量模型，生成每一类服务场景的向量特征集合；采集多模态知识内容，对所述多模态知识内容进行分层格式化处理，并基于领域向量模型，形成多模态知识的特征集；将生成的多模态知识特征与每一类服务场景的向量特征进行相似度判断，若相似度值大于预设的对齐灰度阈值，则当前多模态知识向与服务场景对齐；重复上述完成多模态知识体系构建。以统一接口融合不同模态，改进多模态知识内容识别和管理的困难。

主权项：1.一种多模态知识分层识别和受控对齐方法，其特征在于，包括以下步骤：步骤100：获取业务领域关键词，构建领域词向量模型；步骤200：对服务场景进行归类，基于领域词向量模型，生成每一类服务场景的向量特征集合；步骤300：采集多模态知识内容，对所述多模态知识内容进行分层格式化处理，并基于领域词向量模型，形成多模态知识的特征集合；步骤400：将步骤300形成的多模态知识特征集合与步骤200生成的每一类服务场景的向量特征集合进行相似度判断，若相似度值大于预设的对齐灰度阈值，则当前多模态知识向与服务场景对齐；步骤500：重复步骤300-步骤400完成多模态知识体系构建；所述步骤300中采集多模态知识内容，对所述多模态知识内容进行分层格式化处理，并基于领域词向量模型，形成多模态知识的特征集合，具体包括以下步骤：获取上传文件属性，根据文件属性将上传文件分别分在视频处理层、音频处理层、图片处理层及文字处理层，并将视频处理层、音频处理层、图片处理层提交给文字处理层进行处理；在文字处理层对成段文本进行切片，对切片后文字拆分成词，基于领域词向量模型形成词向量，并构建整个句子的句向量矩阵，句向量矩阵池化，聚合所有句向量池化提取段落向量特征，形成多模态知识的特征集；所述将视频处理层、音频处理层、图片处理层提交给文字处理层进行处理，包括：在视频处理层将视频转换为时序图片，将提取后图片提交给图片处理层进行处理；在图片处理层利用OCR计算提取出图片内的文字，将所述文字传给文字处理层进行处理；在音频处理层是将音频文件用ASR转换为文字，将生成的文字提交给文字处理层进行处理。

全文数据：

权利要求：

百度查询：烟台海颐软件股份有限公司一种多模态知识分层识别和受控对齐方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种用于固化渣土的螺旋输送机

下一篇：一种白蚁引诱灭杀一体化饵料棒

相关技术

一种用于固化渣土的螺旋输送机

一种白蚁引诱灭杀一体化饵料棒

一种用于头枕导套检测装置

一种过滤式水质分析检测仪

一种基于无人车辆的视频控制装置

一种基于PWM的智慧路灯控制装置及系统

一种镭射膜生产用背涂装置

一种用于配电箱的自协同除湿机构

一种移动可调节护栏钢筋绑扎安全胎架

吸管杯及其杯盖

一种沼气发电用沼气预处理装置

一种冷却塔外壳拼装结构

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种多模态知识分层识别和受控对齐方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务