一种基于AI卷积神经网络深度学习识别狗叫声的方法

导航：龙图腾网> 最新专利技术> 一种基于AI卷积神经网络深度学习识别狗叫声的方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：东莞市亘尚电子科技有限公司

摘要：一种基于AI卷积神经网络深度学习识别狗叫声的方法，包括基于AI卷积神经网络模型参数训练过程、模型部署及应用过程，训练过程包括采集音频、转PCM格式样本、时域能量参数提取以及FFT频域变换、构建卷积神经网络CNN深度学习模型、输入CNN网络模型和提取的音频特征向量样本训练调整模型参数；模型部署及应用过程包括装载置入的网络模型和参数对录入音频的特征向量按照模型的卷积核和卷积流程同模型参数进行多层卷积运行，通过全连接层输出计算概率结果。本发明将卷积神经网络深度学习训练的网络模型和参数部署于电子产品如犬训练器、止吠器、犬玩具类，可精确检测是否有狗叫声，然后触发相关提示，提高狗叫声识别率，降低误判率。

主权项：1.一种基于AI卷积神经网络深度学习识别狗叫声的方法，用于犬训练器、犬止吠器、犬玩具电子产品的狗叫声识别，其特征在于，所述方法包括基于AI卷积神经网络模型参数训练过程、模型部署及应用过程；其中，所述基于AI卷积神经网络模型参数训练过程所采取的步骤依次为：步骤Ⅰ：采集不同品类的狗叫声并且同时采集不同年龄段的狗叫声，在采集的音频中进一步收集不同情绪时的狗叫声以及不同叫法的狗叫声，另外采集一定数量的非狗叫环境声音；步骤Ⅱ：对采集的每个音频均编辑截取为能正确表述一段狗叫声的音频片段，转为PCM格式音频样本供下阶段音频特征向量提取使用；步骤Ⅲ：将PCM格式音频样本进行时域能量参数提取，接着进行FFT频域变换，以便抽取音频的频域能量特征参数，一起运算组成音频特征向量集合，构成机器学习样本，提供给下一个阶段使用；步骤Ⅳ：利用机器学习工具Tensorflow或Pytorch构建卷积神经网络CNN深度学习模型，设计为5层卷积核，采用5x5,3x3的卷积核，每层卷积核运算从不同维度计算样本的特征参数，每层卷积运算串联，前级输出接后级输入，卷积运算最后层接全连接计算概率输出；步骤Ⅴ：借助于本地PC或网络AI大数据训练中心部署，输入CNN网络模型和提取的音频特征向量样本，输入反复计算，训练调整模型参数，直到模型收敛，训练结束，输出训练好的模型和参数，提供给终端产品进行模型部署和应用；其中，所述模型部署及应用过程所采取的步骤依次为：步骤Ⅰ：将AI卷积神经网络CNN模型和参数，部署在有一定运算能力的终端电子应用产品；步骤Ⅱ：于应用产品工作中，录制一段音频，转为待处理的PCM格式；步骤Ⅲ：对PCM格式音频数据进行时域频域变换，抽取音频的时域频域特征参数，合并运算组成声音的特征向量；步骤Ⅳ：应用产品装载置入的网络模型和参数，对录入音频的特征向量按照模型的卷积核和卷积流程同模型参数进行多层卷积运行，最终通过全连接层输出计算概率结果。

全文数据：

权利要求：

百度查询：东莞市亘尚电子科技有限公司一种基于AI卷积神经网络深度学习识别狗叫声的方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种考虑可靠性及经济性的配电网承载力精细化评估方法

下一篇：一种MOCVD设备的尾气过滤器结构和使用方法

相关技术

一种考虑可靠性及经济性的配电网承载力精细化评估方法

一种MOCVD设备的尾气过滤器结构和使用方法

一种飞机液压牵引系统横向稳定性实验平台

一种装饰条连接件与立柱压板的连接工艺

用于遥控感应窗的半透明紫材料及其制备方法及应用

一种可降解咖啡渣复合材料及其制备方法与制品

一种基于感知线程束类型的GPGPU性能优化方法

背光模组及显示装置

基于私有传输协议的文件传输方法、装置和存储介质

一种纯水中超快激光烧蚀制备高活性纳米氧化银析氢材料的方法

一种建筑工程结构缝隙灌浆装置

一种3D打印仰卧式腰臀穴位点治疗系统及数据采集方法

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于AI卷积神经网络深度学习识别狗叫声的方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务