Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
乐器;声学设备的制造及制作,分析技术
  • 本发明涉及智能调度技术领域,公开了一种基于语音识别的煤矿智能调度方法、装置、设备和介质,该方法包括:采集语音调度音频,基于小波变换对语音调度音频进行降噪处理获得待识别信号;进行语义识别确定语音调度方案并提取调度指数;采集当前任务指数与需求指...
  • 本申请公开了一种当归质量定性和定量评估方法及相关装置,涉及当归质量评估技术领域,该方法包括:在建立定性判别模型和定量回归模型时,以当归切片样品的不同切面在不同波段的高光谱图像作为多种第一特征数据,以当归粉末样品在不同波段的高光谱图像作为多种...
  • 本发明涉及图像处理和模式识别技术领域,具体为一种基于Hu矩特征的高效图像分类系统及方法,包括:图像输入模块:负责接收待分类图像,支持多种图像格式;图像预处理模块:对输入图像进行预处理,包括灰度化、归一化、去噪操作,以提高特征提取的鲁棒性;特...
  • 本发明涉及一种基于多模态思维链的电影人声配音方法,包括以下步骤:构建带有CoT标注的电影配音数据集;整合多语种语音库、动画数据集和多说话人数据集,训练TTS语音合成模块和V2S视频配音模块;对含有噪声和语义不清楚的数据进行去除;训练多模态视...
  • 本发明涉及语音处理技术领域,可应用于金融科技、医疗健康等业务场景中,公开了一种语音信号中语音播报去除方法、装置、设备及介质,包括:建立预存语音播报样本及其语音特征库,将目标语音分割为多个语音分段,基于分段起始点和预存语音时长生成窗口语音段,...
  • 本发明提出了一种适应性背景噪声检测方法,包括:S1、获取属于背景噪声检测区间内的声音信号;S2、对所述声音信号中的每一帧信号进行快速傅立叶转换,估算得到所述声音信号的频谱振幅;S3、对所述声音信号的频谱振幅进行稳态统计分析,计算得到所述声音...
  • 本发明涉及音频水印技术领域,尤其涉及一种抗翻录音频水印嵌入方法、提取方法及装置。所述抗翻录音频水印嵌入及提取方法,首先对音频数据并进行预处理,利用快速傅里叶变换,将原始音频信号从时域转换为频域;然后构建水印信息,基于频域将水印比特嵌入特定频...
  • 本发明涉及人工智能、信息安全、金融科技及数字医疗领域,公开了动态声纹认证方法、装置、计算机设备及存储介质,可应用于线上交易、医疗服务系统中的用户身份认证。本发明通过实时采集语音,在用户无感知的情况下,能够自动完成声纹认证与更新,无需用户主动...
  • 本发明涉及垃圾分类技术领域,提供了一种智能垃圾分类方法、系统及设备,该方法包括:获取垃圾图像数据集;获取基于区域感知的定位损失、多维度图像特征融合的分类损失以及基于注意力引导的置信度损失,并根据定位损失、分类损失以及置信度损失构建损失函数;...
  • 本发明公开了一种基于跨模态特征投影学习的分类方法、装置、终端及存储介质。方法包括:获取目标样本集,所述目标样本集中包括多组样本子集,所述目标样本集为小样本图像集;基于所述目标样本集获取多个类别特征图,每个所述类别特征图对应一种类别;接收目标...
  • 本申请公开了一种语音增强方法、装置、电子设备及计算机可读存储介质,其中,该方法包括:获取目标的视频数据和原始音频数据,其中,视频数据是获取原始音频数据时对目标拍摄得到的;利用视频数据提取视觉特征,以及利用原始音频数据提取语义特征和语音特征;...
  • 本发明公开了一种基于改进YOLOv8n网络的仓储粮虫检测方法,包括以下步骤,S1:数据采集和预处理;S2:模型架构选择;S3:仓储粮虫识别模型的训练;S4:模型评估;S5:待检测图像的获取;S6:将预处理后的待检测仓储粮虫图像输入训练后的仓...
  • 本申请涉及一种自适应情感驱动的音色克隆文字转语音方法及装置。将目标文本按句切分并提取语义特征,将每个句子拆分为目标音素序列;将参考文本拆分为参考音素序列,参考音素序列分别与每个目标音素序列拼合得到组合音素序列,对参考音频进行处理,得到参考语...
  • 本发明公开了一种消毒供应中心监测数据智能分析系统及方法,涉及数据检测技术领域,通过数据采集模块采集温度相关数据和湿度相关数据,然后利用数据处理模块计算得出综合温度系数以及综合湿度系数,并通过异常分析模块计算得出综合指标判定系数分别与设定的温...
  • 本发明涉及声纹识别技术领域,公开了一种面向短语音与复杂噪声的陆空通话说话人识别方法,通过自适应滤波器结合最小均方算法动态抑制背景噪声,提升语音信号质量;采用多尺度特征融合技术,结合短时傅里叶变换、滤波器组能量特征及多尺度卷积,引入随机时间与...
  • 本发明公开了一种基于机器视觉的仓库安全实现方法及系统,属于仓库监管技术领域,用于解决现有的仓库安全监管方法易出现监控死角,且在货物流动过程中可能产生新的监控死角,给仓库监管带来安全隐患的技术问题。方法包括:获取仓库内布设的若干摄像头的监控画...
  • 本发明涉及图像处理技术领域,公开一种基于多源数据融合的图像处理方法,包括:步骤1、获取多模态图像数据,将各模态的数据表示为特征矩阵,所述特征矩阵包含模态的特征维度和样本数量,且对特征矩阵进行标准化与归一化处理,同时,对特征矩阵进行降噪处理,...
  • 本发明涉及图像处理领域,具体涉及一种CNC加工中心用工件特征识别方法,方法包括:获取待加工的工件图像各像素点的LAB值以及各像素点的梯度值,遍历像素点的各邻域窗口的像素点分布复杂度,选择像素点分布复杂度最大对应的邻域窗口作为像素点的目标窗口...
  • 本申请实施例公开了一种音频中的违禁词处理方法、装置、电子设备及计算机可读存储介质,该方法包括:获取音频数据;对所述音频数据进行解码,得到原始音频格式的音频数据;对所述原始音频格式的音频数据进行分隔,得到多个音频片段;以及基于违禁词处理模型,...
  • 本申请公开一种车端控制模型的优化方法、装置、设备及介质,涉及车辆技术领域,该方法包括获取用户的语音信息;对所述语音信息进行识别,得到文本信息;将所述文本信息输入到车端控制模型,得到车端识别结果,将所述文本信息输入到云端控制模型,得到云端识别...
技术分类