Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
乐器;声学设备的制造及制作,分析技术
  • 本发明提供了一种基于骨架序列的动物异常行为检测方法,属于动物行为检测。首先对采集的动物行为视频进行预处理,通过检测动物目标并获取其边界框位置,然后进行骨架关键点估计,生成动物骨架序列。在此基础上,通过对骨架序列进行时空特征建模,分析动物行为...
  • 本发明涉及图像数据处理技术领域,本发明公开了一种基于视觉的点云图像融合方法;包括从点云数据和图像数据中提取出几何特征和视觉特征,将点云特征点和图像特征点进行特征匹配,将几何特征和视觉特征导入模型架构中的融合点,构建出初始三维模型,对初始三维...
  • 本发明提供一种基于AI大模型的语音识别方法及其系统,语音识别技术领域,本发明首先通过预训练的对抗噪声抑制网络实现噪声环境下的降噪和频段增强,并结合多维度的频谱质量评分为后续处理提供依据,其次,基于元特征向量与预构建的方言热力图库的相似度匹配...
  • 本发明提供了一种基于全局‑局部知识蒸馏的跨域小样本图像分类方法。构建了由全局分支和局部分支构成的分类模型,其中,全局分支以原始图像为输入,用于提取图像的全局特征,局部分支以原始图像的局部块为输入,用于提取该图像的局部特征;在两分支之间,通过...
  • 本发明公开了一种语音信息屏蔽方法及系统、电子设备和电子电气设备,语音信息屏蔽方法包括:获得目标空间内语音信号包含的目标关键信息,目标关键信息包含语音信号的基本声学特征和语义信息;基于目标关键信息,获得语音信号的目标屏蔽声信号以播放,以消除或...
  • 本发明公开了一种基于多特征尺度融合Faster‑R‑CNN的路面裂缝识别及分类方法,具体涉及道路检测技术领域,通过搭载高清摄像头的汽车获取研究区域路面图像数据并进行预处理形成所需的图像数据集;使用ZFNet作为裂缝特征提取模块进行多特征融合...
  • 本申请涉及一种多尺度目标检测方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。该方法包括:提取待测图像的特征图信息;待测图像为包括至少两个不同尺度的目标的图像;基于特征图信息得到对应的图结构;图结构中的每个节点与特征图信息的每个位...
  • 本发明涉及智能调度技术领域,公开了一种基于语音识别的煤矿智能调度方法、装置、设备和介质,该方法包括:采集语音调度音频,基于小波变换对语音调度音频进行降噪处理获得待识别信号;进行语义识别确定语音调度方案并提取调度指数;采集当前任务指数与需求指...
  • 本发明提出了一种适应性背景噪声检测方法,包括:S1、获取属于背景噪声检测区间内的声音信号;S2、对所述声音信号中的每一帧信号进行快速傅立叶转换,估算得到所述声音信号的频谱振幅;S3、对所述声音信号的频谱振幅进行稳态统计分析,计算得到所述声音...
  • 本发明涉及音频水印技术领域,尤其涉及一种抗翻录音频水印嵌入方法、提取方法及装置。所述抗翻录音频水印嵌入及提取方法,首先对音频数据并进行预处理,利用快速傅里叶变换,将原始音频信号从时域转换为频域;然后构建水印信息,基于频域将水印比特嵌入特定频...
  • 本发明涉及人工智能、信息安全、金融科技及数字医疗领域,公开了动态声纹认证方法、装置、计算机设备及存储介质,可应用于线上交易、医疗服务系统中的用户身份认证。本发明通过实时采集语音,在用户无感知的情况下,能够自动完成声纹认证与更新,无需用户主动...
  • 本申请公开了一种当归质量定性和定量评估方法及相关装置,涉及当归质量评估技术领域,该方法包括:在建立定性判别模型和定量回归模型时,以当归切片样品的不同切面在不同波段的高光谱图像作为多种第一特征数据,以当归粉末样品在不同波段的高光谱图像作为多种...
  • 本发明涉及一种基于多模态思维链的电影人声配音方法,包括以下步骤:构建带有CoT标注的电影配音数据集;整合多语种语音库、动画数据集和多说话人数据集,训练TTS语音合成模块和V2S视频配音模块;对含有噪声和语义不清楚的数据进行去除;训练多模态视...
  • 本发明涉及语音处理技术领域,可应用于金融科技、医疗健康等业务场景中,公开了一种语音信号中语音播报去除方法、装置、设备及介质,包括:建立预存语音播报样本及其语音特征库,将目标语音分割为多个语音分段,基于分段起始点和预存语音时长生成窗口语音段,...
  • 本发明涉及图像处理和模式识别技术领域,具体为一种基于Hu矩特征的高效图像分类系统及方法,包括:图像输入模块:负责接收待分类图像,支持多种图像格式;图像预处理模块:对输入图像进行预处理,包括灰度化、归一化、去噪操作,以提高特征提取的鲁棒性;特...
  • 本发明公开了一种基于改进YOLOv8n网络的仓储粮虫检测方法,包括以下步骤,S1:数据采集和预处理;S2:模型架构选择;S3:仓储粮虫识别模型的训练;S4:模型评估;S5:待检测图像的获取;S6:将预处理后的待检测仓储粮虫图像输入训练后的仓...
  • 本申请涉及一种自适应情感驱动的音色克隆文字转语音方法及装置。将目标文本按句切分并提取语义特征,将每个句子拆分为目标音素序列;将参考文本拆分为参考音素序列,参考音素序列分别与每个目标音素序列拼合得到组合音素序列,对参考音频进行处理,得到参考语...
  • 本发明公开了一种消毒供应中心监测数据智能分析系统及方法,涉及数据检测技术领域,通过数据采集模块采集温度相关数据和湿度相关数据,然后利用数据处理模块计算得出综合温度系数以及综合湿度系数,并通过异常分析模块计算得出综合指标判定系数分别与设定的温...
  • 本发明公开了一种基于大模型的声纹识别方法、装置、设备及介质,其中的方法通过使用Transformer架构的自动语音识别模型处理输入音频,输出带时间戳的字符级概率序列。将所述字符级概率序列转换为初始文本,输入预训练的语言模型进行语义分句,获得...
  • 本发明属于能源服务调度技术领域,具体公开了一种汽车充换电服务用运营管理平台,包括:数据获取模块,用于获取服务数据;队列估算模块,通过构建的预测模型计算未来时间段下的期望等待时间;定价与需求映射模块,用于构建挂牌价与时隙的关系曲线;车主敏感度...
技术分类