Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
乐器;声学设备的制造及制作,分析技术
  • 本申请涉及一种图像处理方法、装置、设备、可读存储介质和程序产品。所述方法包括:获取电路板图像,所述电路板图像是对目标电路板进行图像采集得到的;将所述电路板图像输入目标检测模型中,得到所述目标电路板中各元器件在所述电路板图像中的位置信息以及器...
  • 本申请提供了一种语音信号处理方法、装置、电子设备及存储介质;方法包括:对待增强语音信号进行特征提取,得到待增强语音特征;对待增强语音特征循环进行多次特征变换,得到语音特征向量;采用跳转连接方式对语音特征向量进行特征映射,得到语音映射特征;对...
  • 本发明提供一种基于图像的轻量化车辆识别方法,包括接受车辆图像;标准化车辆图像的尺寸与通道;利用经训练的深度学习模型对标准化的车辆图像内所有车辆的边界框和类别进行标注;将标注完成的车辆图像转化为原图像大小后进行输出。本发明的有益效果是提出的轻...
  • 本发明公开了一种针对语音生成式大模型的隐私信息脱敏方法及系统,涉及人工智能技术领域,通过对输入语音数据进行离散化处理并注入高斯噪声扰动敏感特征,结合三阶段训练构建跨模态语音生成模型,同时在输出阶段应用跨模态隐私增强机制实时检测并模糊化敏感信...
  • 本发明涉及语音识别技术领域,公开了一种基于变分自编码器的说话人无关发音逆推方法和系统,包括:采集语音声学数据和发音运动数据;根据语音声学数据训练语音变分自编码器,利用语音变分自编码器,从语音声学数据中抽取基于声学特征的内容嵌入信息和说话人身...
  • 本发明公开了一种大幅遥感影像的地物识别方法。本发明对大幅遥感影像进行重叠裁剪得到图片切片,对图片切片实例分割得到重叠建筑实例,根据重叠建筑实例确定所属图片切片,根据所属图片切片的索引确定邻域范围内的重叠集合和独立目标,对所述重叠集合筛选,得...
  • 本发明公开了一种基于全直径岩心端面图像的深层煤岩割理发育程度评价方法,首先获取全直径岩心端面图像,并对岩心端面图像进行光照平衡处理,包括图像亮度计算和亮度均衡;然后设定岩心端面图像阈值,并根据阀值将灰度图像转换为二值图像;利用二值图像计算煤...
  • 本发明公开了一种图像相似度匹配方法、设备及存储介质,该方法包括:获取待测图像和标准图像,将所述待测图像和所述标准图像分离为颜色通道图像,确定所述颜色通道图像的直方图相似度;若所述直方图相似度高于第一预设阈值,则提取出所述颜色通道图像中的字符...
  • 本发明提出一种用于长语音的大模型推理方法和装置,包括:获取已标记训练标签的语音训练信号,通过信息提取模块对语音训练信号进行编码,得到语音训练信号的原语音表示,依据原语音表示的文本含量和帧间相似度,对原语音表示进行压缩合,得到压缩语音表示;将...
  • 本发明属于道路作业车驾驶辅助系统技术领域,特别提供了一种基于道路病态标记的作业车辆辅助控制方法,作业车辆的图像采集单元装配于作业车辆车头的顶部,作业车辆辅助控制方法的具体步骤包括采集图像信息;图片拼接;病态特征识别;驾驶室人工确认病态特征识...
  • 本申请涉及计算机领域,提供一种语音数据的处理方法、电子设备及存储介质,该方法包括:获取待处理的语音数据的输入量化特征和权重变换矩阵;获取权重变换矩阵的权值公共因子;基于权值公共因子,对权重变换矩阵中的权值进行取整处理,得到目标权重变换矩阵;...
  • 提供了一种音频重建方法和设备,用于通过机器学习来重构从比特流获得的解码参数或音频信号来提供改进的声音质量。该音频重建方法包括:通过解码比特流获得当前帧的多个解码参数;基于包括在所述多个解码参数中的第一参数,确定包括在所述多个解码参数中并与所...
  • 本发明公开了一种水体变化区域确定方法及装置,属于图像分析领域;方法包括:对第一时段的第一水域图像和第二时段的第二水域图像分别进行N次特征提取,得到第一水域图像对应的N张第一浅层特征图像和第二水域图像对应的N张第二浅层特征图像;将每次特征提取...
  • 本发明公开了一种目标检测系统、训练方法、目标检测方法及电子设备,属于计算机视觉技术领域;在采用目标检测模块对待检测图像进行目标粗检测的基础上,进一步采用区域补充模块基于待检测图像的中心度图来确定候选的目标区域,并从待检测图像中裁剪出来,通过...
  • 本公开提供了一种多维感知目标区域的状态信息的方法、装置、设备、介质、程序产品,该多维感知目标区域的状态信息的方法,包括:响应于接收到由终端发送的目标点位的地理位置信息、终端相对于目标点位的朝向信息和终端对目标点位采集得到的目标图像,基于目标...
  • 一种方法和装置,包括:接收包括文本分量的序列的文本输入。使用持续时间模型来确定文本分量的相应持续时间。基于文本分量的序列来生成第一语谱集。基于第一语谱集和文本分量的序列的相应持续时间来生成第二语谱集。基于第二语谱集来生成语谱图帧。基于语谱图...
  • 本申请涉及一种图像生成模型处理及图像生成方法、装置、计算机设备、存储介质和计算机程序产品。所述方法涉及人工智能技术,包括:获取样本图像和针对样本图像中图像对象的描述文本;通过待训练的图像生成模型,分别提取样本图像的图像特征以及描述文本的文本...
  • 本申请提供了一种业务流程自动化管理方法、系统和介质。该方法包括:获取预设时间段内与业务流程终端相关联的终端采集信息,并提取业务关联数据进行符合性验证,判断完结业务流程状态,若为不符合,获取完结业务流程的业务运行图谱并提取业务运行数据进行处理...
  • 根据本公开的实现,提出了一种用于语音增强的方案。在该方案中,至少指示输入音频信号在不同频率上随时间变化的强度的目标时频表示被获得。输入音频信号包括语音分量和噪声分量。输入音频信号的频率相关性信息和时间相关性信息基于目标时频表示被确定。目标特...
  • 本申请公开了一种音频信息处理方法,可应用于自动驾驶领域和车载场景。该方法对音频信号进行采样操作,得到音频帧信息,音频帧信息包括当前帧数据;对当前帧数据进行基于分类的预处理操作,得到当前帧数据对应的第一音频帧数据;其中,基于分类的预处理操作包...
技术分类