Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
乐器;声学设备的制造及制作,分析技术
  • 本申请涉及一种自适应情感驱动的音色克隆文字转语音方法及装置。将目标文本按句切分并提取语义特征,将每个句子拆分为目标音素序列;将参考文本拆分为参考音素序列,参考音素序列分别与每个目标音素序列拼合得到组合音素序列,对参考音频进行处理,得到参考语...
  • 本发明公开了一种消毒供应中心监测数据智能分析系统及方法,涉及数据检测技术领域,通过数据采集模块采集温度相关数据和湿度相关数据,然后利用数据处理模块计算得出综合温度系数以及综合湿度系数,并通过异常分析模块计算得出综合指标判定系数分别与设定的温...
  • 本发明公开了一种基于大模型的声纹识别方法、装置、设备及介质,其中的方法通过使用Transformer架构的自动语音识别模型处理输入音频,输出带时间戳的字符级概率序列。将所述字符级概率序列转换为初始文本,输入预训练的语言模型进行语义分句,获得...
  • 本发明属于能源服务调度技术领域,具体公开了一种汽车充换电服务用运营管理平台,包括:数据获取模块,用于获取服务数据;队列估算模块,通过构建的预测模型计算未来时间段下的期望等待时间;定价与需求映射模块,用于构建挂牌价与时隙的关系曲线;车主敏感度...
  • 本申请实施例公开了一种音频中的违禁词处理方法、装置、电子设备及计算机可读存储介质,该方法包括:获取音频数据;对所述音频数据进行解码,得到原始音频格式的音频数据;对所述原始音频格式的音频数据进行分隔,得到多个音频片段;以及基于违禁词处理模型,...
  • 本申请公开一种车端控制模型的优化方法、装置、设备及介质,涉及车辆技术领域,该方法包括获取用户的语音信息;对所述语音信息进行识别,得到文本信息;将所述文本信息输入到车端控制模型,得到车端识别结果,将所述文本信息输入到云端控制模型,得到云端识别...
  • 本发明涉及垃圾分类技术领域,提供了一种智能垃圾分类方法、系统及设备,该方法包括:获取垃圾图像数据集;获取基于区域感知的定位损失、多维度图像特征融合的分类损失以及基于注意力引导的置信度损失,并根据定位损失、分类损失以及置信度损失构建损失函数;...
  • 本发明公开了一种基于跨模态特征投影学习的分类方法、装置、终端及存储介质。方法包括:获取目标样本集,所述目标样本集中包括多组样本子集,所述目标样本集为小样本图像集;基于所述目标样本集获取多个类别特征图,每个所述类别特征图对应一种类别;接收目标...
  • 本申请公开了一种语音增强方法、装置、电子设备及计算机可读存储介质,其中,该方法包括:获取目标的视频数据和原始音频数据,其中,视频数据是获取原始音频数据时对目标拍摄得到的;利用视频数据提取视觉特征,以及利用原始音频数据提取语义特征和语音特征;...
  • 本发明提供一种多维声学参数与情感场景动态分析的声音标准化评测系统,旨在实现对语音表现的结构化、客观化评估;所述系统包括音频采集模块、音频处理模块、标准评测模块和整合处理模块;音频处理模块对原始语音数据进行降噪、预加重、采样率调整、分帧及切片...
  • 本披露公开了地图数据检测方法、装置及存储介质,该方法包括获取待检测的地图矢量数据,地图矢量数据包括对应相同目标区域的第一地图数据和第二地图数据;根据检测目标对地图矢量数据进行预处理,得到目标俯瞰图;将目标俯瞰图输入到与检测目标相对应的图像检...
  • 本申请提供了一种针对副语言的数据增强方法、装置、计算机设备和存储介质。首先获取原始副语言语音集与原始语言语音集,接着将原始副语言语音集中的副语言训练语音输入语音重建模型得到重建语音,随后依据重建语音与副语言训练语音的相似度,将不满足设定要求...
  • 本发明涉及图像处理领域,具体涉及一种CNC加工中心用工件特征识别方法,方法包括:获取待加工的工件图像各像素点的LAB值以及各像素点的梯度值,遍历像素点的各邻域窗口的像素点分布复杂度,选择像素点分布复杂度最大对应的邻域窗口作为像素点的目标窗口...
  • 本发明公开了一种基于机器视觉的仓库安全实现方法及系统,属于仓库监管技术领域,用于解决现有的仓库安全监管方法易出现监控死角,且在货物流动过程中可能产生新的监控死角,给仓库监管带来安全隐患的技术问题。方法包括:获取仓库内布设的若干摄像头的监控画...
  • 本发明涉及图像处理技术领域,公开一种基于多源数据融合的图像处理方法,包括:步骤1、获取多模态图像数据,将各模态的数据表示为特征矩阵,所述特征矩阵包含模态的特征维度和样本数量,且对特征矩阵进行标准化与归一化处理,同时,对特征矩阵进行降噪处理,...
  • 本发明涉及声纹识别技术领域,公开了一种面向短语音与复杂噪声的陆空通话说话人识别方法,通过自适应滤波器结合最小均方算法动态抑制背景噪声,提升语音信号质量;采用多尺度特征融合技术,结合短时傅里叶变换、滤波器组能量特征及多尺度卷积,引入随机时间与...
  • 本发明公开了一种听力考试内容的预先检测方法及装置,方法包括:拾取听力考试内容的前置部分、听力实体部分中的第一分界标签及/或后置部分;对前置部分、第一分界标签及/或后置部分进行语音识别,以生成语音识别结果;根据所述语音识别结果、预获取的所述前...
  • 本发明公开了一种基于遥感数据的灌木生物量评估预测方法,涉及灌木生物量预测技术领域,通过获取目标区域的预处理遥感数据;并获取目标区域的环境信息,并基于目标区域的环境信息分析目标区域的灌木环境相似系数;根据灌木环境相似系数选择目标区域灌木生物量...
  • 本实用新型属于有机固废资源化处置技术领域,主要涉及一种集烘干和液化脱卤的分步式废塑料热解制油系统,包括预处理装置,所述预处理装置连接有烘干装置;烘干装置连接有液化脱卤装置,液化脱卤装置连接有热解装置,热解装置连接有油气分离装置,油气分离装置...
  • 本公开提供了一种基于大模型生成音频的方法、装置、电子设备及存储介质,涉及音频合成、大模型等人工智能技术领域。具体实现方案为:在大模型生成文本的过程中,获取实时生成的文字;基于所述文字,采用预先训练的音频生成模型,依次获取所述文字的各音频单元...
技术分类