买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:武汉交通职业学院
摘要:本发明提供了一种户外直播环境杂音消除方法、介质及系统,属于户外直播技术领域,包括:首先通过摄像头和麦克风采集主播的面部动作和混合音频信号。然后建立主播嘴型运动与语音信号的映射关系,利用嘴型识别结果估计目标语音的时间段和强度变化。接下来,对混合音频进行频谱分析,结合目标语音的时间强度信息,采用语音分离算法从每个时间帧中分离出目标语音的频率分量。通过差异对比不断调整语音分离算法的参数,以增强从混合信号中分离出的目标语音质量。最后,对分离出的目标语音进行滤波和增强处理,去除背景噪声的影响,提高语音的清晰度,从而得到经过全面增强的目标语音信号,实现在户外直播场景下对主播语音的杂音消除处理。
主权项:1.一种户外直播环境杂音消除方法,其特征在于,包括以下步骤:S10、通过摄像头捕捉主播的面部和嘴部动作,采用计算机视觉算法进行嘴型识别和跟踪;S20、通过麦克风或其他音频采集设备,采集包含目标语音和背景噪声的混合音频信号,所述目标语音为主播说话声音;S30、建立主播嘴型运动与语音信号的映射模型,利用主播嘴型识别结果估计目标语音的时间段和强度变化;S40、将混合音频信号分成多个短时间帧,对每个时间帧进行频谱分析,得到频率分量;S50、根据目标语音的估计时间段和强度变化,结合语音分离算法从每个时间帧内分离出目标语音的频率分量;S60、将分离出的目标语音频率分量与采集的混合音频信号进行差异对比,根据差异调整所述语音分离算法的参数;S70、利用调整后的语音分离算法从混合音频信号中重新分离出增强的目标语音频率分量;S80、对增强的目标语音频率分量进行合成滤波,去除背景噪声的影响,得到滤波后的目标语音;S90、将滤波后的目标语音进行语音增强处理,提高语音的清晰度,输出经过增强处理的目标语音信号,用于户外直播内容输出。
全文数据:
权利要求:
百度查询: 武汉交通职业学院 一种户外直播环境杂音消除方法、介质及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。