Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于快速傅里叶变换的藏语语音数据生成方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

摘要:本发明公开了一种基于快速傅里叶变换的藏语语音数据生成方法,该方法通过语音数据采集并在时域上应用汉明窗口函数以减少频谱泄漏,使用快速傅里叶变换算法将采集的音频信号从时域转换为频域,以实现高效的频率分析,设计巴特沃斯带通滤波器对频域中的语音数据进行滤波,以提取特定频率成分,利用余弦距离计算滤波前后信号的相似性,用以评估滤波效果,采用梯度下降算法搜索并优化滤波器参数,通过迭代优化,调整各参数以达到最佳滤波效果,使用快速傅里叶逆变换将最终的频域信号转换成时域信号,生成高质量的音频文件。本发明方案通过控制时频转换和滤波过程中的参数,有效提高了藏语语音数据的生成质量和准确性,大幅减少数据采集的成本。

主权项:1.一种基于快速傅里叶变换的藏语语音数据生成方法,其特征在于,所述方法包括以下步骤:步骤S1:获取藏语语音数据,使用Python,MacOS系统自动化软件和机器人流程自动化软件RPA设计自动化爬虫代码与流程,采集卫藏、安多、康巴三大藏语方言语音样本;步骤S2:对语音数据进行加窗预处理,按窗口大小分割音频,控制窗口之间的重叠程度,在时域上对每个片段应用汉明窗函数,并对语音样本进行端点检测以去除静音段;步骤S3:频域信号变换,应用短时快速傅里叶变换将藏语时域语音信号转换为频域信号,将长度为的序列分解成长度为的两个子序列,每个子序列递归地应用相同的分解步骤,进行离散傅里叶变换计算,并将子序列的离散傅里叶变换结果进行组合,得到经过短时快速傅里叶变换的完整的频域信号;步骤S4:对频域信号进行滤波,设计自适应频域带通滤波器对频域信号进行滤波处理,以提取所需频率范围内的信号;步骤S5:滤波器参数迭代优化,在预设迭代次数内,根据滤波前后信号的相似性,使用梯度下降算法动态调整滤波器参数;步骤S6:藏语音频数据的生成,迭代结束后,输出最终优化的滤波器参数和滤波后的频域信号,对最终滤波后的频域信号进行傅里叶逆变换,将频域信号转换为时域信号,生成新的藏语语音数据,并将其写入音频文件。

全文数据:

权利要求:

百度查询: 电子科技大学 一种基于快速傅里叶变换的藏语语音数据生成方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。