买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:杭州字棒棒科技有限公司
摘要:本发明提供一种基于改进型TTS技术的书法教学辅助方法及系统,涉及教学辅助技术领域,所述方法包括:获取教学文本内容;利用基于自注意力机制的TTS模型对所述教学文本内容进行分析处理,并识别所述教学文本内容的关键信息;根据所述教学文本内容和通过自注意力机制识别出的所述关键信息,动态调整生成语音的特性;根据调整后的语音特性参数,利用所述基于自注意力机制的TTS模型生成每个词汇或短语的语音,并对所述每个词汇或短语的语音进行拼接,得到一个完整的教学语音。本发明能够大幅提高书法教学的效率和质量,同时为学生提供更加个性化、互动性强的学习体验。
主权项:1.一种基于改进型TTS技术的书法教学辅助方法,其特征在于,包括:获取教学文本内容;利用基于自注意力机制的TTS模型对所述教学文本内容进行分析处理,并识别所述教学文本内容的关键信息;其中,所述关键信息包括词汇或短语;其中,所述利用基于自注意力机制的TTS模型对所述教学文本内容进行分析处理,并识别所述教学文本内容的关键信息,包括:对所述教学文本内容进行分析,并将所述教学文本内容中的每个词进行向量转换,得到每个词的向量;根据所述每个词的向量,利用基于自注意力机制的TTS模型提取所述教学文本内容的关键信息;计算所述关键信息中每个词汇或短语的注意力权重;其中,所述对所述教学文本内容进行分析,并将所述教学文本内容中的每个词进行向量转换,得到每个词的向量,包括:通过自然语言处理技术将所述教学文本内容转换为向量表示: ;其中,是文本中的第i个词,是该词的向量表示;根据所述教学文本内容和通过自注意力机制识别出的所述关键信息,动态调整生成语音的特性;根据调整后的语音特性参数,利用所述基于自注意力机制的TTS模型生成每个词汇或短语的语音,并对所述每个词汇或短语的语音进行拼接,得到一个完整的教学语音;所述对所述每个词汇或短语的语音进行拼接合成,得到一个完整的教学语音,包括:通过神经网络模型合成最终的语音输出,其中,该合成过程如下简化公式用表示: ;其中,是输入的文本,是经过注意力权重调整后的语音特性参数集合,O是最终的语音输出;其中,所述动态调整生成语音的特性,包括:语速的加快或减慢、音调的升高或降低以及适时的停顿,以强调教学内容的重点;其中,所述根据所述教学文本内容和通过自注意力机制识别出的所述关键信息,动态调整生成语音的特性,包括:根据所述注意力权重,对每个词汇或短语的语音特性进行动态调整,得到调整后的语音特性参数:设定一个基线语音特性参数集,其中,、、分别表示语音特性参数语速、音调和停顿;根据注意力权重对每个词汇或短语的语音特性参数进行调整如下: ;其中,,,和是根据注意力权重调整语音特性的函数,通过训练数据学习得到;使用训练好的神经网络模型将每个词汇或短语的音素序列转换为语音波形: ;其中,phonemei表示为第i个词汇或短语的音素,waveformi表示第i个词汇或短语的音素转换得到的语音波形;将所有生成的语音波形按顺序拼接在一起,形成完整的语音波形输出: ;然后根据所述完整的语音波形生成最终的完整的教学语音音频;其中,在得到一个完整的教学语音之后,所述方法还包括:基于学生的反馈信息,进一步调整教学内容和语音输出的特性。
全文数据:
权利要求:
百度查询: 杭州字棒棒科技有限公司 一种基于改进型TTS技术的书法教学辅助方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。