和软件唱歌不一样,语音合成不是简单的声音排列组合,还需要自然语言处理,识别文字语义等等。现在,程序识别出了某句话的语义,根据语义配置了合理的起伏、韵律和声调,然后播放出来。
逼真程度之高,就像是有一个真人在手机里说话一样!
程序的表达不一定最动听,但绝对是符合语境的,让人找不出违和感。
换句话说,软件不具有顶尖配音演员的实力,但是却具有普通配音演员的能力。
邵逸明强自镇定,安慰自己说:平平无奇,没有灵魂。别怕别怕。
机器终归是机器,就算能配音,也只是套路化模仿人的语气,配不出有力量的情感表达。就像是演技拙劣的演员非要去演戏
他随便选了一个音色,点击确认,来到了下一个页面——情感选择。
下面有四个滑条,分别是喜悦、激动、愤怒、恐惧。
邵逸明滑动这四个滑条的时候,感觉异常不真实,就好像在滑动图片的rbg滑条一样。
滑动之后,实时生成的语音果然出现了微妙的语气变化。
这一页下面还有一样小字:“登陆电脑客户端,调节更多情感维度,还可以自行设计维度模型,保存参数建立情感滤镜。”
邵逸明犹豫了一下,没有理会,点击确定来到下一个页面。
这一步的名字叫“音频液化”,选择一个参数,在屏幕上生成一条曲线,手指涂抹就可以改变曲线的形状,纵轴是该项参数,横轴是时间。
音量是一条直线,用手指向上抹出一个小山包,山包对应的时间段的音量就会发生变化。