“所以,计算机声音的本质是一串二进制数,是不同排列组合的1和0。这叫做数字信号。”

“最理想的语音合成,不是组合音节,而是直接组合数字信号。”

楼清焰:“我说的对吗。”

谢晋实实在在地惊讶了。

他一直以为楼清焰是个不学无术的纨绔,就算所有人都搞懂了计算机原理,他也不可能搞懂的那种。

没想到他真的懂。

楼清焰还没说完,他继而道:“理论上,AI软件通过深度学习,可以掌握数字信号的规律,构建一个数据模型,再基于模型生成语音。”

“但是,这需要一个大前提 机器学习算法能直接从数字层做特征提取。”

他问道:“能吗?”

谢晋服了,这人为啥总是一下子问到最关键的地方。

“现在确实没这个技术。我们设计的特征提取算法,主要瞄准声音的波形表现,频率、相位这些。”他简单地说。

楼清焰又说:“不止缺这一个技术吧。做了特征提取,知道怎么归纳总结吗?知道怎么训练模型吗?会写算法吗?设想过这个计算量有多庞大吗?”

谢晋:“……”

楼清焰发觉有点说过了,遂拍拍他肩膀,鼓励道:“不过你们已经做得很好了,能达到这个程度非常了不起……嗯,下一步工作是什么?”

谢晋:“……”看出来你是在敷衍了。

“软件的构造有点臃肿,只有在工作站上才能流畅运行,下一步先考虑优化问题。”