论百度地图如何用AI让你和“汤唯”一路相伴_IT

论百度地图如何用AI让你和“汤唯”一路相伴

深圳新闻网

2019-01-17 09:23:13

0次

　　自百度地图上线汤唯导航语音之后，已经有越来越多的人爱上了出行时和汤唯“对话”，但是你知道这么迷人的导航语音是怎样“炼成”的吗？ 在百度地图最近推出的“解密之作”——《“女神音 ” 的诞生》 中，来自百度地图的“技术大神”就亲自为我们解答了这个疑惑。

　　“女神是在哪里录制的?”“语音包是一个字一个词录的吗?”“地图中的所有地名都要念一遍吗?”关于导航语音的录制，公众有着各种各样的好奇和困惑。正如视频中所说，日常陪伴我们的导航语音背后，真的是“大有学问”呢。

　　一、汤唯的录制过程是怎样的？

　　那些有趣的“语音彩蛋”来自哪里？

　　公众对导航语音的录制过程可是充满了“奇思妙想”，甚至有人开玩笑地表示“汤唯是不是自己拿着手机录的呢。”其实不然，百度地图有专业的录音棚，且相比大部分音乐录音棚规格更高。 专业的录音人员，可以对录音质量做全面把控，为用户打造更加真实的声音。而在一些语句的设计和朗读上，汤唯也会有自己的理解，声调的抑扬顿挫和语速的节奏掌握，都能收放自如。

　　对于语音中的“小彩蛋”，这是独立于基础语音，专门为一些特定场景录制的 。其中包括很多录音时女神的自由发挥，所以每一句彩蛋都称得上是“汤唯出品”。彩蛋的存在，让每位明星的语音都拥有了不同的“个性”。

论百度地图如何用AI让你和“汤唯”一路相伴

图示：工程师谈汤唯录制情况

　　二、明星需要将地图中的所有地名和提示语都念一遍吗？

　　不需要的，明星录制语音的目的是获取其声音特点 ，不需要把所有地名和提示语都念一遍。录制语句一般分为两种：一种是汤唯直接说给大家听的 ，比如“大家好，我是汤唯”;另一种是用来训练语音合成模型的句子 。大家在使用过程中听到的大部分语音，是通过机器学习合成出来的，不是都来自明星本人录制的呦。所以，明星本人的录制量并不是很大。

论百度地图如何用AI让你和“汤唯”一路相伴

　　图示：工程师解读语音录制中的语句类型

　　三、百度地图有什么“黑科技”，可以用汤唯的声音播报出来的地图上各种地点名称等信息？

　　对于地图上各种无法预知的提示语句，比如没见过的地名，可通过终端实时计算实现用汤唯的声音播报。 由于声音和文字，对于机器而言都是数字化的。语音合成模型可建立声音和播报内容两组数字之间的关系，通过一系列的计算，将播报内容的输入转化为声音的输出。在学习过程中，会建立一个神经网络模型 ，学习汤唯的声音特征和播报内容之间的对应关系。在合成时，它就可以读取导航语句，用汤唯的声音朗读出来了。

　　而对于一些固定的导航提示语，可以通过计算密集的合成方法，将没有录制到的内容合成出来。 这一技术合成的语音质量非常高，通常可以“以假乱真”。区别于地名和街道名，导航提示语比较固定且使用频率较高。因此对于这部分常用内容，百度地图可以通过AI技术预估合成进语音里，大大减轻了终端的计算压力。此次上线的汤唯导航语音自然又真实地还原了女神的“好声音”，难怪解密视频中不少公众都误以为是汤唯“一句一句录的”，甚至是“一个字一个字录的”。

论百度地图如何用AI让你和“汤唯”一路相伴