语音合成架构师:“看到”你的声音

两年前的经历让孙涛至今难以忘怀。“有一位抗美援朝的老战士,很怀念已经过世的老排长。” 语音合成架构师孙涛就和同事录制了一些老排长在世时的声音,并通过语音合成技术把老排长留给老战士的信读给他听,老人顿时泪流满面。

两年前的经历让孙涛至今难以忘怀。“有一位抗美援朝的老战士,很怀念已经过世的老排长。” 语音合成架构师孙涛就和同事录制了一些老排长在世时的声音,并通过语音合成技术把老排长留给老战士的信读给他听,老人顿时泪流满面。

语音合成广泛应用于播报、客服、导航、虚拟主播、虚拟主持人等等。语音合成有三大关键因素:文本内容、发音人音色和说话的韵律节奏。发音人音色的不同在于喉咙。每个人的喉咙结构比较固定,如果把它比喻成一个乐器,文本内容和韵律节奏更像是乐谱。语音合成相当于只要掌握了乐器(喉咙)的基本结构,想要合成什么样的语句,只要提供乐谱(文本内容和韵律节奏)就可以了。

“只要收集你说的9句话,就能复刻你的声音”。语音合成架构师孙涛自信地对中工网记者说。每天,孙涛要处理大量采集来的声音。看着高低不平的声波,就像看着即将亮相的乐谱,人工智能是“演奏家”,而他,就是那个“作曲家”。

语音合成需要很多环节,比如声音的质量、录制时的环境、数据规整等等,最关键的还是如何让机器通过学习获得声音与文本的匹配关系,这是语音架构师花费时间最多的地方。并且,语音跟图像、文本不一样,它具有时序性和交互性特点,要求系统具有快速响应用户的能力,这样,如何更好地完成时序模型系统的设计是考验一名语音架构师是否合格的因素之一。

“以前客户服务电话的拒接率很高,大家一听就知道这不是真人,从情感上就不想交流。” 人工智能的快速发展,语音合成也搭上了这趟顺风车。“语音合成的效果提升以后,已经无法分辨接客服电话的是真人还是机器,与客户沟通的效率也提升了。”孙涛对中工网记者说,语音合成发展到现在已经进步为个性化的合成,会带上情感表现,甚至还有一些人文关怀的成分。“语音合成发展的大方向是交互,让人与人工智能自如地对话。不仅能传递信息,也能传递情感。”孙涛满怀憧憬地说。

来源:中工网

内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/87430.html

(0)

相关推荐

  • 浙江阿里入股VR游戏公司Sandbox VR

    近日,Sandbox VR宣布完成了3700万美元新一轮融资,由a16z领投,阿里巴巴和Craft跟投;截止目前,Sandbox VR外部融资总额达到约1.2亿美元。据了解,Sandbox VR是一家线下沙盒虚拟现实游戏公司,在商场和影院提供线下街机式VR体验的体验中心。(阿尔法工场)

    科技 2021年11月17日
  • 神回复:小米6复刻版真来了?

    机友们好啊,又到了愉悦的周一问答环节。

    科技 2021年11月29日
  • 晚上常醒来的原因,晚上睡觉醒来多次是什么原因

    随着社会的不断的进步,人们的生活习惯也在不断的改变,很多年轻人的“夜生活”非常丰富,每天晚上睡觉的时间也在不断缩短。

    生活 2021年12月25日
  • 从商业启示——提高孩子的同理心

    今天下午下班回家,听孩子奶奶说,她在学校踢了同学。我当时想着不会是跟人到家了吧,会不会自己孩子也被打了啊?后来经过询问,多方了解才知道,因为班上男同学想要玩孩子的可爱橡皮擦,但孩子不给,小男孩就一直缠着孩子,最后孩子不耐烦,就踢了一脚,这一脚好巧不巧的差点踢着小男孩的裆部,当时小男孩就哭了,放学后老师问了孩子情况,小孩说不疼了,也是害怕给人家踢出个好歹,就跟对方家长联系,对方回复说孩子回家,发现大腿内侧都青了,家长说明天如果孩子还有什么不舒服,该怎么办就要怎么办。当时我心里都已经害怕了,幸亏不是踢到重要部位,不然都不知道如何赔偿了,这关乎小孩的一生啊!现在教育孩子真的好难!说到底,导致孩子间的摩擦、打闹,都是因为孩子与孩子之间缺少同理心。

    生活 2021年11月24日
  • 央行:明年3月起,微信、支付宝个人收款码将不能用于经营收款

    据北京日报报道,根据中国人民银行官网发布《中国人民银行关于加强支付受理终端及相关业务管理的通知(银发〔2021〕259 号)》,明年 3 月 1 日起,微信、支付宝个人收款码不能用于经营收款。

    科技 2021年11月26日