天天操2019日本无码网|欧美日韩高清免费播放|亚洲电影一区二区在线观看|91人人精品亚洲热女|欧美亚洲一区无码久久网|亚洲无码一区资源|啪啪视频无码免费|久久高潮无遮在线国产擦|国产一区二区av|91AV成人A级无码

中工娛樂

【一線:360行】語音合成架構(gòu)師:“看到”你的聲音

來源:中工網(wǎng)
2021-10-08 19:38

  

  兩年前的經(jīng)歷讓孫濤至今難以忘懷?!坝幸晃豢姑涝睦蠎?zhàn)士,很懷念已經(jīng)過世的老排長?!?語音合成架構(gòu)師孫濤就和同事錄制了一些老排長在世時的聲音,并通過語音合成技術把老排長留給老戰(zhàn)士的信讀給他聽,老人頓時淚流滿面。

  語音合成廣泛應用于播報、客服、導航、虛擬主播、虛擬主持人等等。語音合成有三大關鍵因素:文本內(nèi)容、發(fā)音人音色和說話的韻律節(jié)奏。發(fā)音人音色的不同在于喉嚨。每個人的喉嚨結(jié)構(gòu)比較固定,如果把它比喻成一個樂器,文本內(nèi)容和韻律節(jié)奏更像是樂譜。語音合成相當于只要掌握了樂器(喉嚨)的基本結(jié)構(gòu),想要合成什么樣的語句,只要提供樂譜(文本內(nèi)容和韻律節(jié)奏)就可以了。

  “只要收集你說的9句話,就能復刻你的聲音”。語音合成架構(gòu)師孫濤自信地對中工網(wǎng)記者說。每天,孫濤要處理大量采集來的聲音。看著高低不平的聲波,就像看著即將亮相的樂譜,人工智能是“演奏家”,而他,就是那個“作曲家”。

  語音合成需要很多環(huán)節(jié),比如聲音的質(zhì)量、錄制時的環(huán)境、數(shù)據(jù)規(guī)整等等,最關鍵的還是如何讓機器通過學習獲得聲音與文本的匹配關系,這是語音架構(gòu)師花費時間最多的地方。并且,語音跟圖像、文本不一樣,它具有時序性和交互性特點,要求系統(tǒng)具有快速響應用戶的能力,這樣,如何更好地完成時序模型系統(tǒng)的設計是考驗一名語音架構(gòu)師是否合格的因素之一。

  “以前客戶服務電話的拒接率很高,大家一聽就知道這不是真人,從情感上就不想交流?!?人工智能的快速發(fā)展,語音合成也搭上了這趟順風車?!罢Z音合成的效果提升以后,已經(jīng)無法分辨接客服電話的是真人還是機器,與客戶溝通的效率也提升了?!睂O濤對中工網(wǎng)記者說,語音合成發(fā)展到現(xiàn)在已經(jīng)進步為個性化的合成,會帶上情感表現(xiàn),甚至還有一些人文關懷的成分?!罢Z音合成發(fā)展的大方向是交互,讓人與人工智能自如地對話。不僅能傳遞信息,也能傳遞情感?!睂O濤滿懷憧憬地說。(中工網(wǎng)記者 吳景斌)

責任編輯:吳景斌

媒體矩陣


  • 全國總工會微信

  • 工人日報客戶端

  • 中工網(wǎng)微信
    ? ? ? ?

  • 中工網(wǎng)微博
    ? ? ? ?

  • 中工網(wǎng)抖音

關于中工網(wǎng) | 版權聲明 | 違法和不良信息舉報電話:010-84151598 | 網(wǎng)絡敲詐和有償刪帖舉報電話:010-84151598
Copyright ? 2008-2026 by m.cccollect.cn. all rights reserved

掃碼關注

全國總工會
微信


中工網(wǎng)微信


中工網(wǎng)微博


中工網(wǎng)抖音


工人日報
客戶端
×