系統(tǒng)下載、安裝、激活,就到系統(tǒng)天地來(lái)!

Windows/iOS/Android如何將文字轉(zhuǎn)語(yǔ)音

作者:系統(tǒng)天地 日期:2019-01-26

說(shuō)到文字轉(zhuǎn)語(yǔ)音TTS(Text To Speech),它雖然沒(méi)有語(yǔ)音識(shí)別熱門(mén),但也應(yīng)該算是語(yǔ)音識(shí)別技術(shù),乃至AI技術(shù)的一個(gè)實(shí)用領(lǐng)域。在生活的很多場(chǎng)景中我們都會(huì)遇到不方便用眼閱讀的情況,無(wú)論是身處顛簸的公交車(chē)還是自己開(kāi)車(chē),無(wú)論是晨跑鍛煉的時(shí)候還是晚上熄燈睡覺(jué)的時(shí)候,我們都不方便“看”,眼花的老年人或一些視力障礙人士,更是需要機(jī)器來(lái)輔助閱讀文本。在這些情況下,用耳朵“聽(tīng)”就成為我們?nèi)找嬖鲩L(zhǎng)的需求。喜馬拉雅FM、蜻蜓FM等有聲電臺(tái)能夠在移動(dòng)互聯(lián)網(wǎng)時(shí)代異軍突起就是很好的證明。

 

Windows/iOS/Android如何將文字轉(zhuǎn)語(yǔ)音00

 

我們這個(gè)時(shí)代不僅是一個(gè)越來(lái)越需要“聽(tīng)”的時(shí)代,同時(shí)也是一個(gè)越來(lái)越追求個(gè)性化的時(shí)代。大家要聽(tīng)自己想聽(tīng)的內(nèi)容,傳統(tǒng)廣播電臺(tái)那些已經(jīng)錄制好的固定節(jié)目顯然無(wú)法滿足個(gè)性化的需求,更不要說(shuō)一些特殊需求的人群可能需要閱讀郵件、文件等內(nèi)容了。在以前,想聽(tīng)自己喜歡的內(nèi)容,成本還是比較高的,無(wú)論是故事還是新聞,都需要有專門(mén)的播音員演播,人力成本很高。我們?cè)谝纛l平臺(tái)上總是只能找到比較熱門(mén)的小說(shuō)與故事,對(duì)于個(gè)性化的內(nèi)容,追求流量的平臺(tái)依然無(wú)法滿足我們。

好在隨著語(yǔ)音識(shí)別技術(shù)的發(fā)展,這一切正在發(fā)生改變,也許“聽(tīng)”的時(shí)代已經(jīng)離我們不再遙遠(yuǎn)。

 

○系統(tǒng)級(jí)應(yīng)用

文字轉(zhuǎn)語(yǔ)音的功能,最早研制出來(lái)是為了服務(wù)于殘障人士。早年的朗讀功能只能朗讀簡(jiǎn)單的單詞,比如為用戶朗讀標(biāo)題欄菜單與鼠標(biāo)右鍵菜單等等。隨著操作系統(tǒng)的更新,系統(tǒng)自帶的朗讀功能越來(lái)越強(qiáng)大?,F(xiàn)在,無(wú)論是Windows系統(tǒng)還是iOS系統(tǒng),其自帶的朗讀功能就已經(jīng)可以為我們朗讀完整的文章了。此外在這兩個(gè)系統(tǒng)以及Android系統(tǒng)中,也有一些可以支持整個(gè)系統(tǒng)的語(yǔ)音合成應(yīng)用。

 

●Windows/iOS:系統(tǒng)自帶朗讀功能

在windows10里,打開(kāi)開(kāi)始菜單旁的搜索按鈕,輸入“講述人”或在控制面板中打開(kāi)“講述人”功能就可以讓其朗讀記事本上的文本了。

 

Windows/iOS/Android如何將文字轉(zhuǎn)語(yǔ)音01

“講述人”功能界面,系統(tǒng)會(huì)朗讀藍(lán)色方框圈起來(lái)的區(qū)域

 

在“蘋(píng)果”系統(tǒng)中,朗讀的功能被設(shè)計(jì)得更為通用。如果我們使用的是iPhone手機(jī),我們可以通過(guò)“設(shè)置-通用-輔助功能-語(yǔ)音-朗讀屏幕”的途徑打開(kāi)手機(jī)的“朗讀”功能。

 

Windows/iOS/Android如何將文字轉(zhuǎn)語(yǔ)音02

蘋(píng)果手機(jī)中,我們可以通過(guò)“設(shè)置-通用-輔助功能-語(yǔ)音-朗讀屏幕”找到朗讀功能

 

屏幕上會(huì)出現(xiàn)“朗讀”的懸浮窗口,我們可以打開(kāi)任意我們想讓系統(tǒng)朗讀的文本,然后點(diǎn)擊朗讀。窗口左右的按鈕可以調(diào)整朗讀的速度。如果我們不需要系統(tǒng)朗讀所有內(nèi)容,我們也可以只選擇指定的文字,然后在操作菜單中選擇“朗讀”,這樣系統(tǒng)就只會(huì)朗讀我們選中的那部分內(nèi)容了。

 

Windows/iOS/Android如何將文字轉(zhuǎn)語(yǔ)音03

在朗誦控制板中可以調(diào)整語(yǔ)速,烏龜與兔子的標(biāo)志可以說(shuō)很形象了

 

結(jié)合Safari瀏覽器,我們可以實(shí)現(xiàn)更方便的朗讀管理。Safari可以管理朗讀列表,我們可以打開(kāi)多個(gè)網(wǎng)頁(yè),然后將內(nèi)容“添加到朗讀列表”之中。這樣我們就可以事先安排好想聽(tīng)的內(nèi)容,然后像聽(tīng)歌一樣,讓系統(tǒng)讀完一篇文章內(nèi)容之后,繼續(xù)朗讀下一篇我們所選中的文章。

 

Windows/iOS/Android如何將文字轉(zhuǎn)語(yǔ)音04

把文章“加入閱讀列表”后我們就可以讓safari連續(xù)朗讀列表網(wǎng)頁(yè)的內(nèi)容了

 

“蘋(píng)果”系統(tǒng)還將朗讀作為接口提供給第三方的軟件調(diào)用。比如知乎(僅舊版支持)、印象筆記等軟件的iOS版都有相關(guān)接口,我們可以在軟件中直接選擇“分享-添加到朗讀列表”,將APP中的文字添加到系統(tǒng)的朗讀列表中,就可以實(shí)現(xiàn)朗讀的功能。

 

Windows/iOS/Android如何將文字轉(zhuǎn)語(yǔ)音05

 

●Android:訊飛語(yǔ)記+懶人聽(tīng)書(shū)

相比于“蘋(píng)果”系統(tǒng)在不同硬件上的通用性,Android系統(tǒng)在語(yǔ)音朗讀方面的體驗(yàn)就比較支離破碎了。由于各家硬件廠商對(duì)Android系統(tǒng)都進(jìn)行了深度改造,導(dǎo)致Android手機(jī)上并沒(méi)有統(tǒng)一的語(yǔ)音朗讀功能可供調(diào)用。我們想在這些設(shè)備上實(shí)現(xiàn)語(yǔ)音朗讀,只能依靠第三方APP。

現(xiàn)在Android應(yīng)用市場(chǎng)里有很多所謂的“語(yǔ)音朗讀”類APP,包括一些電子書(shū)閱讀軟件也支持朗讀功能。不過(guò),這些APP并不像“蘋(píng)果”系統(tǒng)那樣有現(xiàn)成的語(yǔ)音包可供調(diào)用,要想使用它們的朗讀功能往往要依賴基于第三方的語(yǔ)音包。

我們就以“訊飛語(yǔ)記”結(jié)合“懶人聽(tīng)書(shū)”實(shí)現(xiàn)朗讀功能來(lái)舉例。其中,訊飛語(yǔ)記主要提供朗讀的語(yǔ)音包,而懶人聽(tīng)書(shū)主要是提供小說(shuō)等版權(quán)文字內(nèi)容。

首先我們安裝好兩個(gè)APP,然后打開(kāi)訊飛語(yǔ)記,注意不要讓系統(tǒng)在后臺(tái)將該APP進(jìn)程殺死,否則無(wú)法實(shí)現(xiàn)朗讀。之后打開(kāi)懶人聽(tīng)書(shū)APP,選擇你想聽(tīng)的小說(shuō),在小說(shuō)頁(yè)面中會(huì)看到一個(gè)耳機(jī)圖標(biāo),點(diǎn)擊耳機(jī)圖標(biāo)就會(huì)調(diào)取訊飛語(yǔ)記的朗讀功能,實(shí)現(xiàn)小說(shuō)朗讀了。訊飛語(yǔ)記的朗讀控制功能與“蘋(píng)果”類似,我們可以調(diào)整朗讀的速度以及音量大小。

 

Windows/iOS/Android如何將文字轉(zhuǎn)語(yǔ)音06

訊飛語(yǔ)記朗讀控制界面

 

此外,借助訊飛在語(yǔ)音識(shí)別方面的能力,它還提供了很強(qiáng)大的語(yǔ)音輸入功能。我們前面提到的一些語(yǔ)音合成用戶,如駕駛員、視力障礙者等,也恰好需要語(yǔ)音輸入,因此這一軟件是很符合這些用戶需求的。不過(guò)訊飛語(yǔ)記免費(fèi)版在語(yǔ)音輸入時(shí)間等方面有一定限制,在這方面要求較高的用戶需要夠買(mǎi)vip賬戶。

 

Windows/iOS/Android如何將文字轉(zhuǎn)語(yǔ)音07

 

通過(guò)以上的例子,大家可以舉一反三,靈活組合出自己的“朗讀者”。一是要準(zhǔn)備好朗讀軟件與語(yǔ)音包,二是準(zhǔn)備好要朗讀的內(nèi)容。由于語(yǔ)音包和小說(shuō)等文字內(nèi)容各有各的版權(quán),語(yǔ)音合成的朗讀內(nèi)容版權(quán)無(wú)法界定,現(xiàn)在Android系統(tǒng)上并沒(méi)有比較完美地把朗讀與內(nèi)容結(jié)合的軟件,想在Android端自由地“聽(tīng)”還是有些麻煩。

[!--empirenews.page--]

○微信輔助軟件

對(duì)喜歡閱讀微信公眾號(hào)的朋友來(lái)說(shuō),語(yǔ)音轉(zhuǎn)換遇到的麻煩也不必Android系統(tǒng)小。由于版權(quán)導(dǎo)致許多獨(dú)立APP不能提取公眾號(hào)文章,因此必須求助于微信小程序。微信小程序最大的便捷之處就是不用下載APP就可以實(shí)現(xiàn)各種功能,而且可以提供對(duì)微信公眾號(hào)文章的良好支持。文字轉(zhuǎn)語(yǔ)音功能雖然小眾,但也有不少小程序推出了該功能,這里重點(diǎn)推薦兩個(gè)小程序。

○飛鳥(niǎo)聽(tīng)聽(tīng)

飛鳥(niǎo)聽(tīng)聽(tīng)是比較早就開(kāi)始支持語(yǔ)音朗讀的小程序。我們只要在它的首頁(yè)輸入公眾號(hào)的名稱,將公眾號(hào)加入訂閱,該小程序就能為我們朗讀公眾號(hào)中的文章。拓展的功能包括加入聽(tīng)單列表,下載語(yǔ)音文件以及分享等等。在小程序主界面。我們還可以直接收聽(tīng)由小程序精選的文章,進(jìn)而關(guān)注相關(guān)的公眾號(hào)。

 

Windows/iOS/Android如何將文字轉(zhuǎn)語(yǔ)音08

在飛鳥(niǎo)聽(tīng)聽(tīng)中我們可以選擇聽(tīng)它推薦的文章,也可以自己輸入地址

 

如果我們對(duì)小程序推薦的公眾號(hào)都不感興趣,只想臨時(shí)收聽(tīng)某篇公眾號(hào)的文章,那么我們只要將公眾號(hào)的文章地址復(fù)制到小程序的搜索欄,然后點(diǎn)擊“開(kāi)始朗讀”,程序就會(huì)開(kāi)始自動(dòng)識(shí)別。除了公眾號(hào)之外,該小程序還支持提取知乎與今日頭條的文章,并且有男女聲可選,可以說(shuō)很貼心了。

 

Windows/iOS/Android如何將文字轉(zhuǎn)語(yǔ)音09

 

此外,該小程序還支持同時(shí)添加多條內(nèi)容進(jìn)入聽(tīng)單,然后按順序播放。但在Android 7.0系統(tǒng)下,該功能并不能夠按小程序教程所描述的那樣正常使用,還會(huì)出現(xiàn)不斷重復(fù)播放的問(wèn)題,關(guān)于這一點(diǎn)還有待小程序開(kāi)發(fā)商的優(yōu)化。

 

Windows/iOS/Android如何將文字轉(zhuǎn)語(yǔ)音10

 

●訊飛快讀

訊飛快讀是科大訊飛在微信上推出的官方小程序,功能很強(qiáng)大。此前微信上有不少使用訊飛語(yǔ)音包的“山寨朗讀小程序”,在訊飛官方小程序上線之后,山寨小程序就陸續(xù)下線了。

 

Windows/iOS/Android如何將文字轉(zhuǎn)語(yǔ)音11

 

訊飛快讀可以實(shí)現(xiàn)與飛鳥(niǎo)聽(tīng)聽(tīng)一樣的功能,包括識(shí)別微信公眾號(hào)地址、添加公眾號(hào)等功能。它與前者最大的不同是其擁有多樣化的語(yǔ)音包可供選擇。我們可以自由選擇喜歡的播音員聲音,并自由調(diào)節(jié)語(yǔ)速,還可添加背景音樂(lè)。就使用體驗(yàn)來(lái)說(shuō),訊飛在人聲郎讀的優(yōu)化方面處理得還是比較到位的,包括對(duì)多音字的處理、對(duì)年月日的處理等等,識(shí)別率還是比較高的。其整體的語(yǔ)音聽(tīng)起來(lái)也更接近自然人聲。問(wèn)題是,訊飛的小程序與它的APP一樣,只有少數(shù)幾個(gè)語(yǔ)音包是免費(fèi)使用的,大部分需要用戶付費(fèi)購(gòu)買(mǎi)才能使用。

 

Windows/iOS/Android如何將文字轉(zhuǎn)語(yǔ)音12

在訊飛快讀的播音員頁(yè)有多種聲音可供選擇,但大部分需要付費(fèi)

 

此外,可能是為了保護(hù)版權(quán),訊飛的語(yǔ)音朗讀過(guò)程需要全程聯(lián)網(wǎng),如果文章朗讀到一半就斷網(wǎng),我們就無(wú)法收聽(tīng)接下來(lái)的內(nèi)容,更別提建立朗讀列表或下載語(yǔ)音文件了。這點(diǎn)是訊飛比較影響用戶體驗(yàn)的地方,而且是官方有意為之,用戶不付費(fèi)恐怕難以改善體驗(yàn)。

其實(shí),上述軟件或軟件的出品廠商,也大都提供了PC端的解決方案,由于移動(dòng)端和PC端在技術(shù)上的共通性,性能沒(méi)有太大差別,這里就不一一贅述了。此外我們也可以發(fā)現(xiàn),其實(shí)最為實(shí)用化的語(yǔ)音合成技術(shù)是掌控在少數(shù)幾家廠商手中的,很多應(yīng)用并不掌握核心技術(shù),技術(shù)合作到期后,很可能無(wú)法繼續(xù)服務(wù),如果準(zhǔn)備長(zhǎng)期使用,那么最好選擇訊飛等幾家廠商的軟件應(yīng)用。

總之,文字轉(zhuǎn)語(yǔ)音并不是一個(gè)神秘的技術(shù),它早已經(jīng)解決了用戶“聽(tīng)懂”的問(wèn)題,未來(lái)要解決的是如何讓語(yǔ)音更接近真人朗讀,如何讓用戶聽(tīng)得更舒服的問(wèn)題。相信隨著人工智能的發(fā)展,電子合成的語(yǔ)音朗讀將會(huì)越來(lái)越接近自然語(yǔ)音,甚至在一些領(lǐng)域代替真人播音。雖然現(xiàn)在我們還無(wú)法享受到與真人匹敵的語(yǔ)音朗讀,但對(duì)于通勤路上的朋友來(lái)說(shuō),在無(wú)法用眼的時(shí)候用耳朵聽(tīng)一聽(tīng)這些合成聲音,也是一種能夠解決當(dāng)務(wù)之急的靈活應(yīng)用了。當(dāng)然,要想用好這些軟件和應(yīng)用,硬件方面的需求也是要考慮的。

 

○選好外設(shè) 收聽(tīng)真切的聲音

在使用文本轉(zhuǎn)語(yǔ)音工具的時(shí)候,當(dāng)然可以直接通過(guò)數(shù)碼設(shè)備的外放或PC上已有的各種聲音播放設(shè)備,但要將其作為一種生活方式的話,最好還是添置一臺(tái)適合語(yǔ)音播放的外設(shè)。

配合語(yǔ)音合成應(yīng)用,選擇音箱或耳機(jī)要注意的一點(diǎn)就是不能“炫富”,如無(wú)其他需要,不建議購(gòu)買(mǎi)目前比較火的、以多聲道表現(xiàn)為設(shè)計(jì)重點(diǎn)的電競(jìng)級(jí)耳機(jī),或者更重視高低音效果的中高端音樂(lè)耳機(jī),以及多聲道音箱或中高端音樂(lè)音箱。

在多聲道解決方案中,有不少都會(huì)通過(guò)軟件方式將某些聲道的信號(hào)分拆給其他聲道,以造成一種“偽”多聲道。

 

Windows/iOS/Android如何將文字轉(zhuǎn)語(yǔ)音13

對(duì)多聲道系統(tǒng)來(lái)說(shuō),語(yǔ)音使用的一般也只有前置音箱,其他音箱不僅浪費(fèi),還有可能造成干擾

 

這一點(diǎn)在欣賞音樂(lè)、影視作品或者玩游戲的時(shí)候會(huì)帶來(lái)比較好的使用體驗(yàn),但有可能造成混響等有礙于語(yǔ)音清晰播放的情況。在偏向于音樂(lè)欣賞的耳機(jī)和音箱設(shè)計(jì)中,有相當(dāng)部分會(huì)增加額外的重音以提升感染力,但這樣會(huì)使中音段的人聲變得有些渾濁。

 

Windows/iOS/Android如何將文字轉(zhuǎn)語(yǔ)音14

“突出”震撼效果的播放設(shè)備,常常會(huì)自行增加額外的重音效果

 

那么,什么樣的播放設(shè)備更值得考慮呢?首先是以音質(zhì)為賣(mài)點(diǎn),但并不是強(qiáng)調(diào)震撼效果或者支持多少個(gè)聲道的,而是偏向于強(qiáng)調(diào)音頻分離能力、中頻表現(xiàn)能力和減少失真的產(chǎn)品。對(duì)于喜歡使用耳機(jī)的用戶,還應(yīng)該考慮長(zhǎng)時(shí)間佩戴的舒適性。

 

Windows/iOS/Android如何將文字轉(zhuǎn)語(yǔ)音15

雙音腔等耳機(jī)設(shè)計(jì),相對(duì)來(lái)講比較適合語(yǔ)音合成與重現(xiàn)

 

此外,對(duì)于使用數(shù)碼產(chǎn)品的用戶,個(gè)人更偏向于采用藍(lán)牙設(shè)備,這樣在使用中會(huì)增加更多的趣味性,例如可以在充電的同時(shí)做家務(wù),只要佩戴藍(lán)牙耳機(jī)或攜帶藍(lán)牙音箱,就仍然可以隨時(shí)享受“聽(tīng)小說(shuō)”的樂(lè)趣。此外在餐廳等公共場(chǎng)合、通勤道路上,以及工作的時(shí)候,使用無(wú)線耳機(jī)也可以更方便地享受語(yǔ)音合成技術(shù)帶來(lái)的樂(lè)趣,并且不會(huì)打擾到別人。

 

○常見(jiàn)問(wèn)題 這樣解決

在語(yǔ)音合成的應(yīng)用中也難免會(huì)遇到一些問(wèn)題,如無(wú)法更換發(fā)言人、無(wú)法識(shí)別合成等,可能會(huì)讓剛剛開(kāi)始“玩”語(yǔ)音合成的用戶感到非常困擾,其實(shí)很多時(shí)候,這些問(wèn)題是很容易解決的。

●更換發(fā)言人

由于生活習(xí)慣不同,每個(gè)人喜歡的語(yǔ)音也有一定差別,因此很多語(yǔ)音合成應(yīng)用都提供了多種語(yǔ)音可選,一般在設(shè)置里選擇新的發(fā)言人,下載音源庫(kù)即可。如果未能正常更換,首先可以注意是否在下載后并未自動(dòng)替換,需要在其他設(shè)置頁(yè)面中,選擇本機(jī)已有的音源合成。其次由于目前很多應(yīng)用實(shí)際上是一種網(wǎng)絡(luò)服務(wù),因此低版本中是可以看到一些高版本提供的功能,如新增音源的,但低版本不一定能使用這些新音源,此時(shí)注意及時(shí)更新應(yīng)用版本即可。

●無(wú)法識(shí)別合成

首先我們應(yīng)該確認(rèn)文件或應(yīng)用的兼容性,如Word文件等不要使用最新版本,如有條件最好轉(zhuǎn)化成幾乎沒(méi)有版本差別的TXT純文本文件。然后需要考慮語(yǔ)音合成軟件的完整性,特別是在PC上使用時(shí),一些核心文件可能因?yàn)楣灿枚谡{(diào)整/卸載其他軟件如語(yǔ)音輸入軟件的時(shí)候被替換或刪除,那么就可以考慮重裝相應(yīng)軟件,或者根據(jù)錯(cuò)誤提示下載相應(yīng)的核心文件并放置在對(duì)應(yīng)位置。

●離線無(wú)法使用

語(yǔ)音合成與語(yǔ)音識(shí)別一樣,需要比較復(fù)雜的運(yùn)算和龐大數(shù)據(jù)才能很好地工作,但有時(shí)我們因?yàn)榱髁繂?wèn)題或使用場(chǎng)所問(wèn)題,必須斷網(wǎng)使用。此時(shí)除了尋找支持離線使用的應(yīng)用外,還可以在應(yīng)用設(shè)置中查找是否有相應(yīng)選項(xiàng),其中有些可能有下載數(shù)據(jù)庫(kù)或者降低精度等選項(xiàng),大家可以根據(jù)自己設(shè)備的容量情況和實(shí)際需求酌情選擇。

在簡(jiǎn)單了解和配置后,日臻成熟的語(yǔ)音合成技術(shù)已經(jīng)能帶給我們很多非常有趣又實(shí)用的體驗(yàn)了。不管是因?yàn)樯眢w原因、生活習(xí)慣的剛性需求,還是僅僅喜歡嘗試新科技,筆者都建議大家去嘗試一下,也許試過(guò)之后就離不開(kāi)了呢。