當前位置:首頁 » 股票漲停 » tts股票軟體

tts股票軟體

發布時間: 2021-05-29 08:45:32

1. TTS是什麼意思呢

TTS是指一項語音合成技術。

語音合成是將人類語音用人工的方式所產生。若是將電腦系統用在語音合成上,則稱為語音合成器,而語音合成器可以用軟/硬體所實現。

文字轉語音系統則是將一般語言的文字轉換為語音,其他的系統可以描繪語言符號的表示方式,就像音標轉換至語音一樣。

(1)tts股票軟體擴展閱讀:

發展歷史

1、17世紀法國人研發機械式的說話裝置,直到19世紀,貝爾實驗室對於電子語音合成技術的研究,才開啟近代語音合成技術的發展。

2、貝爾實驗室在1939年製作出第一個電子語音合成器VODER,是一種利用共振峰原理所製作的合成器。

3、1960年,瑞典語言學家G. Fant則提出利用線性預測編碼技術(LPC)來作為語音合成分析技術,並推動了日後的發展。

4、1980年代Moulines E和Charpentier F提出新的語音合成演算法PSOLA,此技術可以合成比較自然的語音。

2. TTS怎麼下載啊`我手機是KPT的能用嗎

TTS是下不了的,他指的是把下載的txt小說讀出來 TTS是Text To Speech的縮寫,即「從文本到語音」。它是同時運用語言學和心理學的傑出之作,在內置晶元的支持之下,通過神經網路的設計,把文字智能地轉化為自然語音流。TTS技術對文本文件進行實時轉換,轉換時間之短可以秒計算。在其特有智能語音控制器作用下,文本輸出的語音音律流暢,使得聽者在聽取信息時感覺自然,毫無機器語音輸出的冷漠與生澀感。TTS語音合成技術即將覆蓋國標一、二級漢字,具有英文介面,自動識別中、英文,支持中英文混讀。所有聲音採用真人普通話為標准發音,實現了120-150個漢字/秒的快速語音合成,朗讀速度達3-4個漢字/秒,使用戶可以聽到清晰悅耳的音質和連貫流暢的語調。現在有少部分MP3隨身聽具有了TTS功能。 TTS是語音合成應用的一種,它將儲存於電腦中的文件,如幫助文件或者網頁,轉換成自然語音輸出。TTS可以幫助有視覺障礙的人閱讀計算機上的信息,或者只是簡單的用來增加文本文檔的可讀性。現在的TTL應用包括語音驅動的郵件以及聲音敏感系統。TTS經常與聲音識別程序一起使用。現在有很多TTS的產品,包括Read Please 2000, Proverbe Speech Unit,以及Next Up Technology的TextAloud。朗訊、 Elan、以及 AT&T都有自己的語音合成產品。 除了TTS軟體之外,很多商家還提供硬體產品,其中包括以色列WizCom Technologies公司的 Quick Link Pen,它是一個筆狀的可以掃描也可以閱讀文字的設備;還有Ostrich Software公司的Road Runner,一個手持的可以閱讀ASCII文本的設備;另外還有美國DEC公司的DecTalk TTS,它是可以替代音效卡的外部硬體設備,它包含一個內部軟體設備,可以與個人電腦自己的音效卡協同工作。 [編輯本段]TTS解析 TTS文語轉換用途很廣,包括電子郵件的閱讀、IVR系統的語音提示等等,目前IVR系統已廣泛應用於各個行業(如電信、交通運輸等)。 TTS所用的關鍵技術就是語音合成(SpeechSynthesis)。早期的TTS一般採用專用的晶元實現,如德州儀器公司的TMS50C10/TMS50C57、飛利浦的PH84H36等,但主要用在家用電器或兒童玩具中。 而基於微機應用的TTS一般用純軟體實現,主要包括以下幾部分: ●文本分析-對輸入文本進行語言學分析,逐句進行詞彙的、語法的和語義的分析,以確定句子的低層結構和每個字的音素的組成,包括文本的斷句、字詞切分、多音字的處理、數字的處理、縮略語的處理等。 ●語音合成-把處理好的文本所對應的單字或短語從語音合成庫中提取,把語言學描述轉化成言語波形。 ●韻律處理-合成音質(Qualityof Synthetic Speech)是指語音合成系統所輸出的語音的質量,一般從清晰度(或可懂度)、自然度和連貫性等方面進行主觀評價。清晰度是正確聽辨有意義詞語的百分率;自然度用來評價合成語音音質是否接近人說話的聲音,合成詞語的語調是否自然; 連貫性用來評價合成語句是否流暢。 要合成出高質量的語音,所採用的演算法是極為復雜的,因此對機器的要求也非常高。演算法的復雜度決定了目前微機並發進行多通道TTS的系統容量。 TTS在CTI的應用中的基本構架 在一般的CTI應用系統中,都會有IVR(互動式語音應答系統)。IVR系統是呼叫中心的重要組成部分,通過IVR系統,用戶可以利用音頻按健電話輸入信息,從系統中獲得預先錄制的數字或合成語音信息。具有TTS功能的IVR可以加快服務速度,節約服務成本,使IVR為呼叫者提供7*24小時的服務。 目前常見的IVR系統大都是通用的工控機平台上插入語音板卡組成,並支持中文語音合成TTS等技術。 一個典型的包含TTS服務的電話服務流程可分為: 用戶電話撥入,系統IVR響應,獲得用戶按鍵等信息。 IVR根據用戶的按鍵信息,向資料庫伺服器申請相關數據。 資料庫伺服器返迴文本數據給IVR。 IVR通過其TCP通訊介面,將需要合成的文本信息發送給TTS伺服器。 TTS伺服器將用戶文本合成的語音數據分段通過TCP通訊介面發送給IVR伺服器。 IVR伺服器把分段語音數據組裝成為獨立的語音文件。 IVR播放相應的語音文件給電話用戶。 一般的公網接入(IVR)大都採用工控機+語音板卡,而合成的語音數據則通過區域網傳給IVR。這種結構只適用於簡單的應用場合。 [編輯本段]中文TTS系統 包括中文語音處理和語音合成,利用中文韻律等相關知識對中文語句進行分詞、詞性判斷、注音、數字元號轉換,語音合成通過查詢中文語音庫得到語音。目前中文TTS系統,比較著名的有:IBM,Microsoft,Fujitsu,科大訊飛,捷通華聲等研究的系統。目前比較關鍵的就是中文韻律處理、符號數字、多音字、構詞方面有較多的問題,需要不斷研究,使得中文語音合成的自然化程度較高。 [編輯本段]TTS與CTI CTI技術使電信和計算機相互融合,克服了傳統電信和計算機服務相對單一的缺點,將兩者完美結合了起來。其應用領域非常廣泛,任何需要語音、數據通信,特別是那些希望把計算機網與通信網結合起來完成語音數據信息交換的系統都會用到CTI技術。 TTS即語音合成技術(Text To Speech),它涉及聲學、語言學、數學信號處理技術、多媒體技術等多個學科技術,是中文信息處理領域的一項前沿技術,實現把計算機中任意出現的文字轉換成自然流暢的語音輸出。 TTS在CTI系統中可以應用在IVR(互動式語音應答)伺服器上,以提供語音互動式平台,為用戶電話來訪提供語音提示,引導用戶選擇服務內容和輸入電話事務所需的數據,並接受用戶在電話撥號鍵盤上輸入的信息,實現對計算機資料庫等信息資料的互動式訪問。 在IVR中應用TTS可以自動將文本信息轉換為語音文件,或者實時地將文本信息合成語音並通過電話發布。實現文本與語音自動雙向轉換,以達到人與系統的自動交互,隨時隨地為客戶服務。維護人員不必再人工錄音,只須將電子文檔引入系統中,系統可以自動將電子文檔轉換為語音信息播放給客戶。資料庫中存放的大量數據,無需事先進行錄音,能夠隨時根據查詢條件查出並合成語音進行播報,從而大大減少了座席人員的工作負擔。 那麼應如何將TTS功能附加到CTI應用中呢?某些比較先進的交換平台,已經在交換機的內部實現了TTS的功能,並作為標准介面的一部分對外提供,業務開發商只需要簡單的調用他們即可以在業務中使用該功能。 對於未實現TTS功能的PBX,就需要業務開發商自己去選擇合適的平台,在此基礎上進行二次開發,即調用所選TTS平台提供的標准介面,實現語音合成功能。 目前CTI已經成為全球發展最為迅猛的產業之一,每年以50%的速度增長,CTI如同計算機產業一樣是一個金字塔形的產業鏈,從上到下會以至少20倍的幅度增值。TTS作為一種誘人的新技術,如果能很好的嵌入到增值業務的應用中去,必將形成一個更好的應用前景。 杭州音通軟體有限公司是由國家教育部和浙江省人民政府聯辦並依託浙江大學而成立的高新技術公司,音通公司主要致力於計算機語音技術的研發並逐步開拓語音識別、語音流媒體傳輸等其它語音領域的研究。其核心技術(Intone_TTS)是具有自主知識產權的中文語音合成技術,在由浙江省科技廳組織的鑒定中被專家一致鑒定為國內領先地位,並已申請多項國家專利。 Intone_TTS是一套把文本信息轉換為語音信息的開發工具包,為系統集成商、軟體開發商提供了完備的介面函數和編程示例,使用戶能夠靈活的進行調用,並集成到其它應用系統中。介面需要語音合成運行庫的支持,適合多種開發環境。開發者可以根據具體的應用場合進行選擇。 它能夠對所有的漢字、英文、阿拉伯數字進行語音合成; 支持繁體字及多音字的編輯; 合成效果:自然、平滑; 規范的函數調用介面,同時支持微軟SAPI的調用;支持同步調用和非同步調用方式; 支持PCM Wave,uLaw/aLaw Wave,ADPCM,Dialogic Vox等多種語音格式; 支持GB2312碼(簡體中文)、BIG5碼(繁體)、UNICODE碼; 支持多路通道同時合成; 支持Dialogic、東進、三匯等主流語音板卡; [編輯本段]TTS漫談 TTS就是Text To Speech,文本轉語音,文本朗讀,差不多是一個意思。在語音系統開發中經常要用到。 目前市場上的TTS很多,實現方式也各式各樣,有的很昂貴,如科大訊飛,據說當初得到863計劃的資助,有很高的技術;有的相對便宜,如捷通華聲, InfoTalk;也有免費的,如微軟的TTS產品。 相對於ASR(Automatic Speech Recognition,自動語音識別)來說,實現一個TTS產品所需要的技術難度不算大,在我看來也就是個力氣活。 要是讓我們來做一個能夠把漢語句子朗讀出來的TTS,我們會怎麼做呢? 有一種最簡單的TTS,就是把每個字都念出來,你會問,豈不要錄制6千多個漢字的語音?幸運的是,漢語的音節很少,很多同音字。我們最多隻是需要錄制: 聲母數×韻母數×4,(其實不是每個讀音都有4聲),這樣算來,最多隻需要錄制幾百個語音就可以了。 在合成的時候需要一張漢字對應拼音的對照表,漢字拼音輸入法也依賴這張表,可以在網上找到,不過通常沒有4聲音調,大不了自己加上,呵呵,要不怎麼說是力氣活呢。 這樣做出來的TTS效果也還可以,特別是朗讀一些沒有特別含義的如姓名,家庭住址,股票代碼等漢語句子,聽起來足夠清晰。這要歸功於我們偉大的母語通常都是單音節,從古代的時候開始,每個漢字就有一個詞,表達一個意思。而且漢字不同於英語,英語裡面很多連讀,音調節奏變化很大,漢字就簡單多了。 當然,你仍然要處理一些細節,比如多音字,把「銀行」讀成「yin xing」就不對了;再比如,標點符號的處理,數字、字母的處理,這些問題對於寫過很多程序的你,當然不難了。 國內的一些語音板卡帶的TTS,不管是賣錢的還是免費的,大體都是這樣做出來的,也就是這樣的效果。 如果要把TTS的效果弄好一點,再來點力氣活,把基本的詞錄製成語音,如常見的兩字詞,四字成語等,再做個詞庫和語音庫的對照表,每次需要合成時到詞庫裡面找。這樣以詞為單位,比以字為單位,效果自然是好多了。當然,這裡面還是有個技術,就是分詞的技術,要把復雜的句子斷成合理的詞序列,也有點技術。這也要怪新文化那些先驅們,當初倡導白話文,引進西文的橫排格式、標點符號的時候,沒有引進西文中的空格分詞。不過即使分詞演算法那麼不高效,不那麼准確,也問題不大,如前面所說,漢字是單音節詞,把聲音合起來,大體上不會有錯。 當然,科大訊飛的力氣活又乾的多了些,據說已經進化到以常用句子為單位來錄音了,大家可以想像,這要耗費更多的力氣,換來更好的效果。 至於增加一些銜接處的「詞料」,弄一些修飾性的音調,我認為是無關緊要的,對整體的效果改進不是太大。 市面上商品化TTS一般還支持粵語,請個粵語播音員錄音,把上面的力氣活重做一遍就是了。 再說句題外話,很多人覺得錄音最好找電台、電視台的播音員,其實找個你周圍的女同事來錄制,只要吐字清晰就可以了。在某種情況下,尋常聲音比字正腔圓的新聞聯播來得可愛。 再來說說文本的標識,對於復雜文本,某些內容程序沒有辦法處理,需要標識出來。比如,單純的數字「128」,是應該念成「一百二十八」還是「一二八」?解決辦法通常是加入XML標注,如微軟的TTS:"<context ID = "number_cardinal">128</context>"念成「一百二十八」,"<context ID = "number_digit">128</context>"將念成「一二八」。TTS引擎可以去解釋這些標注。遺憾的是,語音XML標注並沒有形成大家都完全認可的標准,基本上是各自一套。 再說說TTS應用編程,微軟的TTS編程介面叫SAPI,是COM介面,開發起來還是有點麻煩,還好MSDN的網站上資料很全面。微軟的TTS雖然免費,但其中文角色目前是個男聲,聲音略嫌混濁,感覺不爽。 國內一般的廠家提供API調用介面,相對比較簡單,可以方便地嵌入應用程序中去。 商品化的TTS還有個並發許可限制,就是限制同時合成的並發線程數,我覺得這個限制用處不大。無論哪種TTS,都可以將文本文件轉換成語音文件,供語音卡播放。大部分應用句子比較短小,一般不會超過100個漢字,合成的時間是非常短的,弄個線程專門負責合成,其它應用向該線程請求就是了,萬一句子很長,把它分解成多個短句子就是了,播放的速度總是比合成的速度慢。 也很多應用是離線合成,沒有實時性要求,就更不必買多個許可了。 更多情況下,我們甚至沒有必要購買TTS,比如語音開發中常見的費用催繳,撥通後播放:「尊敬的客戶,您本月的費用是:212元」,前面部分對所有客戶都一樣,錄一個語音文件就是了,而數字的合成是很簡單的,你只要錄制好10個數字語音,再加上十,百,千,萬,再加上金錢的單位「元」。 TTS(Training+Tool+Scheme)超越計劃 針對目前成長型企業遇到的人力資源問題,立體化解決人力資源瓶頸、通過企業與專家共建、實現人才強企的人力資源方向的重大智業項目。為企業培養人力資源高級管理人才,提供先進人力資源管理工具,並協助企業建立現代人力資源戰略規劃。通過「培訓(Training)+工具(Tool)+方案(Scheme)」的辦法,為企業系統解決人力資源難點問題,進而搭建科學、完善的人力資源管理體系。

3. TTS軟體怎麼往手機上下載

你說的語音軟體手機只有智能機可以安裝!我知道塞班的只有一個叫做聽網的可以聽小說或各種中文格式的txt文件!還有就是各種詞典,比如有道詞典就可以語音朗讀英文單詞!

4. 如何打開tts文件

tts是手機語音朗讀文件 在網路找語音王的軟體,一般是3個文件(ivESREngine.irf ivESRGrammar.irf Resource.irf) 使用方法: 直接將TTS三個文件解壓到你手機(復制的)

5. TTS軟體功能是什麼

TTS是Text To Speech的簡寫
是語音軟體 把文字智能地轉化為自然語音流。
卸載沒什麼問題 只是可能你要播放語音的時候 會無聲

6. TTS語音合成軟體

這是MS開發工具自帶的組件而已。早在02年就已經很強大了。MS網站有下載的。

7. 怎樣下載 tts

到漢辭網下載一個真人語音庫吧。
下載後解壓,裡面有安裝說明。由於真人語音庫都比較大,您可以選擇自己的安裝目錄 (最好是默認目錄),但安裝目錄途徑中不要帶有漢字,否則不能朗讀。比如:安裝目錄可以是「d:\speech」,但不可以是「d:\語音庫」。安裝完成後,打開具有朗讀功能的軟體,朗讀設置一下,就可用了。

8. TTS有什麼用

TTS</B>是Text To Speech的縮寫,即「從文本到語音」。它是同時運用語言學和心理學的傑出之作,在內置晶元的支持之下,通過神經網路的設計,把文字智能地轉化為自然語音流。TTS技術對文本文件進行實時轉換,轉換時間之短可以秒計算。在其特有智能語音控制器作用下,文本輸出的語音音律流暢,使得聽者在聽取信息時感覺自然,毫無機器語音輸出的冷漠與生澀感。TTS語音合成技術即將覆蓋國標一、二級漢字,具有英文介面,自動識別中、英文,支持中英文混讀。所有聲音採用真人普通話為標准發音,實現了120-150個漢字/秒的快速語音合成,朗讀速度達3-4個漢字/秒,使用戶可以聽到清晰悅耳的音質和連貫流暢的語調。現在有少部分MP3隨身聽具有了TTS功能。
TTS是語音合成應用的一種,它將儲存於電腦中的文件,如幫助文件或者網頁,轉換成自然語音輸出。TTS可以幫助有視覺障礙的人閱讀計算機上的信息,或者只是簡單的用來增加文本文檔的可讀性。現在的TTL應用包括語音驅動的郵件以及聲音敏感系統。TTS經常與聲音識別程序一起使用。現在有很多TTS的產品,包括Read Please 2000, Proverbe Speech Unit,以及Next Up Technology的TextAloud。朗訊、 Elan、以及 AT&T都有自己的語音合成產品。
除了TTS軟體之外,很多商家還提供硬體產品,其中包括以色列WizCom Technologies公司的 Quick Link Pen,它是一個筆狀的可以掃描也可以閱讀文字的設備;還有Ostrich Software公司的Road Runner,一個手持的可以閱讀ASCII文本的設備;另外還有美國DEC公司的DecTalk TTS,它是可以替代音效卡的外部硬體設備,它包含一個內部軟體設備,可以與個人電腦自己的音效卡協同工作。 TTS文語轉換用途很廣,包括電子郵件的閱讀、IVR系統的語音提示等等,目前IVR系統已廣泛應用於各個行業(如電信、交通運輸等)。
TTS所用的關鍵技術就是語音合成(SpeechSynthesis)。早期的TTS一般採用專用的晶元實現,如德州儀器公司的TMS50C10/TMS50C57、飛利浦的PH84H36等,但主要用在家用電器或兒童玩具中。
而基於微機應用的TTS一般用純軟體實現,主要包括以下幾部分:
●文本分析-對輸入文本進行語言學分析,逐句進行詞彙的、語法的和語義的分析,以確定句子的低層結構和每個字的音素的組成,包括文本的斷句、字詞切分、多音字的處理、數字的處理、縮略語的處理等。
●語音合成-把處理好的文本所對應的單字或短語從語音合成庫中提取,把語言學描述轉化成言語波形。
●韻律處理-合成音質(Qualityof Synthetic Speech)是指語音合成系統所輸出的語音的質量,一般從清晰度(或可懂度)、自然度和連貫性等方面進行主觀評價。清晰度是正確聽辨有意義詞語的百分率;自然度用來評價合成語音音質是否接近人說話的聲音,合成詞語的語調是否自然; 連貫性用來評價合成語句是否流暢。
要合成出高質量的語音,所採用的演算法是極為復雜的,因此對機器的要求也非常高。演算法的復雜度決定了目前微機並發進行多通道TTS的系統容量。
在一般的CTI應用系統中,都會有IVR(互動式語音應答系統)。IVR系統是呼叫中心的重要組成部分,通過IVR系統,用戶可以利用音頻按健電話輸入信息,從系統中獲得預先錄制的數字或合成語音信息。具有TTS功能的IVR可以加快服務速度,節約服務成本,使IVR為呼叫者提供7*24小時的服務。
目前常見的IVR系統大都是通用的工控機平台上插入語音板卡組成,並支持中文語音合成TTS等技術。
一個典型的包含TTS服務的電話服務流程可分為:
用戶電話撥入,系統IVR響應,獲得用戶按鍵等信息。
IVR根據用戶的按鍵信息,向資料庫伺服器申請相關數據。
資料庫伺服器返迴文本數據給IVR。
IVR通過其TCP通訊介面,將需要合成的文本信息發送給TTS伺服器。
TTS伺服器將用戶文本合成的語音數據分段通過TCP通訊介面發送給IVR伺服器。
IVR伺服器把分段語音數據組裝成為獨立的語音文件。
IVR播放相應的語音文件給電話用戶。
一般的公網接入(IVR)大都採用工控機+語音板卡,而合成的語音數據則通過區域網傳給IVR。這種結構只適用於簡單的應用場合。 包括中文語音處理和語音合成,利用中文韻律等相關知識對中文語句進行分詞、詞性判斷、注音、數字元號轉換,語音合成通過查詢中文語音庫得到語音。目前中文TTS系統,比較著名的有:IBM,Microsoft,Fujitsu,科大訊飛,捷通華聲等研究的系統。目前比較關鍵的就是中文韻律處理、符號數字、多音字、構詞方面有較多的問題,需要不斷研究,使得中文語音合成的自然化程度較高。 CTI技術使電信和計算機相互融合,克服了傳統電信和計算機服務相對單一的缺點,將兩者完美結合了起來。其應用領域非常廣泛,任何需要語音、數據通信,特別是那些希望把計算機網與通信網結合起來完成語音數據信息交換的系統都會用到CTI技術。
TTS即語音合成技術(Text To Speech),它涉及聲學、語言學、數學信號處理技術、多媒體技術等多個學科技術,是中文信息處理領域的一項前沿技術,實現把計算機中任意出現的文字轉換成自然流暢的語音輸出。
TTS在CTI系統中可以應用在IVR(互動式語音應答)伺服器上,以提供語音互動式平台,為用戶電話來訪提供語音提示,引導用戶選擇服務內容和輸入電話事務所需的數據,並接受用戶在電話撥號鍵盤上輸入的信息,實現對計算機資料庫等信息資料的互動式訪問。
在IVR中應用TTS可以自動將文本信息轉換為語音文件,或者實時地將文本信息合成語音並通過電話發布。實現文本與語音自動雙向轉換,以達到人與系統的自動交互,隨時隨地為客戶服務。維護人員不必再人工錄音,只須將電子文檔引入系統中,系統可以自動將電子文檔轉換為語音信息播放給客戶。資料庫中存放的大量數據,無需事先進行錄音,能夠隨時根據查詢條件查出並合成語音進行播報,從而大大減少了座席人員的工作負擔。
那麼應如何將TTS功能附加到CTI應用中呢?某些比較先進的交換平台,已經在交換機的內部實現了TTS的功能,並作為標准介面的一部分對外提供,業務開發商只需要簡單的調用他們即可以在業務中使用該功能。
對於未實現TTS功能的PBX,就需要業務開發商自己去選擇合適的平台,在此基礎上進行二次開發,即調用所選TTS平台提供的標准介面,實現語音合成功能。
目前CTI已經成為全球發展最為迅猛的產業之一,每年以50%的速度增長,CTI如同計算機產業一樣是一個金字塔形的產業鏈,從上到下會以至少20倍的幅度增值。TTS作為一種誘人的新技術,如果能很好的嵌入到增值業務的應用中去,必將形成一個更好的應用前景。
杭州音通軟體有限公司是由國家教育部和浙江省人民政府聯辦並依託浙江大學而成立的高新技術公司,音通公司主要致力於計算機語音技術的研發並逐步開拓語音識別、語音流媒體傳輸等其它語音領域的研究。其核心技術(Intone_TTS)是具有自主知識產權的中文語音合成技術,在由浙江省科技廳組織的鑒定中被專家一致鑒定為國內領先地位,並已申請多項國家專利。
Intone_TTS是一套把文本信息轉換為語音信息的開發工具包,為系統集成商、軟體開發商提供了完備的介面函數和編程示例,使用戶能夠靈活的進行調用,並集成到其它應用系統中。介面需要語音合成運行庫的支持,適合多種開發環境。開發者可以根據具體的應用場合進行選擇。
它能夠對所有的漢字、英文、阿拉伯數字進行語音合成;
支持繁體字及多音字的編輯;
合成效果:自然、平滑;
規范的函數調用介面,同時支持微軟SAPI的調用;支持同步調用和非同步調用方式;
支持PCM Wave,uLaw/aLaw Wave,ADPCM,Dialogic Vox等多種語音格式;
支持GB2312碼(簡體中文)、BIG5碼(繁體)、UNICODE碼;
支持多路通道同時合成;
支持Dialogic、東進、三匯等主流語音板卡; TTS就是Text To Speech,文本轉語音,文本朗讀,差不多是一個意思。在語音系統開發中經常要用到。
目前市場上的TTS很多,實現方式也各式各樣,有的很昂貴,如科大訊飛,據說當初得到863計劃的資助,有很高的技術;有的相對便宜,如捷通華聲, InfoTalk;也有免費的,如微軟的TTS產品。
相對於ASR(Automatic Speech Recognition,自動語音識別)來說,實現一個TTS產品所需要的技術難度不算大,在我看來也就是個力氣活。
要是讓我們來做一個能夠把漢語句子朗讀出來的TTS,我們會怎麼做呢?
有一種最簡單的TTS,就是把每個字都念出來,你會問,豈不要錄制6千多個漢字的語音?幸運的是,漢語的音節很少,很多同音字。我們最多隻是需要錄制: 聲母數×韻母數×4,(其實不是每個讀音都有4聲),這樣算來,最多隻需要錄制幾百個語音就可以了。
在合成的時候需要一張漢字對應拼音的對照表,漢字拼音輸入法也依賴這張表,可以在網上找到,不過通常沒有4聲音調,大不了自己加上,呵呵,要不怎麼說是力氣活呢。
這樣做出來的TTS效果也還可以,特別是朗讀一些沒有特別含義的如姓名,家庭住址,股票代碼等漢語句子,聽起來足夠清晰。這要歸功於我們偉大的母語通常都是單音節,從古代的時候開始,每個漢字就有一個詞,表達一個意思。而且漢字不同於英語,英語裡面很多連讀,音調節奏變化很大,漢字就簡單多了。
當然,你仍然要處理一些細節,比如多音字,把「銀行」讀成「yin xing」就不對了;再比如,標點符號的處理,數字、字母的處理,這些問題對於寫過很多程序的你,當然不難了。
國內的一些語音板卡帶的TTS,不管是賣錢的還是免費的,大體都是這樣做出來的,也就是這樣的效果。
如果要把TTS的效果弄好一點,再來點力氣活,把基本的詞錄製成語音,如常見的兩字詞,四字成語等,再做個詞庫和語音庫的對照表,每次需要合成時到詞庫裡面找。這樣以詞為單位,比以字為單位,效果自然是好多了。當然,這裡面還是有個技術,就是分詞的技術,要把復雜的句子斷成合理的詞序列,也有點技術。這也要怪新文化那些先驅們,當初倡導白話文,引進西文的橫排格式、標點符號的時候,沒有引進西文中的空格分詞。不過即使分詞演算法那麼不高效,不那麼准確,也問題不大,如前面所說,漢字是單音節詞,把聲音合起來,大體上不會有錯。
當然,科大訊飛的力氣活又乾的多了些,據說已經進化到以常用句子為單位來錄音了,大家可以想像,這要耗費更多的力氣,換來更好的效果。
至於增加一些銜接處的「詞料」,弄一些修飾性的音調,我認為是無關緊要的,對整體的效果改進不是太大。
市面上商品化TTS一般還支持粵語,請個粵語播音員錄音,把上面的力氣活重做一遍就是了。
再說句題外話,很多人覺得錄音最好找電台、電視台的播音員,其實找個你周圍的女同事來錄制,只要吐字清晰就可以了。在某種情況下,尋常聲音比字正腔圓的新聞聯播來得可愛。
再來說說文本的標識,對於復雜文本,某些內容程序沒有辦法處理,需要標識出來。比如,單純的數字「128」,是應該念成「一百二十八」還是「一二八」?解決辦法通常是加入XML標注,如微軟的TTS:"<context ID = "number_cardinal">128</context>"念成「一百二十八」,"<context ID = "number_digit">128</context>"將念成「一二八」。TTS引擎可以去解釋這些標注。遺憾的是,語音XML標注並沒有形成大家都完全認可的標准,基本上是各自一套。
再說說TTS應用編程,微軟的TTS編程介面叫SAPI,是COM介面,開發起來還是有點麻煩,還好MSDN的網站上資料很全面。微軟的TTS雖然免費,但其中文角色目前是個男聲,聲音略嫌混濁,感覺不爽。
國內一般的廠家提供API調用介面,相對比較簡單,可以方便地嵌入應用程序中去。
商品化的TTS還有個並發許可限制,就是限制同時合成的並發線程數,我覺得這個限制用處不大。無論哪種TTS,都可以將文本文件轉換成語音文件,供語音卡播放。大部分應用句子比較短小,一般不會超過100個漢字,合成的時間是非常短的,弄個線程專門負責合成,其它應用向該線程請求就是了,萬一句子很長,把它分解成多個短句子就是了,播放的速度總是比合成的速度慢。
也很多應用是離線合成,沒有實時性要求,就更不必買多個許可了。
更多情況下,我們甚至沒有必要購買TTS,比如語音開發中常見的費用催繳,撥通後播放:「尊敬的客戶,您本月的費用是:212元」,前面部分對所有客戶都一樣,錄一個語音文件就是了,而數字的合成是很簡單的,你只要錄制好10個數字語音,再加上十,百,千,萬,再加上金錢的單位「元」。
TTS(Training+Tool+Scheme)超越計劃
針對目前成長型企業遇到的人力資源問題,立體化解決人力資源瓶頸、通過企業與專家共建、實現人才強企的人力資源方向的重大智業項目。為企業培養人力資源高級管理人才,提供先進人力資源管理工具,並協助企業建立現代人力資源戰略規劃。通過「培訓(Training)+工具(Tool)+方案(Scheme)」的辦法,為企業系統解決人力資源難點問題,進而搭建科學、完善的人力資源管理體系。
TTS TIANJIN TERMINAL SURCHARGE
天津港口附加費。09年從日韓經過的船所收的一個費用

9. 求一個win10可以用的TTS軟體。

TTS 朗讀機很多,
國產通用朗讀機:朗讀女等,
外語教與學專業朗讀機有: 語音朗讀助學軟體(要求開啟.net framework 2.0), 浩 讀(相關說明在www.readall.net),
利用國外內核重新包裝的有: 自然英語語音軟體、隨E聽
國外的通用朗讀機有: balabolka, D-speech

10. 請問哪裡有免費的tts文本轉語音軟體

==只想專中文語音,搜索 Lily語音引擎,400多兆(可用電驢下),安裝後裡面有朗讀界面可以操作,但開始會有版權提示。界面難看點,將就著用吧。
==破解方法可以搜索下,有的。
==要保存mp3,或需要其他專業的功能,就得另購其他程序,沒見過免費的。

熱點內容
好的股票投資軟體游戲 發布:2025-01-06 08:26:20 瀏覽:90
美國股票有漲停板嗎 發布:2025-01-06 08:26:16 瀏覽:274
住院統籌基金起付標準是什麼意思 發布:2025-01-06 08:25:36 瀏覽:197
1月15漲停的股票 發布:2025-01-06 08:14:30 瀏覽:383
基金討論區頭像怎麼設置 發布:2025-01-06 08:09:33 瀏覽:473
操盤手怎麼操作數字貨幣價格 發布:2025-01-06 08:05:37 瀏覽:417
世界上的隱藏家族市值多少 發布:2025-01-06 07:45:19 瀏覽:117
哈爾濱商業大學里的金融學怎麼樣 發布:2025-01-06 07:30:44 瀏覽:891
閻羅族為什麼市值高一族 發布:2025-01-06 07:30:26 瀏覽:875
企業內部估值什麼情況下比市值低 發布:2025-01-06 07:25:02 瀏覽:319