itri tts@ web logo

 

服務簡介

工研院文字轉語音( Industrial Technology Research Institute Text-To-Speech ; ITRI TTS)Web服務(Web Service)可讓您在自己的網頁提供免費的TTS體驗,提供更加值的訊息傳輸方式,讓網頁自動撥放文字內容,讓網頁「聲」動起來 。Web服務可使用的語言包含PHP、ASP,可使用的方式可透過Web Service API、Web Service Tools與JavaScript API等進行應用網頁撰寫。Web Service API使用UTF-8之格式,伺服器提供SOAP(Simple Object Access Protocol)協議的Web Service。

情境應用

您可以非常快速的在您的應用程式中增加自然流暢、近似真人發音之語音功能支援。並可以進階應用在部落格、網站新聞、電腦遊戲的旁白及總機應答的內容等,為銀髮族、視覺功能障礙者甚至一般普羅大眾,提供更多元的訊息傳遞方式。

TTS知識補充包


文字轉語音合成技術(Text-To-Speech ;  TTS)乃是透過電腦處理,將任意文字輸入轉換成語音輸出。使用者不需要針對特定文字內容預錄語音,只要將文字內容輸入電腦,電腦即會自動處理包括日期、時間、電話、金額、項次等數字之正確讀法,以及處理常見特殊符號、英文縮寫等之正確讀法。早期的文字轉語音合成,會有機械音、或韻律不流暢的缺點。目前ITRI TTS採用具有中文斷詞容錯能力之強健式韻律合成,生成音質清晰無衰減以及具有抑揚頓挫之韻律變化的合成語音,提供近似真人的發音。


為何需要語音輸出?
  • 眼睛不便 - 開車中之駕駛、搭車晃動之乘客、邊工作邊聽
  • 視力不佳 - 視障者、老年視力衰退、幼兒視力成長階段
  • 顯示受限 - 螢幕太小/無螢幕之設備、公共場所廣播
  • 聽力訓練 - 學習外語、聽障矯治
  • 文字障礙 - 學前兒童、文盲、只會聽不會讀之外國人
  • 多模輸出 - 語音配合其他輸出模式以增進效果─如遊戲、玩具、資訊查詢
為何需要TTS語音輸出?
  • 即時性、變動性內容之錄音 - 難以有全年無休、全天候之錄音人員可隨時錄音
  • 音色特質與錄音品質一致性的維持 - 真人較難維持一致音色
  • 可快速製作大量數位語音資訊 - 真人錄音成本高而耗時
  • 資訊傳輸便捷 - 錄音之儲存與傳輸,與文字相比之下較為不便
  • 可發展較多功能的系統 - 以TTS自動將文字轉換成語音輸出,可更靈活彈性的設計各種數位內容的多媒體服務,滿足各種使用者在各種情境下的語音輸出需求