OpenAI 亮相 AI語音模型新技術!15秒錄音檔可生成多國語言合成人聲

jcatcj 04月 01,2024

(圖/路透社)

繼發表依據一段文字描述可自動生成60秒影片的「Sora」殺手級 AI 模型後,OpenAI 日前首次公開旗下歷經近2年開發的「Voice Engine」AI聲音模型新技術並展示最新初步測試成果,訴求僅需上傳錄製一段15秒的真人音檔樣本,就能透過AI模型自動生成與該真人音檔樣本極為相似的AI合成語音,不但能聽到與原始音檔樣本相近的口吻聲調,並且還可生成不同的語言版本,包括:英文、西班牙文、中文、日本等多國語言。

OpenAI 表示,目前針對語音生成技術所開發的「Voice Engine」AI模型,初期現階段僅向少部分約十人左右的開發者釋出,尚未正式對公眾開放使用。適合應用的情境像是:教學影片的旁白、或為影片提供多國語言翻譯音檔等。

請繼續往下閱讀...

為防範該語音AI模型遭不當濫用、散播不實資訊等資安風險(如假冒某某人的詐騙電話),將採取嚴格安全管控措施。OpenAI 指出,參與該AI模式測試計畫人員,需取得當事人提供聲音檔樣本的授權同意;此外,依據「Voice Engine」AI模型所生成的合成語音檔案,必需明確標註是出自AI生成、非真人發聲。另,OpenAI 也為「Voice Engine」AI模型所生成的語音合成檔案,加入具浮水印防止篡改的安全機制。

你可能也想看

OpenAI 殺手級 AI 模型確定今年上線!一下指令就能生成影片


鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。


標題:OpenAI 亮相 AI語音模型新技術!15秒錄音檔可生成多國語言合成人聲

地址:https://www.twnewsletter.com/article/34815.html

相關文章
精選資訊
  • Exscoin 介紹丨EXS幣是什麼?值得投資嗎?
  • 全球PC出貨量連續2年下滑!6大品牌最新市佔排名揭曉
  • 全球5大筆電品牌出貨量最新市佔出爐!僅一家逆勢成長
  • AI 手機只要 8,000 元有找!OPPO 全新 A3 Pro 登台開賣
  • Google 相簿AI技能!「魔術編輯器」修圖一指移動人像位置
  • 假冒「遠通電收ETC」App 竊帳密與信用卡個資!新型惡意病毒現蹤台灣、越南
  • Sony 4款無線耳機更新計畫曝光 爆料:WF-1000XM6等明年