ChatGPT 語音大升級!你的 AI 助理現在不只會說話,還懂你的「弦外之音」?
OpenAI 最近為 ChatGPT 付費用戶帶來了全新的「高級語音模式」,不僅聲音聽起來更像真人,還新增了強大的即時翻譯功能。但這項酷炫的功能真的完美無瑕嗎?我們來一探究竟,聊聊這次更新的亮點與那些有點奇怪的小毛病。
你有沒有過這種感覺?跟 AI 語音助理說話,總覺得像在跟一台冷冰冰的機器對話,語調平板、毫無生氣。說實話,那樣的體驗有時候還挺讓人出戲的。
但那些日子可能真的要過去了。OpenAI 最近在 2025 年 6 月 7 日宣布,他們為 ChatGPT 的付費用戶帶來了一次重大的「高級語音模式」(Advanced Voice Mode) 更新。這次升級的重點,不只是讓 AI「會說話」,而是要讓它「會聊天」,懂得我們說話時那些微妙的情感和語氣變化。
欸,這是在跟真人聊天嗎?
這次更新最讓人驚豔的,就是聲音的「擬人化」程度。我們都知道,人類對話的精髓,往往不在於字詞本身,而在於說話的方式——語調的抑揚頓挫、恰到好處的停頓、甚至是語氣中透露出的情緒。
OpenAI 顯然聽到了大家的心聲。更新後的 ChatGPT 在這方面下了大功夫:
- 更自然的語調: 聲音聽起來不再是單調的機器音,而是有了更自然的起伏,讓對話流暢許多。
- 逼真的節奏感: 它學會了在適當的時候停頓和強調,就像我們平常說話一樣,這讓互動感覺真實多了。
- 更細膩的情感表達: 最酷的是,它現在更能捕捉並表達出像同理心、諷刺這類複雜的情感。沒錯,你以後或許可以跟你的 AI 開個玩笑了,而且它可能還「聽得懂」你的梗!
簡單來說,這次更新的目標,就是讓你忘記自己是在跟一段程式碼對話。
出國玩怕語言不通?你的隨身翻譯官已上線
除了聲音變得更聰明,這次更新還帶來一個超級實用的殺手級功能——即時翻譯。
想像一下這個場景:你在巴西一家熱鬧的餐廳,想點一道當地特色菜,但菜單全是葡萄牙文,服務生也只會說葡萄牙語。這時候怎麼辦?
現在,你只要拿出手機,對 ChatGPT 說:「幫我翻譯成葡萄牙語。」接下來,你用英文說的話,它會立刻用流利的葡萄牙語說出來給服務生聽;而服務生用葡萄牙語的回覆,它也會即時翻譯成英文讓你了解。整個過程無縫接軌,直到你讓它停止翻譯為止。
無論是在義大利問路,還是和東京辦公室的同事開會,這項功能都讓跨語言溝通變得毫不費力。這簡直就像在口袋裡塞了一位專業的同聲傳譯員,隨時待命。
聽起來很棒,那要怎麼開始用?
這項升級目前是專門提供給所有市場和平台的 ChatGPT 付費用戶。如果你已經是訂閱戶,操作非常簡單,只要在訊息輸入框旁邊點擊「語音圖示」,就可以開始體驗這個全新的語音模式了。
好吧,但它完美嗎?聊聊那些有趣的小毛病
說了這麼多優點,我們也得誠實面對現實。就像任何新技術一樣,這個「高級語音模式」也還不是百分之百完美。OpenAI 自己也坦承,目前還存在一些已知的小問題。
首先,你可能會偶爾遇到音訊品質不穩定的情況。比如,AI 的聲音可能會突然變調或音量忽大忽小,這種情況在某些特定聲線中似乎更明顯一些。
更有趣的是,AI 有時會出現所謂的「幻覺」(hallucinations) 現象。這是什麼意思呢?就是 ChatGPT 可能會在你跟它聊得好好的時候,沒來由地發出一些奇怪的聲音——可能是一段廣告片段、隨機的噪音,甚至……背景音樂?最近就有用戶回報說,在對話中 ChatGPT 突然播放了一段廣告,但 OpenAI 明確表示他們並沒有在服務中投放廣告。
聽起來是不是有點毛骨悚然又有點好笑?這也提醒我們,AI 的發展雖然飛快,但偶爾還是會有些讓人摸不著頭緒的小狀況。
回顧與展望:我們離真正的「她」還有多遠?
OpenAI 早在 2024 年 5 月就首次推出了這個高級語音模式,並在同年 10 月將其推廣到歐盟地區。他們的終極目標,是實現與 AI 之間自然、即時且可以隨時打斷的互動模式。如果用戶同時打開相機,ChatGPT 甚至能對你周遭的環境或物體做出即時評論,這點與 Google 的 Gemini 應用程式所展示的功能有異曲同工之妙。
這次的更新,無疑是向著這個目標邁出的一大步。它讓 AI 從一個單純的資訊工具,變得更像一個能「溝通」的夥伴。雖然還有一些小瑕疵待解決,但它展現的潛力,已經足以讓我們對人機互動的未來充滿想像。
你準備好跟一個更懂你、甚至會跟你開玩笑的 AI 聊天了嗎?