全面升級!GPT-4o模型新功能大揭秘:語音翻譯、視訊辨識全面啟用

Featured Image
GPT-4o 是一款由 OpenAI 開發的全方位 AI 模型,於最新的 ChatGPT 中應用。它具有多項實用功能,以下將介紹其中幾個主要特點。

首先是即時語音翻譯功能。GPT-4o 的語音功能非常人性化,甚至在處理速度上也相當迅捷。它可以翻譯至少 50 種語言,這對於出國旅行時使用 ChatGPT 作為雙向翻譯工具將非常方便。在發表會上,OpenAI 示範了 GPT-4o 在英語和義大利語之間進行即時翻譯,而且 GPT-4o 不僅僅是機械性的翻譯,它還會以第三人稱的方式回答你,就像一位中間人一樣。

其次是辨識視訊即時內容的能力。儘管 GPT-4 在辨識圖像內容方面已具備能力,但 GPT-4o 更進一步,它可以與你進行視訊通話,並解讀你的視訊影像,給予適當的回答。例如,在一個影片中,ChatGPT 建議玩剪刀石頭布,並正確判斷出兩次平手和女生獲勝。在另一個影片中,ChatGPT 辨識出一位人穿著 OpenAI LOGO 的衣服。

此外,GPT-4o 還具備辨識情緒並以不同語調回應的功能。除了即時翻譯外,GPT-4o 還能夠理解和表達多種情緒,並生成多種情感表達的聲音,使與 ChatGPT 的互動更加自然流暢。例如,OpenAI 展示了 GPT-4o 聽完一個笑話後自然地笑了起來。在另一個影片中,ChatGPT 在 GPT-4o 模型下能夠判斷視訊者的情緒,並在得知只是在測試其能力後感到有點失望又有點不好意思。

此外,透過 GPT-4o,你還可以指示 ChatGPT 進行作曲和演唱。你可以指定旋律,並調整語調和唱歌口氣的輕重。這些功能在 GPT-4o 模型下的 ChatGPT 都能夠實現。

在電腦版的 ChatGPT 中,你還可以將螢幕畫面分享給 ChatGPT,它有能力直接辨識畫面上的內容。這使得你可以直接利用語音和 ChatGPT 討論你想要詢問的事項。例如,在一個展示的過程中,你可以問 ChatGPT 螢幕圖表上溫度最高的月份是哪個,ChatGPT 將回答出正確的月份。

除此之外,使用電腦版的 ChatGPT,並在 GPT-4o 模型下,你還可以邀請 ChatGPT 參與你與朋友、同事們的視訊會議。ChatGPT 不僅可以在會議中當助理,還可以擔任會議主持人的角色。

總結來說,GPT-4o 的回應速度是 GPT-4 的兩倍,對於開發者而言,使用 GPT-4o 的 API 價格只有 GPT-4 的一半。GPT-4o 的語音效果非常擬真和自然,你可以從 ChatGPT 的回答中感受到情緒。此外,它的視覺辨識能力也大幅提高,能夠快速且準確地辨識靜態圖像和動態視訊畫面,包括人物表情和周遭環境等。OpenAI 還推出了電腦版 ChatGPT App,並將 GPT-4o 開放給免費 ChatGPT 帳戶使用,雖然額度上會有一些限制,但每月僅需 20 美元的 ChatGPT Plus 訂閱費用是非常值得的。

Share this content: