全新GPT-4o模型登場:免費開放,語音交互進化再升級

Featured Image
OpenAI 最新的 AI 模型 GPT-4o 將在未來幾周內逐步整合到 OpenAI 的各個產品中,並且提供給所有用戶免費使用。GPT-4o 在文本、圖像和語音處理方面取得了顯著的提升,提供與 GPT-4 相當水平的智能。這一模型具有綜合利用語音、文本和視覺信息進行推理的能力。

GPT-4 是 OpenAI 先前的旗艦模型,可以處理由圖像和文本混合而成的信息,並能夠執行從圖像中提取文字或描述圖像內容等任務。而 GPT-4o 在此基礎上增加了語音處理能力。該模型的運行速度大大提升,並且在語音交互模式方面採用了創新技術。

OpenAI 一直致力於讓用戶通過語音與 ChatGPT 進行交流,使對話體驗更加自然。然而,之前的版本由於延遲問題嚴重影響了對話的沉浸感。而 GPT-4o 採用了全新的技術,使得聊天機器人的回應速度大幅提升。在發布會上,OpenAI 展示了使用 GPT-4o 進行語音對話的演示。演示者提問結束後,GPT-4o 幾乎可以立即回應並通過文本轉語音功能進行朗讀,使對話更加自然真實。

另一個演示展示了 GPT-4o 根據要求調整說話時的語氣。GPT-4o 可以根據指令改變聲音,從夸張戲劇到冰冷機械,展現出出色的可塑性。最後,演示還展示了 GPT-4o 的唱歌功能。

與以往一樣,OpenAI 在發布新版 ChatGPT 模型時通常會將其設置在付費墻內。然而,這次 GPT-4o 將免費提供給所有用戶,付費用戶則可以享受五倍的調用額度。此外,OpenAI 還推出了桌面版的 ChatGPT 和新的用戶界面。OpenAI 的首席技術官穆里·穆拉蒂表示:“我們認識到這些模型正變得越來越複雜,但我們希望用戶與人工智能模型的交互體驗能夠更加自然、輕鬆,讓用戶可以完全專注於與模型的協作,而無需在意界面本身。”

這次 GPT-4o 的發布將為用戶提供更強大的 AI 功能,並且以免費形式對所有用戶開放。用戶可以期待更高效的文本、圖像和語音處理能力,以及更自然、流暢的對話體驗。OpenAI 的持續努力將使得人工智能技術更加普及和易用,為各行各業帶來更大的價值和創新機會。

Share this content: