今年夏季,絕不能錯過名勝壹號世界郵輪重回基隆啟航!多種優惠方案讓您輕鬆預訂心儀的日本沖繩郵輪行程,同時省下大筆開支!

ChatGPT:開啟新時代的多功能智能伴侶|竤洋科技頻道|Hongyang mutimedia technology

7 個月前
-
-
(基於 PinQueue 指標)
#ChatGPT #多功能語言模型 #網路搜索 #語音辨識 #圖像識別

ChatGPT再次震撼亮相!現在,這款多功能語言模型已經可以連接到微軟的搜索引擎Bing,實現網路搜尋的功能,解決了過去資訊落後於時局的問題。OpenAI 在一段簡短的宣傳影片中展示,當ChatGPT回答用戶的問題時,會明確告知這是從網路搜索中獲得的資訊,並附上相關的連結。

OpenAI指出,ChatGPT Plus和企業版用戶將率先享有這一功能,只需在GPT-4的選項中選擇「使用 Bing 瀏覽」,而未來不久,所有用戶也將可以體驗到這項令人振奮的功能。

ChatGPT:多功能交互進化

ChatGPT最初僅支持文本對話,但現在,這種模式正在發生巨大變革。OpenAI發布的更新預告中提到,他們將提供新界面,使用戶能夠通過語音與ChatGPT對話,甚至能夠上傳圖片供其識別。

實例一:旅遊指南

想象一下,當你在旅行時,可以拍攝當地的地標,立即向ChatGPT詢問相關信息。你還可以拍攝你冰箱中剩餘的食材,然後請ChatGPT推薦晚餐的食譜。當孩子遇到數學作業中的難題時,你可以拍攝問題,然後讓ChatGPT協助解答。

實例二:圖像識別

根據外媒《Wired》的測試報告,ChatGPT能夠根據圖像準確識別楓樹,甚至可以精確識別餐具和包包的品牌。令人印象深刻的是,ChatGPT在識別物品時,似乎還會參考用戶在應用程序中設置的職業、地理位置等信息。

實例三:語音交互

ChatGPT的語音交互功能為用戶帶來了類似於語音助手的體驗。用戶可以點擊發話按鈕,口述他們希望得到答案的問題,而ChatGPT則可以將答案轉換成語音回應,就像使用Google助手或Siri一樣流暢。ChatGPT使用的大型語言模型使其能夠提供更加靈活的回應。

ChatGPT的語音技術背後

ChatGPT的語音功能是由兩個獨立的模型實現的。一個是現有的語音轉文字模型Whisper,負責將用戶的語音轉換為文字,以供ChatGPT進行處理。另一個是全新開發的文字轉語音模型,負責將ChatGPT生成的文本轉換為語音。

OpenAI官方宣稱,ChatGPT將提供多達5種不同風格的合成語音,從清晰明亮的女聲到低沉穩重的男聲等等,以滿足用戶的個性化需求。然而,值得注意的是,OpenAI提醒,對於非英文文本的語音轉錄,模型的表現可能會較差,不建議非拉丁字母文字的語言使用者依賴ChatGPT進行語音轉錄。

ChatGPT與Spotify的合作:跨足Podcast領域

與此同時,OpenAI宣布與音樂串流平台Spotify合作,利用人工智慧技術將Podcast轉換為其他語言,同時保留與原創創作者相似的聲音和風格。這一技術同樣是基於Whisper模型開發的。

目前,Spotify已經將《Lex Fridman Podcast》、《Armchair Expert》、《The Diary of a CEO with Steven Bartlett》等三個英語Podcast系列轉換成西班牙語,並計劃在未來幾周內擴展支援法語和德語等更多語言。

ChatGPT:不斷演進的AI夥伴

OpenAI不斷致力於將技術落實應用,為用戶提供更多功能。從針對企業的ChatGPT Enterprise,到最近與Dall-E的整合,再到今天公布

的語音和圖像功能,OpenAI正積極將ChatGPT打造成一個更貼近實際應用場景的產品。

ChatGPT同樣也面臨來自Google、亞馬遜和蘋果等競爭對手的激烈競爭。據傳,Google即將推出的Gemini模型將具備多種輸入方式,包括文字、語音、圖像甚至視頻,提供更全面的服務。這使ChatGPT面臨更多挑戰,但也代表了更多可能性。

總之,ChatGPT的發展代表了人工智慧領域的一個重要里程碑。無論是在語音交互、圖像識別還是網路搜索方面,它為我們提供了全新的體驗,並將持續演進,為未來的AI應用創造更多可能性。 ChatGPT正成為我們生活中不可或缺的多功能智能伴侶。


贊助【竤洋科技頻道】🙏🙏》https://www.hymt.com.tw/donate.html
👇👇👇👇👇看本頻道更多精彩好片👇👇👇👇👇👇👇
訂閱【竤洋科技頻道】馬上加入》https://reurl.cc/zZlXpy
#竤洋 #科技 #ai #機器學習 #虛擬機器人
-
-
(基於 PinQueue 指標)
0 則留言