#ChatGPT #多功能語言模型 #網路搜索 #語音辨識 #圖像識別
ChatGPT再次震撼亮相!現在,這款多功能語言模型已經可以連接到微軟的搜索引擎Bing,實現網路搜尋的功能,解決了過去資訊落後於時局的問題。OpenAI 在一段簡短的宣傳影片中展示,當ChatGPT回答用戶的問題時,會明確告知這是從網路搜索中獲得的資訊,並附上相關的連結。
OpenAI指出,ChatGPT Plus和企業版用戶將率先享有這一功能,只需在GPT-4的選項中選擇「使用 Bing 瀏覽」,而未來不久,所有用戶也將可以體驗到這項令人振奮的功能。
ChatGPT:多功能交互進化
ChatGPT最初僅支持文本對話,但現在,這種模式正在發生巨大變革。OpenAI發布的更新預告中提到,他們將提供新界面,使用戶能夠通過語音與ChatGPT對話,甚至能夠上傳圖片供其識別。
實例一:旅遊指南
想象一下,當你在旅行時,可以拍攝當地的地標,立即向ChatGPT詢問相關信息。你還可以拍攝你冰箱中剩餘的食材,然後請ChatGPT推薦晚餐的食譜。當孩子遇到數學作業中的難題時,你可以拍攝問題,然後讓ChatGPT協助解答。
實例二:圖像識別
根據外媒《Wired》的測試報告,ChatGPT能夠根據圖像準確識別楓樹,甚至可以精確識別餐具和包包的品牌。令人印象深刻的是,ChatGPT在識別物品時,似乎還會參考用戶在應用程序中設置的職業、地理位置等信息。
實例三:語音交互
ChatGPT的語音交互功能為用戶帶來了類似於語音助手的體驗。用戶可以點擊發話按鈕,口述他們希望得到答案的問題,而ChatGPT則可以將答案轉換成語音回應,就像使用Google助手或Siri一樣流暢。ChatGPT使用的大型語言模型使其能夠提供更加靈活的回應。
ChatGPT的語音技術背後
ChatGPT的語音功能是由兩個獨立的模型實現的。一個是現有的語音轉文字模型Whisper,負責將用戶的語音轉換為文字,以供ChatGPT進行處理。另一個是全新開發的文字轉語音模型,負責將ChatGPT生成的文本轉換為語音。
OpenAI官方宣稱,ChatGPT將提供多達5種不同風格的合成語音,從清晰明亮的女聲到低沉穩重的男聲等等,以滿足用戶的個性化需求。然而,值得注意的是,OpenAI提醒,對於非英文文本的語音轉錄,模型的表現可能會較差,不建議非拉丁字母文字的語言使用者依賴ChatGPT進行語音轉錄。
ChatGPT與Spotify的合作:跨足Podcast領域
與此同時,OpenAI宣布與音樂串流平台Spotify合作,利用人工智慧技術將Podcast轉換為其他語言,同時保留與原創創作者相似的聲音和風格。這一技術同樣是基於Whisper模型開發的。
目前,Spotify已經將《Lex Fridman Podcast》、《Armchair Expert》、《The Diary of a CEO with Steven Bartlett》等三個英語Podcast系列轉換成西班牙語,並計劃在未來幾周內擴展支援法語和德語等更多語言。
ChatGPT:不斷演進的AI夥伴
OpenAI不斷致力於將技術落實應用,為用戶提供更多功能。從針對企業的ChatGPT Enterprise,到最近與Dall-E的整合,再到今天公布
的語音和圖像功能,OpenAI正積極將ChatGPT打造成一個更貼近實際應用場景的產品。
ChatGPT同樣也面臨來自Google、亞馬遜和蘋果等競爭對手的激烈競爭。據傳,Google即將推出的Gemini模型將具備多種輸入方式,包括文字、語音、圖像甚至視頻,提供更全面的服務。這使ChatGPT面臨更多挑戰,但也代表了更多可能性。
總之,ChatGPT的發展代表了人工智慧領域的一個重要里程碑。無論是在語音交互、圖像識別還是網路搜索方面,它為我們提供了全新的體驗,並將持續演進,為未來的AI應用創造更多可能性。 ChatGPT正成為我們生活中不可或缺的多功能智能伴侶。
贊助【竤洋科技頻道】🙏🙏》https://www.hymt.com.tw/donate.html
👇👇👇👇👇看本頻道更多精彩好片👇👇👇👇👇👇👇
訂閱【竤洋科技頻道】馬上加入》https://reurl.cc/zZlXpy
#竤洋 #科技 #ai #機器學習 #虛擬機器人
ChatGPT再次震撼亮相!現在,這款多功能語言模型已經可以連接到微軟的搜索引擎Bing,實現網路搜尋的功能,解決了過去資訊落後於時局的問題。OpenAI 在一段簡短的宣傳影片中展示,當ChatGPT回答用戶的問題時,會明確告知這是從網路搜索中獲得的資訊,並附上相關的連結。
OpenAI指出,ChatGPT Plus和企業版用戶將率先享有這一功能,只需在GPT-4的選項中選擇「使用 Bing 瀏覽」,而未來不久,所有用戶也將可以體驗到這項令人振奮的功能。
ChatGPT:多功能交互進化
ChatGPT最初僅支持文本對話,但現在,這種模式正在發生巨大變革。OpenAI發布的更新預告中提到,他們將提供新界面,使用戶能夠通過語音與ChatGPT對話,甚至能夠上傳圖片供其識別。
實例一:旅遊指南
想象一下,當你在旅行時,可以拍攝當地的地標,立即向ChatGPT詢問相關信息。你還可以拍攝你冰箱中剩餘的食材,然後請ChatGPT推薦晚餐的食譜。當孩子遇到數學作業中的難題時,你可以拍攝問題,然後讓ChatGPT協助解答。
實例二:圖像識別
根據外媒《Wired》的測試報告,ChatGPT能夠根據圖像準確識別楓樹,甚至可以精確識別餐具和包包的品牌。令人印象深刻的是,ChatGPT在識別物品時,似乎還會參考用戶在應用程序中設置的職業、地理位置等信息。
實例三:語音交互
ChatGPT的語音交互功能為用戶帶來了類似於語音助手的體驗。用戶可以點擊發話按鈕,口述他們希望得到答案的問題,而ChatGPT則可以將答案轉換成語音回應,就像使用Google助手或Siri一樣流暢。ChatGPT使用的大型語言模型使其能夠提供更加靈活的回應。
ChatGPT的語音技術背後
ChatGPT的語音功能是由兩個獨立的模型實現的。一個是現有的語音轉文字模型Whisper,負責將用戶的語音轉換為文字,以供ChatGPT進行處理。另一個是全新開發的文字轉語音模型,負責將ChatGPT生成的文本轉換為語音。
OpenAI官方宣稱,ChatGPT將提供多達5種不同風格的合成語音,從清晰明亮的女聲到低沉穩重的男聲等等,以滿足用戶的個性化需求。然而,值得注意的是,OpenAI提醒,對於非英文文本的語音轉錄,模型的表現可能會較差,不建議非拉丁字母文字的語言使用者依賴ChatGPT進行語音轉錄。
ChatGPT與Spotify的合作:跨足Podcast領域
與此同時,OpenAI宣布與音樂串流平台Spotify合作,利用人工智慧技術將Podcast轉換為其他語言,同時保留與原創創作者相似的聲音和風格。這一技術同樣是基於Whisper模型開發的。
目前,Spotify已經將《Lex Fridman Podcast》、《Armchair Expert》、《The Diary of a CEO with Steven Bartlett》等三個英語Podcast系列轉換成西班牙語,並計劃在未來幾周內擴展支援法語和德語等更多語言。
ChatGPT:不斷演進的AI夥伴
OpenAI不斷致力於將技術落實應用,為用戶提供更多功能。從針對企業的ChatGPT Enterprise,到最近與Dall-E的整合,再到今天公布
的語音和圖像功能,OpenAI正積極將ChatGPT打造成一個更貼近實際應用場景的產品。
ChatGPT同樣也面臨來自Google、亞馬遜和蘋果等競爭對手的激烈競爭。據傳,Google即將推出的Gemini模型將具備多種輸入方式,包括文字、語音、圖像甚至視頻,提供更全面的服務。這使ChatGPT面臨更多挑戰,但也代表了更多可能性。
總之,ChatGPT的發展代表了人工智慧領域的一個重要里程碑。無論是在語音交互、圖像識別還是網路搜索方面,它為我們提供了全新的體驗,並將持續演進,為未來的AI應用創造更多可能性。 ChatGPT正成為我們生活中不可或缺的多功能智能伴侶。
贊助【竤洋科技頻道】🙏🙏》https://www.hymt.com.tw/donate.html
👇👇👇👇👇看本頻道更多精彩好片👇👇👇👇👇👇👇
訂閱【竤洋科技頻道】馬上加入》https://reurl.cc/zZlXpy
#竤洋 #科技 #ai #機器學習 #虛擬機器人