OpenAI慘遭打臉!SearchGPT官方演示大翻車,源代碼竟暴露搜索機制
相信很多大家對OpenAI慘遭打臉!SearchGPT官方演示大翻車,源代碼竟暴露搜索機制還不知道吧,今天菲菲就帶你們一起去了解一下~.~!
【新智元導讀】OpenAI再次上演了谷歌Bard出糗的一幕,SearchGPT官方震撼演示卻被外媒曝出低級錯誤。另有神通廣大的開發(fā)者甚至扒出內部源碼,揭秘了背后搜索機制。網友最新一手實測,AI秒級回復讓全網驚呆。
SearchGPT發(fā)布剛過兩天,已有人灰度測試到了。
今天,網友Kesku自制的demo全網刷屏,SearchGPT結果輸出如此神速,讓所有人為之震驚。
當詢問Porter Robinson出了新唱片嗎?
只見,SearchGPT眨眼功夫之間,即刻給出了答案「Smile」,最后還附上了鏈接。
再來看移動版本的回答速度,回答延遲幾乎為0。
評論區(qū)下方,震驚體鋪屏。
但另一方面,OpenAI當天放出的官方演示,被外媒《大西洋月刊》曝出其中的問題。
在回答「8月在北卡羅來納Boone舉辦的音樂節(jié)」的問題時,SearchGPT竟弄錯時間,出現(xiàn)了幻覺。
說好的,要取代谷歌呢?
全網一手實測來了
Kesku自己測試的另一個demo,呈現(xiàn)了SearchGPT的小部件。
她發(fā)現(xiàn)的一個現(xiàn)象是,SearchGPT傾向于強烈關注搜索結果。
「有時就需要明確告訴它,自己想要做什么,而不是想從網上得到什么」。
比如詢問它倫敦天氣,SearchGPT先給出了未來七天的天氣預報。
在倫敦野餐的最佳時間和地點有什么,類似小部件的形式給出了幾個備選項。
Kesku還在移動端測試了一些例子。
查詢英偉達股票,會給出英偉達股票整體的可視化圖,隨后給出了一些分析。所有股票信息都被無縫集成在頁面中。
輸入一首歌名「Never Gonna Give You Up」,然后直接給出了YouTube歌曲視頻,不用跳轉到其他網頁,在一個頁面就可以聽歌、看視頻。
除了搜索功能,網友還樂此不疲地進行「人性化測試」——
「你怎么樣」?
「作為一個AI語言模型,我沒有感情,但我在這里并隨時準備幫助你解答問題。今天我能為你提供什么幫助」?
「給我講一個笑話」
一個英語世界的經典雙關梗就此出現(xiàn)——
「科學家不信任原子。為什么科學家不信任原子?因為它們構成了一切!」
網友現(xiàn)場出題眼饞的網友們,紛紛在評論區(qū)出題,讓帖主幫忙測試。
第一位網友問道,「它支持地區(qū)和新聞嗎,比如來自TestingCatlog的最新新聞」。
Kesku測試后表示,「它可以通過IP地址或精確位置為你提供本地信息(后者默認是關閉的,可以在設置中選擇開啟)——比如『我附近的電影院』這樣的查詢效果很好」。
「幫忙試一下其智能體搜索的解釋能力」。
SearchGPT在給出關于高帶寬存儲器的解釋中,藍色標出的內容,是參考解釋。
你能嘗試搜索一些付費墻后面的文章嗎?那些最近與OpenAI簽署了合作伙伴關系的文章。
Kesku給出了一篇文章的內容, 不過貌似還是不能越過付費內容,僅是給出了文章的總結。
更細節(jié)的內容,依舊無法看到。
你能嘗試搜索「Yandex月活躍用戶數」嗎?
Kesku搜素后的結果如下所示:
顯然,根據提問者問題,SearchGPT給出了回答。
「與Perplexity相比如何」?
Kesku稱暫時還未測試復雜的任務,不過非常喜歡目前測出的結果。
在下面提示中,她直接問道「誰是Kesku」這么小眾的問題。
沒想到,SearchGPT給出了正確的解答,Perplexity卻回答錯誤了。
有網友對此評價道,「很酷的演示!也許SearchGPT能在本地搜索領域帶來一些變革?它能幫助你在現(xiàn)實世界中完成事情。從外觀來看,它有很好的數據源、簡潔的小部件,而且速度超快。不知道與谷歌相比,他們能把每次查詢的成本降低到多少」?
揭秘SearchGPT搜索機制
科技媒體TestingCatolog也率先進行了內測,并揭開了SearchGPT搜索機制的一角。
與當前ChatGPT提供的通用Bing搜索功能不同,SearchGPT更擅長提供實時信息。
雖然仍舊依賴Bing的索引,但SearchGPT將會有自己的網絡爬蟲(類似Perplexity),用于動態(tài)獲取實時數據,從而克服Bing速度較慢的問題。
甚至,TestingCatalog還挖出了SearchGPT的源代碼,并在評論區(qū)信誓旦旦地表示「絕對準確,我有內部人士。」
源代碼不僅露出了Bing的接口,而且可以發(fā)現(xiàn),搜索結果由多模態(tài)模型提供支持。
雖然看不出其中具體的處理流程,但調用的模型應該具有自動理解圖像的功能。
官方演示大翻車,OpenAI慘遭打臉
就在網友們興致勃勃地試用時,《大西洋月刊》卻站出來潑了一盆冷水——SearchGPT在官方demo中有明顯的搜索結果錯誤。
用戶給出的搜索問題是「8月在北卡羅來納Boone舉辦的音樂節(jié)」。
這個問題其實很難體現(xiàn)SearchGPT相對于傳統(tǒng)搜索引擎的優(yōu)勢。同樣的問題如果拋給谷歌搜索,也能給出相差無幾的結果。
比如SearchGPT放在首行的「阿巴拉契亞夏季節(jié)」(An Appalachian Summer Festival),也同樣是谷歌搜索的第二位結果。
但尷尬的是,標題下方的AI摘要把一個關鍵信息弄錯了——經主辦方確認,音樂節(jié)舉辦日期為6月29日~7月27日。
如果你按照SearchGPT給出的信息去買票,將一無所獲——7月29日~8月16日恰好是售票處正式關閉的時段。
OpenAI發(fā)言人Kayla Wood已經向《大西洋月刊》承認了這個錯誤,并表示「這僅是初始的原型,我們將不斷改進?!?/p>
這個錯誤讓人不禁想起B(yǎng)ard曾經造成的慘劇。
2023年2月,谷歌推出了這個聊天機器人產品以對抗ChatGPT,但首次亮相就出現(xiàn)了事實性錯誤,導致Alphabet股價當天暴跌9%,市值瞬間蒸發(fā)1000億美元。
Bard稱James Webb太空望遠鏡拍攝了系外行星的第一張照片,但實際上這個功績屬于歐洲南部天文臺的VLT
但好在,OpenAI沒有股價可跌,而且僅開放內測的做法也是相當謹慎。畢竟有谷歌的前車之鑒,可以預料到,LLM這種錯誤幾乎是無法避免的。
即使OpenAI能夠找到方法大幅減少SearchGPT的幻覺,但面對龐大的訪問量也是「杯水車薪」。
假設幻覺率僅為1%(這個比率很難達到),按照谷歌的規(guī)模,也會導致每天產生數千萬個錯誤答案。
更何況,我們目前還沒有發(fā)現(xiàn)足夠可靠且有效的方法,來消除LLM的廢話和幻覺。
而且,Andrej Karpathy大佬曾經在推特上表達過這樣的觀點:「幻覺并不是bug,而是LLM最大的特點?!?/p>
Karpathy將LLM比喻為「夢想機器」:我們用prompt引導模型「做夢」,再加上對訓練文檔的模糊記憶,就得到了生成結果。
雖然大多數時候生成結果是有用的,但既然是「夢境」就有可能失控。當LLM做夢進入有事實錯誤的領域時,我們就會給它貼上「幻覺」的標簽。
這看起來是個bug,但LLM只是做了它一直在做的事情。
這種機制和傳統(tǒng)的搜索引擎完全不同。后者接收提示后僅僅是逐字返回數據庫中最相似的文檔,因此你可以說它有「創(chuàng)造性問題」,因為搜索引擎永遠不可能創(chuàng)造新的回應。
根據Karpathy的說法,我們就很難指望由當前LLM驅動的AI搜索能生成100%真實準確的結果。
那么這場搜索引擎的變革會怎樣展開?LLM的「夢境創(chuàng)意」和傳統(tǒng)搜索引擎的真實可靠,究竟是共存下去,還是會「你死我亡」?
以上就是關于【OpenAI慘遭打臉!SearchGPT官方演示大翻車,源代碼竟暴露搜索機制】的相關內容,希望對大家有幫助!
免責聲明:本文由用戶上傳,與本網站立場無關。財經信息僅供讀者參考,并不構成投資建議。投資者據此操作,風險自擔。 如有侵權請聯(lián)系刪除!
-
奔馳GLE作為豪華SUV市場中的佼佼者,憑借其卓越的性能、豪華的內飾以及寬敞的空間,吸引了眾多消費者的關注。...瀏覽全文>>
-
在2025年,安徽阜陽地區(qū)的帕薩特新能源汽車市場表現(xiàn)非常活躍。作為一款備受關注的新能源車型,帕薩特新能源憑...瀏覽全文>>
-
近日,滁州地區(qū)的大眾汽車經銷商傳來好消息:備受矚目的2025款T-ROC探歌正式上市,并且以極具競爭力的價格吸引...瀏覽全文>>
-
在選擇一款新能源汽車時,了解其價格和配置是非常重要的一步。安徽淮南地區(qū)的長安啟源E07作為2024款的新車型,...瀏覽全文>>
-
阜陽長安啟源A05作為長安汽車旗下的全新車型,自推出以來便憑借其獨特的設計風格和豐富的配置吸引了眾多消費者...瀏覽全文>>
-
阜陽長安啟源A07作為一款備受矚目的新能源車型,以其豪華配置和親民的價格在市場上引起了廣泛關注。這款車型不...瀏覽全文>>
-
安徽淮南威然2024款價格及配置詳解隨著汽車市場的不斷更新?lián)Q代,上汽大眾旗下的MPV車型——威然(Viloran)憑...瀏覽全文>>
-
QQ多米新車報價2025款,買車省錢秘籍隨著汽車市場的不斷發(fā)展,消費者在選購車輛時不僅關注車型的性能和配置,...瀏覽全文>>
-
滁州途觀X 2024款最新價格及買車省錢秘籍隨著汽車市場的不斷發(fā)展,大眾途觀X作為一款兼具時尚與性能的中型SUV...瀏覽全文>>
-
隨著汽車市場的不斷發(fā)展,大眾蔚攬以其優(yōu)雅的設計和卓越的性能贏得了眾多消費者的青睞。作為一款兼具實用性和...瀏覽全文>>
- Nvidia DLSS 4 有望將游戲性能提高 8 倍
- 人工智能在預測自身免疫性疾病進展方面顯示出良好的前景
- 心理物理實驗揭示皮膚水分感知是如何改變的
- 科茨沃爾德公司慶祝圣誕節(jié)圓滿成功
- 南法納姆學校被評為薩里郡表現(xiàn)最好的小學
- 約克區(qū)九所小學將削減招生人數
- 松下新款電動汽車電池為 Lucid Gravity 帶來 450 英里續(xù)航里程
- 泰國旅游呈現(xiàn)新趨勢
- 研究人員找到在細胞水平上餓死前列腺癌腫瘤的新方法
- 領先的人工智能聊天機器人在測試中表現(xiàn)出類似癡呆癥的認知能力下降
- 龐大的 Project Zomboid build 42 終于可以玩了
- Steam Replay 回歸向您展示 2024 年您玩得最多的 PC 游戲
- Jollyes 推出強化的人才支持和招聘措施
- Karen Millen 與 Simon Harrison 共同推出全新高級珠寶系列
- 奇瑞風云A8L電動轎車刷新續(xù)航里程世界紀錄
- 虛擬藝術家將別克 Cascada 帶回 2026 款車型
- OnePlus 宣布推出新計劃解決綠線問題
- OnePlus Watch 3 將擁有更大的電池和更薄的機身
- 研究人員發(fā)現(xiàn)可變剪接與自身免疫性疾病遺傳之間的細胞類型特異性聯(lián)系
- 科學家確定腦細胞類型是排尿的主要控制者