OpenAI将推出多模态大(dà)模型,志(zhì)在阻擊谷歌Gemini

發布日期:2023-12-19首頁 > IT資(zī)訊

谷歌在大(dà)約半個月前公布了自家的大(dà)模型Gemini,消耗的算力是GPT-4的五倍之多,官方稱之爲一(yī)種多模态和高效的機器學習工(gōng)具Gemini的開(kāi)發始于今年四月,谷歌将内部的兩個AI實驗室谷歌大(dà)腦(Google Brain)和DeepMind合并後正式啓動。接下(xià)來幾個月内Gemini的神秘面紗一(yī)點點被揭開(kāi),目前已知(zhī)的大(dà)約有:将具有和GPT-4相似的參數量級;Gemini在訓練中(zhōng)已經展示出了傳統大(dà)模型産品中(zhōng)從未見過的多模态能力;一(yī)旦經過微調和嚴格的安全性測試,谷歌同樣将提供不同尺寸和功能的Gemini版本,以确保部署在不同的産品、應用和設備上。

現在的最新消息有兩則:一(yī)、谷歌已經允許一(yī)小(xiǎo)部分(fēn)周邊公司使用Gemini軟件的早期版本,可能很快就将被納入消費(fèi)者服務,并通過公司的雲計算服務出售給企業。二、OpenAI正在積極将自家的多模态功能集成到GPT-4中(zhōng),可能與Gemini預計提供的功能類似,争取趕在Gemini發布前推出,其代号爲GobiOpenAI的目标很明确,就是要擊敗谷歌并保持領先地位。

OpenAI在今年三月推出GPT-4時就曾提出過多模态功能的預覽但當時僅爲特殊群體(tǐ),如專爲盲人或弱視等群體(tǐ)提供服務的Be My Eyes公司提供服務,其他很多公司都未能獲得這些功能。半年多後,OpenAI又(yòu)準備推出這項名爲GPT-Vision的功能,這次要面向更廣泛的群體(tǐ)了。至于爲什麽要拖半年,外(wài)界推測主要是擔心新的視覺功能會被居心叵測者利用,比如通過自動解決驗證碼問題來冒充人類,或者通過面部識别來跟蹤他人。不過目前來看,OpenAI似乎正在緻力于解決圍繞這項新技術的法律擔憂,或許很快就會有成果公布。

谷歌也面臨着同樣的問題之前Gemini發布會後,曾有人問谷歌正在采取哪些措施來防止其被濫用。谷歌的發言人指出早在七月時就做出了一(yī)系列措施,以确保其所有相關産品能夠被負責任地開(kāi)發與運用。考慮到谷歌擁有與文本、圖像、視頻(pín)和音頻(pín)相關的專有數據爲數不少,包括來自搜索引擎和YouTube等平台的數據等,Gemini多模态的發展方向可能就是爲了發揮發揮谷歌多年的優勢。據外(wài)媒援引一(yī)位使用過早期版本的人說,與現有常見的大(dà)模型相比,Gemini似乎已經很好的糾正了“AI幻覺,即一(yī)本正經的胡說八道的問題。

OpenAICEO奧爾特曼在之前的各種采訪中(zhōng)有意無意的表示,他們計劃對GPT-4進行各種增強,新的增強大(dà)模型是其中(zhōng)可能的方向之一(yī),現在說GPT-5還爲時尚早但很快的,這種說法就被穆斯塔法·蘇萊曼揭老底,稱“OpenAI一(yī)直在秘密開(kāi)發與訓練GPT-5,之所以經常被否認可能是因爲其内部新起了個名字蘇萊曼是DeepMind的聯合創始人之一(yī),稱得上是奧爾特曼的同行和對手。老話(huà)說同行才是最大(dà)的冤家,此言得之。

雖然現在OpenAI表态要開(kāi)發Gobi以保證自己在AIGC于大(dà)模型業内的領先地位,但也有消息表明Gobi似乎還沒有開(kāi)始訓練,所以目前Gobi可能還處于技術驗證,或者概念論證階段。在之前接受采訪時,谷歌CEO皮查伊表達了他對谷歌目前在AI領域地位的信心,并認可技術進步的持久性,以及他們在平衡創新與責任方面深思熟慮的戰略。

無論如何,時代的浪潮一(yī)旦起步自然不會說停就停。面對傳聞中(zhōng)谷歌要幹掉自己的大(dà)殺器,OpenAI當然不會無動于衷,OpenAI與其他企業的競賽就相當于AIGC與大(dà)模型時代的iOS與安卓之争估計現在有很多人都正屏息以待Gemini的到來,不僅是期待它的強大(dà)功能,更因爲它将揭示谷歌和OpenAI之間的差距到底有多大(dà)。此前李彥宏曾表态:卷大(dà)模型沒意思,不如去(qù)卷應用的機會更大(dà)。不論iOS與安卓誰在智能機和移動互聯網競賽中(zhōng)勝出,最終都是微信等APP收獲了數以億計的用戶,并逐漸滲透到越來越多的使用場景。

 

轉載自:億歐網