湖北(běi)中(zhōng)網科技有限公司

谷歌在大(dà)約半個月前公布了自家的大(dà)模型Gemini，消耗的算力是GPT-4的五倍之多，官方稱之爲“一(yī)種多模态和高效的機器學習工(gōng)具”。Gemini的開(kāi)發始于今年四月，谷歌将内部的兩個AI實驗室谷歌大(dà)腦（Google Brain）和DeepMind合并後正式啓動。接下(xià)來幾個月内Gemini的神秘面紗一(yī)點點被揭開(kāi)，目前已知(zhī)的大(dà)約有：将具有和GPT-4相似的參數量級；Gemini在訓練中(zhōng)已經展示出了傳統大(dà)模型産品中(zhōng)從未見過的多模态能力；一(yī)旦經過微調和嚴格的安全性測試，谷歌同樣将提供不同尺寸和功能的Gemini版本，以确保部署在不同的産品、應用和設備上。

現在的最新消息有兩則：一(yī)、谷歌已經允許一(yī)小(xiǎo)部分(fēn)周邊公司使用Gemini軟件的早期版本，可能很快就将被納入消費(fèi)者服務，并通過公司的雲計算服務出售給企業。二、OpenAI正在積極将自家的多模态功能集成到GPT-4中(zhōng)，可能與Gemini預計提供的功能類似，争取趕在Gemini發布前推出，其代号爲Gobi。OpenAI的目标很明确，就是要擊敗谷歌并保持領先地位。

OpenAI在今年三月推出GPT-4時就曾提出過多模态功能的預覽。但當時僅爲特殊群體(tǐ)，如專爲盲人或弱視等群體(tǐ)提供服務的Be My Eyes公司提供服務，其他很多公司都未能獲得這些功能。半年多後，OpenAI又(yòu)準備推出這項名爲GPT-Vision的功能，這次要面向更廣泛的群體(tǐ)了。至于爲什麽要拖半年，外(wài)界推測主要是擔心新的視覺功能會被居心叵測者利用，比如通過自動解決驗證碼問題來冒充人類，或者通過面部識别來跟蹤他人。不過目前來看，OpenAI似乎正在緻力于解決圍繞這項新技術的法律擔憂，或許很快就會有成果公布。

谷歌也面臨着同樣的問題。之前Gemini發布會後，曾有人問谷歌正在采取哪些措施來防止其被濫用。谷歌的發言人指出早在七月時就做出了一(yī)系列措施，以确保其所有相關産品能夠被負責任地開(kāi)發與運用。考慮到谷歌擁有與文本、圖像、視頻(pín)和音頻(pín)相關的專有數據爲數不少，包括來自搜索引擎和YouTube等平台的數據等，Gemini多模态的發展方向可能就是爲了發揮發揮谷歌多年的優勢。據外(wài)媒援引一(yī)位使用過早期版本的人說，與現有常見的大(dà)模型相比，Gemini似乎已經很好的糾正了“AI幻覺”，即一(yī)本正經的胡說八道的問題。

OpenAI的CEO奧爾特曼在之前的各種采訪中(zhōng)有意無意的表示，他們計劃對GPT-4進行各種增強，新的增強大(dà)模型是其中(zhōng)可能的方向之一(yī)，現在說GPT-5還爲時尚早。但很快的，這種說法就被穆斯塔法·蘇萊曼揭老底，稱“OpenAI一(yī)直在秘密開(kāi)發與訓練GPT-5，之所以經常被否認可能是因爲其内部新起了個名字”。蘇萊曼是DeepMind的聯合創始人之一(yī)，稱得上是奧爾特曼的同行和對手。老話(huà)說“同行才是最大(dà)的冤家”，此言得之。

雖然現在OpenAI表态要開(kāi)發Gobi以保證自己在AIGC于大(dà)模型業内的領先地位，但也有消息表明Gobi似乎還沒有開(kāi)始訓練，所以目前Gobi可能還處于技術驗證，或者概念論證階段。在之前接受采訪時，谷歌CEO皮查伊表達了他對谷歌目前在AI領域地位的信心，并認可技術進步的持久性，以及他們在平衡創新與責任方面深思熟慮的戰略。

無論如何，時代的浪潮一(yī)旦起步自然不會說停就停。面對傳聞中(zhōng)谷歌要幹掉自己的大(dà)殺器，OpenAI當然不會無動于衷，OpenAI與其他企業的競賽就相當于AIGC與大(dà)模型時代的iOS與安卓之争。估計現在有很多人都正屏息以待Gemini的到來，不僅是期待它的強大(dà)功能，更因爲它将揭示谷歌和OpenAI之間的差距到底有多大(dà)。此前李彥宏曾表态：“卷大(dà)模型沒意思，不如去(qù)卷應用的機會更大(dà)。”不論iOS與安卓誰在智能機和移動互聯網競賽中(zhōng)勝出，最終都是微信等APP收獲了數以億計的用戶，并逐漸滲透到越來越多的使用場景。

轉載自：億歐網

OpenAI将推出多模态大(dà)模型，志(zhì)在阻擊谷歌Gemini