777精品出轨人妻国产,熟女av人妻一区二区三四区,国产精品无码中文在线av,美脚パンスト女教师在线观看

新火種AI|Meta首發(fā)變色龍?zhí)魬?zhàn)GPT-4o!AI股盤中上漲展現(xiàn)利好態(tài)勢。

原創(chuàng) 收藏 評論
舉報 2024-05-20

作者:小巖

編輯:彩云

前幾天,OpenAI率先推出了GPT-4o,在業(yè)內(nèi)引起了不小的反響。究其原因,是因為GPT-4o的橫空出世再次創(chuàng)立了一個多模態(tài)模型發(fā)展的新范式。

為什么這么說呢?通常情況下,傳統(tǒng)的多模態(tài)基礎(chǔ)模型會為每種模態(tài)采用特定的“編碼器”或“解碼器”,以便將不同的模態(tài)分離開。然而,這種方法大大限制了模型的發(fā)揮,使其有效融合跨模態(tài)信息的能力變差。

而OpenAI所推出的GPT-4o就能有效解決這個問題,因為它是首個端到端訓練的,跨越文本,視覺和音頻的模型,所有的輸入和輸出,都由單個神經(jīng)網(wǎng)絡(luò)處理。GPT-4o與以往的所有模型都不盡相同,也正因此,OpenAI將其稱為“首個原生多模型”。

圖片7.png

不過,“首個”的頭把交椅還沒有坐熱乎,OpenAI就遭遇到了Meta的挑戰(zhàn)。就在最近,Meta團隊發(fā)布了混合模態(tài)Chameleon(變色龍) 。它可以在單一神經(jīng)網(wǎng)絡(luò)無縫處理文本和圖像,10萬億token訓練的34B參數(shù)模型性能接近GPT-4V,刷新SOTA。

如此看來,OpenAI的新產(chǎn)品剛推出不久,便遇到了足以與之相抗衡的對手。

Chameleon:多模態(tài)文生圖大模型,Meta在生成式AI方向上的新王牌。

作為Meta獨家推出的王牌產(chǎn)品,Chameleon有什么獨特之處呢?

與GPT-4o一樣,Chameleon采用了統(tǒng)一的Transformer架構(gòu),使用文本,圖像和代碼混合模態(tài)完成訓練。以類似文本生成的方式,對圖像進行離散“分詞化”,最終生成和推理交錯的文本和圖像序列。

因為使用了這種“早期融合”的方法,所有的pipeline從一開始就被映射到一個共同的表示空間,因此模型可以無縫處理文本和圖像。不過,任何事情都有正反兩面。早期融合的設(shè)計雖然可以使模型做到“無縫銜接”,但與此同時,也給模型訓練帶來了重大的技術(shù)挑戰(zhàn)。對此,Meta研究團隊引入了一系列架構(gòu)創(chuàng)新和訓練技術(shù)。

圖片8.png

數(shù)據(jù)結(jié)果表明,在純文本任務中,340億參數(shù)Chameleon的性能和Gemini-Pro相當;在視覺問答和圖像標注基準上,刷新SOTA,性能接近GPT-4V。

性能卓越,架構(gòu)獨特,Chameleon的未來將呈現(xiàn)怎樣的發(fā)展前景?

正如我們前面所提到的那樣,傳統(tǒng)上的文本生成模型會通過多任務指令調(diào)整以提高對各種任務指令的理解能力,而圖像生成模型則專門針對特定任務進行優(yōu)化。但是,Chameleon在圖像和文本生成任務上都采用了大規(guī)模多任務指令微調(diào),使其性能得到顯著提升。這表明了縮放策略在tokenizer-based圖像生成模型上的通用性。

譬如,以下4張圖像是按照下面的文字說明依次創(chuàng)建的:

圖片9.png

(1)撒哈拉沙漠中戴著草帽和霓虹太陽鏡的小仙人掌。

(2)一只人手的特寫照,手模特。高質(zhì)量。

(3)一只主角是浣熊的動漫人物,準備用武士刀進行史詩級戰(zhàn)斗。戰(zhàn)斗姿勢。幻想、插圖

(4)一塊寫著“1991年”的幻想風格停車標志。

此外,Chameleon在架構(gòu)上也具有自己的獨特之處。它使用了解碼器transformer,類似于常見的文本模型,這也是它與GPT-4o的相同之處。但是,Chameleon也具有與眾不同之處。它能夠輸入和生成文本和圖像,這使得其能夠處理多種任務,包括文本引導的圖像生成和編輯,文本到圖像生成,文本任務等,這無疑展現(xiàn)出了Chameleon的出色的性能。

它可以根據(jù)不同的提示生成簡短或長篇的字幕,并回答有關(guān)圖像的問題。

舉例來說,想象一只狗拿著一根棍子。

提示問題:狗拿著什么?

模型生成:棍子

提示:非常詳細地描述給定的圖像

模型生成:在這張圖片中,有一只狗用嘴叼著一根棍子。在畫面的背景中,還有草地和樹。

圖片10.png

如今,各式各樣的AI模型如雨后春筍般不斷冒頭,想要在一眾競爭對手中站穩(wěn)腳跟,就必須擁有核心競爭力。目前來看,Meta的Chameleon是很有競爭力的,它的的強大性能為更圖像生成工具帶來了更加連貫,更符合輸入提示的圖像生成能力。它不僅能夠處理復雜對象,還能夠在處理時涵蓋到多個約束條件的提示,展現(xiàn)出卓越的表現(xiàn)。這對于提高圖像生成的創(chuàng)造力和應用于元宇宙等領(lǐng)域有著積極意義。

AI能力進步速度快不快,與其訓練數(shù)據(jù)是否全面,是否具有偏見密切相關(guān)。所以,對于AI技術(shù)的應用,透明度將是加速進步的關(guān)鍵。如今,Chameleon的開源工作為多模態(tài)語言模型鋪平了道路,為更高質(zhì)量的圖像生成和理解邁出了堅實的一步,讓我們看到了更多的希望。

科技巨頭接連出新品帶來強勢利好,人工智能AIETF盤中漲超1.8%。

最近一段時間,AI賽道是相當熱鬧的,一眾科技巨頭爭相推出自己最新的AI大模型。

上周開始,OpenAI和谷歌分別推出了GPT-4o和升級版Gemini 1.5 Pro。在此之后,Meta也不落人后,于近日發(fā)布了“混合模態(tài)”基座模型Chameleon。科技巨頭接連推出新產(chǎn)品無疑形成了強勢利好,使得市場上出現(xiàn)了積極的反饋。

根據(jù)5月20日數(shù)據(jù)反饋,早盤人工智能AIETF(515070)小幅低開后走高,截止北京時間中午12:00,最高漲幅超過1.81%。而持倉股中中國軟件領(lǐng)漲超5%,太極股份,光迅科技,新易盛以及寒武紀等個股跟漲。

圖片11.png

2024年的AI行業(yè)處于群雄逐鹿的狀態(tài),無論是海外的科技巨頭,還是國內(nèi)一線的互聯(lián)網(wǎng)公司,都在積極訓練和迭代自身的模型能力,堪稱神仙打架。它們所推出的模型產(chǎn)品,無論從進階維度,還是從模型能力而言,都已經(jīng)上升到了極高的水準之上。大模型由最初的大語言模型向多模態(tài)不斷進階;從最基本的文本到文生圖,文生視頻的維度不斷擴充。

AI巨頭們連續(xù)發(fā)布的新品勢必會在全世界范圍內(nèi)掀起一波新的AI浪潮,在這波浪潮的帶動下,諸如人工智能AIETF,機器人ETF等AI產(chǎn)業(yè)鏈也會受到催化,從而刺激相關(guān)市場的上漲。


本文系作者授權(quán)數(shù)英發(fā)表,內(nèi)容為作者獨立觀點,不代表數(shù)英立場。
轉(zhuǎn)載請在文章開頭和結(jié)尾顯眼處標注:作者、出處和鏈接。不按規(guī)范轉(zhuǎn)載侵權(quán)必究。
本文系作者授權(quán)數(shù)英發(fā)表,內(nèi)容為作者獨立觀點,不代表數(shù)英立場。
未經(jīng)授權(quán)嚴禁轉(zhuǎn)載,授權(quán)事宜請聯(lián)系作者本人,侵權(quán)必究。
本內(nèi)容為作者獨立觀點,不代表數(shù)英立場。
本文禁止轉(zhuǎn)載,侵權(quán)必究。
本文系數(shù)英原創(chuàng),未經(jīng)允許不得轉(zhuǎn)載。
授權(quán)事宜請至數(shù)英微信公眾號(ID: digitaling) 后臺授權(quán),侵權(quán)必究。

    評論

    文明發(fā)言,無意義評論將很快被刪除,異常行為可能被禁言
    DIGITALING
    登錄后參與評論

    評論

    文明發(fā)言,無意義評論將很快被刪除,異常行為可能被禁言
    800

    推薦評論

    暫無評論哦,快來評論一下吧!

    全部評論(0條)

    主站蜘蛛池模板: 富川| 黄大仙区| 安康市| 青龙| 玉环县| 庆安县| 承德县| 罗平县| 万载县| 寿光市| 玉山县| 潼南县| 贵港市| 麻城市| 无为县| 万年县| 中西区| 岑巩县| 龙江县| 北流市| 平和县| 武定县| 柘荣县| 鲜城| 黄骅市| 灌云县| 会理县| 隆尧县| 元阳县| 湖北省| 安吉县| 休宁县| 赣州市| 佛冈县| 阳春市| 龙岩市| 吴江市| 萨嘎县| 夏津县| 合江县| 三门峡市|