人工智能正在經(jīng)歷一場(chǎng)無(wú)聲的革命。這項技術(shù)不僅超越了書(shū)面語(yǔ)言,融合了多種媒體,而且朝著(zhù)更高的目標努力,即更全面、更徹底地了解世界。ChatGPT只有6個(gè)月的歷史,已經(jīng)有些過(guò)時(shí)了。
這個(gè)程序及其“近親”被稱(chēng)為大規模語(yǔ)言模型,它使用統計方法來(lái)預測、組合和表達句子。研究人員用更多的文本訓練這些程序,假設強制向不同配置的機器提供語(yǔ)料庫可以提高預測能力和程序智能。這種文本最大化的人工智能開(kāi)發(fā)方法在過(guò)去幾年中一直是主流。
然而,類(lèi)似初代ChatGPT的純語(yǔ)言模型正在退場(chǎng),取而代之的是可以處理圖像、音頻甚至感官數據的機器。這種新模式可能反映了人類(lèi)對智能更人性化的理解,是模擬兒童通過(guò)觀(guān)察世界進(jìn)行學(xué)習的初步嘗試。企業(yè)也可以借此開(kāi)發(fā)能力更全面的AI,進(jìn)而將其整合到更多產(chǎn)品中。除了GPT-4和Bard,許多程序也有各自開(kāi)發(fā)的拓展功能。這些程序被稱(chēng)為多模態(tài)模型——文本和圖像都是其中的模態(tài)——許多研究人員希望可以借其將AI提升到新高度。
理論上說(shuō),多模態(tài)方法可以解決純語(yǔ)言模型的核心難點(diǎn)——即使能流暢地串聯(lián)單詞,卻無(wú)法將其同概念、觀(guān)點(diǎn)、事物或活動(dòng)聯(lián)系起來(lái)。學(xué)習更多類(lèi)型的數據,能夠幫助AI模型對外部環(huán)境進(jìn)行想象和交互,進(jìn)行接近現實(shí)的輸出,甚至為了解決問(wèn)題而捏造真相。如果模型了解世界,自行捏造事物的可能性就會(huì )減少。多模態(tài)模型的構建并非是新鮮事物,但近幾年來(lái),AI研究的幾項關(guān)鍵成果使得跨領(lǐng)域方法愈發(fā)可行。
這種變化也有其現實(shí)原因,因為不論互聯(lián)網(wǎng)看起來(lái)多大,AI可以用于訓練的文本數量都是有限的,其程序的規模和靈敏度,以及可應用的計算能力,都要受到現實(shí)制約。相比于ChatGPT,多模態(tài)AI在理解世界和語(yǔ)言流暢層面的提升仍有待討論。許多程序都被證實(shí)存在一定程度的不足,但研究仍處于早期階段,未來(lái)幾年仍將不斷提升。
要想真正讓AI模擬人類(lèi)的思維,我們還有很長(cháng)的路要走。增加投喂的文本數據無(wú)法解決AI模型的偏差和虛假問(wèn)題,拓展投喂數據的類(lèi)型也不一定會(huì )解決此類(lèi)問(wèn)題。如果程序吸納了有偏差的文本和圖像,其輸出仍然是有害的,而且傳播形式會(huì )更廣。相比只能處理語(yǔ)言的模型,多模態(tài)AI對某些特定操作可能更加敏感,例如對圖像關(guān)鍵像素的篡改。除了智能層面,多模態(tài)AI也是很好的商業(yè)命題。
本文標題: 只有6個(gè)月大的ChatGPT怎么就有些過(guò)時(shí)了?
本文地址: http://m.guizhouboda.com/brand/news-cc6ib92cd.html
內容均來(lái)源于網(wǎng)絡(luò ),錯誤糾正或刪除請發(fā)郵件,收件郵箱kefu@huangye88.com
2009-2025 黃頁(yè)88版權所有 京ICP備2023012932號-1 │ 京公網(wǎng)安備 11010802023561號 京ICP證100626
內容均來(lái)源于網(wǎng)絡(luò ),錯誤糾正或刪除請發(fā)郵件,收件郵箱kefu@huangye88.com