Sora火了,通用人工智能要來了 2024年02月27日09:03 | 來源:科技日報(bào) ◎本報(bào)記者崔 爽 2024年開年,Sora的橫空出世,給AI界投下一枚重磅炸彈。 這個由美國人工智能公司OpenAI發(fā)布的文生視頻模型,只需要一段提示文本,就能生成具有多個角色和特定動作類型,且主題和背景基本準(zhǔn)確的高清視頻。相較于Runway Gen 2、Pika等AI視頻生成應(yīng)用幾秒鐘連貫性的視頻產(chǎn)出,Sora可生成長達(dá)60秒的連續(xù)、穩(wěn)定、高品質(zhì)視頻,且提示文本越充分、細(xì)節(jié)越精確,生成的視頻越真實(shí)。 不過,出于可能被濫用的擔(dān)憂,OpenAI表示目前并沒有公開發(fā)布Sora的計(jì)劃。模型有限的訪問權(quán)限只被授予小部分研究人員和創(chuàng)意人士等群體,以便OpenAI獲取他們的使用反饋。 目前,官網(wǎng)上已更新了48個Sora生成的演示視頻。這些視頻清晰且真實(shí)的細(xì)節(jié)和超高的精度不禁引發(fā)人們思考:這是否意味著具備人類同等智能或超越人類智能的通用人工智能(AGI)的到來? Sora問世后,360集團(tuán)創(chuàng)始人周鴻祎發(fā)表了看法:Sora的出現(xiàn)讓AGI到來的時間提前了。原來估計(jì)需要十來年,現(xiàn)在可能只要兩三年。他認(rèn)為,Sora雖然看起來只是個文生視頻工具,但實(shí)際上是AI認(rèn)知世界并與之進(jìn)行交互的里程碑,會給整個產(chǎn)業(yè)帶來巨大進(jìn)步。 “實(shí)現(xiàn)AGI的技術(shù)路線多樣,涉及不同的研究方法和應(yīng)用方向?!敝袊茖W(xué)院自動化研究所副總工程師、紫東太初大模型中心常務(wù)副主任王金橋向科技日報(bào)記者介紹,目前,學(xué)術(shù)界和工業(yè)界廣泛討論的AGI技術(shù)路線主要有三條。一是信息智能,即“大數(shù)據(jù)+自監(jiān)督學(xué)習(xí)+大算力”。這種方法依賴大量數(shù)據(jù),通過自監(jiān)督學(xué)習(xí)算法來訓(xùn)練模型,同時需要巨大的計(jì)算能力來處理復(fù)雜任務(wù)。二是博弈智能。這種技術(shù)路線強(qiáng)調(diào)在人機(jī)交互中通過強(qiáng)化學(xué)習(xí)的方式訓(xùn)練智能體,使其能進(jìn)行自主學(xué)習(xí)和決策。三是類腦智能。這種方法試圖通過模仿人腦的運(yùn)行方式實(shí)現(xiàn)AGI。 “從技術(shù)上看,Sora避免極端暴力、色情、名人肖像等內(nèi)容出現(xiàn)的方式,主要依靠的是模型的對齊能力?!敝荜坑钫f,“這一點(diǎn)和語言模型的區(qū)別不大,也已經(jīng)有比較多的實(shí)踐經(jīng)驗(yàn)?!?span lang="EN-US"> 據(jù)國際數(shù)據(jù)公司預(yù)測,Sora將率先在短視頻、廣告、互動娛樂、影視制作和媒體等傳媒領(lǐng)域得到應(yīng)用。Sora的諸多能力,可以輔助這些領(lǐng)域的工作者更高效地進(jìn)行視頻創(chuàng)作,加快生產(chǎn)速度,提高產(chǎn)出數(shù)量。這將助力相關(guān)行業(yè)降低成本、提升效率,進(jìn)一步優(yōu)化用戶體驗(yàn)。 (責(zé)編:羅知之、陳鍵) |