2024-02-22 15:16:21
sora這款軟件很多用戶都有聽到過,這款軟件有什么功能呢,在哪可以體驗(yàn)sora呢,別著急,接下來跟著小編一起看看具體介紹吧。
sora官網(wǎng)入口地址
sora官網(wǎng):點(diǎn)擊跳轉(zhuǎn)
1、Sora 是什么?
那么,Sora 到底是什么呢?
發(fā)布的首個(gè)文本生成視頻模型“Sora”,該模型通過接收文本指令,即可生成長(zhǎng)達(dá)60秒的短視頻。
2、Sora 的優(yōu)勢(shì)和不足
2.1 現(xiàn)實(shí)世界擬真
教人工智能理解和模擬運(yùn)動(dòng)中的物理世界,目標(biāo)是訓(xùn)練模型,幫助人們解決需要現(xiàn)實(shí)世界交互的問題。
讓機(jī)器能夠像人類一樣,對(duì)世界產(chǎn)生一個(gè)全面而準(zhǔn)確的認(rèn)知。這一特性使得AI視頻生成更流暢、更符合邏輯。
這個(gè)可以看文章后面官網(wǎng)的視頻,基本上看不出來是AI制作的,很逼真。
2.2 長(zhǎng)視頻能力
Sora 可以生成長(zhǎng)達(dá)一分鐘的視頻,同時(shí)保持視覺質(zhì)量并遵守用戶的提示。
這個(gè)能力應(yīng)該是當(dāng)前所有文本生成視頻模型所不具備的,在 Sora 沒出來之前,文本生成視頻領(lǐng)域的大哥應(yīng)該是 Runway,但是Runway也只能生成4秒長(zhǎng)的視頻,用戶可以將其最多延長(zhǎng)至16秒,是AI生成視頻在2023年所能達(dá)到的最長(zhǎng)時(shí)長(zhǎng)紀(jì)錄。
為啥生成視頻難?視頻一秒目前大概是16幀左右,兩秒就要生成32張圖片,而且圖片之間還要有連貫的邏輯。
2.3 多角色、更細(xì)節(jié)、更準(zhǔn)確
Sora 能夠生成具有多個(gè)角色、特定類型的運(yùn)動(dòng)以及主題和背景的準(zhǔn)確細(xì)節(jié)的復(fù)雜場(chǎng)景。
該模型不僅了解用戶在提示中要求的內(nèi)容,還了解這些東西在物理世界中的存在方式。
2.4 情感豐富、多鏡頭
Sora 模型對(duì)語言有深刻的理解,使其能夠準(zhǔn)確地解釋提示并生成表達(dá)生動(dòng)情感的引人注目的角色。
Sora 還可以在單個(gè)生成的視頻中創(chuàng)建多個(gè)鏡頭,以準(zhǔn)確保留角色和視覺風(fēng)格。
2.5 復(fù)雜場(chǎng)景難模擬、空間細(xì)節(jié)容易混淆——弱點(diǎn)
Sora 目前難以準(zhǔn)確模擬復(fù)雜場(chǎng)景的物理特性,并且可能無法理解因果關(guān)系的具體實(shí)例。例如,一個(gè)人可能會(huì)咬一口餅干,但之后,餅干可能沒有咬痕。
Sora 模型還可能混淆提示的空間細(xì)節(jié),例如,左右混淆,并且可能難以精確描述隨時(shí)間推移發(fā)生的事件,例如遵循特定的相機(jī)軌跡。
2.6 檢測(cè)誤導(dǎo)內(nèi)容
Sora 團(tuán)隊(duì)還在構(gòu)建工具來幫助檢測(cè)誤導(dǎo)性內(nèi)容,例如檢測(cè)分類器,可以判斷視頻何時(shí)由 Sora 生成。
文本分類器將檢查并拒絕違反我們使用政策的文本輸入提示,例如那些請(qǐng)求極端暴力、色情內(nèi)容、仇恨圖像、名人肖像或他人 IP 的提示。
還開發(fā)了強(qiáng)大的圖像分類器,用于查看生成的每個(gè)視頻的幀數(shù),以幫助確保在向用戶顯示視頻之前,這些視頻符合我們的使用政策。
其實(shí)這是所有AIGC工具的通病,這個(gè)也是合規(guī)的重要評(píng)判標(biāo)準(zhǔn)之一。
好了,以上就是小編今天帶來的所有內(nèi)容了。想要了解更多資訊就來非凡軟件站,快快收藏吧,更多精彩不容錯(cuò)過!