sora是干什么的

2024-02-22 15:16:21

sora這款軟件很多用戶都有聽到過，這款軟件有什么功能呢，在哪可以體驗(yàn)sora呢，別著急，接下來跟著小編一起看看具體介紹吧。

sora官網(wǎng)入口地址

sora官網(wǎng)：點(diǎn)擊跳轉(zhuǎn)

1、Sora 是什么?

那么，Sora 到底是什么呢?

發(fā)布的首個(gè)文本生成視頻模型“Sora”，該模型通過接收文本指令，即可生成長(zhǎng)達(dá)60秒的短視頻。

2、Sora 的優(yōu)勢(shì)和不足

2.1 現(xiàn)實(shí)世界擬真

教人工智能理解和模擬運(yùn)動(dòng)中的物理世界，目標(biāo)是訓(xùn)練模型，幫助人們解決需要現(xiàn)實(shí)世界交互的問題。

讓機(jī)器能夠像人類一樣，對(duì)世界產(chǎn)生一個(gè)全面而準(zhǔn)確的認(rèn)知。這一特性使得AI視頻生成更流暢、更符合邏輯。

這個(gè)可以看文章后面官網(wǎng)的視頻，基本上看不出來是AI制作的，很逼真。

2.2 長(zhǎng)視頻能力

Sora 可以生成長(zhǎng)達(dá)一分鐘的視頻，同時(shí)保持視覺質(zhì)量并遵守用戶的提示。

這個(gè)能力應(yīng)該是當(dāng)前所有文本生成視頻模型所不具備的，在 Sora 沒出來之前，文本生成視頻領(lǐng)域的大哥應(yīng)該是 Runway，但是Runway也只能生成4秒長(zhǎng)的視頻，用戶可以將其最多延長(zhǎng)至16秒，是AI生成視頻在2023年所能達(dá)到的最長(zhǎng)時(shí)長(zhǎng)紀(jì)錄。

為啥生成視頻難?視頻一秒目前大概是16幀左右，兩秒就要生成32張圖片，而且圖片之間還要有連貫的邏輯。

2.3 多角色、更細(xì)節(jié)、更準(zhǔn)確

Sora 能夠生成具有多個(gè)角色、特定類型的運(yùn)動(dòng)以及主題和背景的準(zhǔn)確細(xì)節(jié)的復(fù)雜場(chǎng)景。

該模型不僅了解用戶在提示中要求的內(nèi)容，還了解這些東西在物理世界中的存在方式。

2.4 情感豐富、多鏡頭

Sora 模型對(duì)語言有深刻的理解，使其能夠準(zhǔn)確地解釋提示并生成表達(dá)生動(dòng)情感的引人注目的角色。

Sora 還可以在單個(gè)生成的視頻中創(chuàng)建多個(gè)鏡頭，以準(zhǔn)確保留角色和視覺風(fēng)格。

2.5 復(fù)雜場(chǎng)景難模擬、空間細(xì)節(jié)容易混淆——弱點(diǎn)

Sora 目前難以準(zhǔn)確模擬復(fù)雜場(chǎng)景的物理特性，并且可能無法理解因果關(guān)系的具體實(shí)例。例如，一個(gè)人可能會(huì)咬一口餅干，但之后，餅干可能沒有咬痕。

Sora 模型還可能混淆提示的空間細(xì)節(jié)，例如，左右混淆，并且可能難以精確描述隨時(shí)間推移發(fā)生的事件，例如遵循特定的相機(jī)軌跡。

2.6 檢測(cè)誤導(dǎo)內(nèi)容

Sora 團(tuán)隊(duì)還在構(gòu)建工具來幫助檢測(cè)誤導(dǎo)性內(nèi)容，例如檢測(cè)分類器，可以判斷視頻何時(shí)由 Sora 生成。

文本分類器將檢查并拒絕違反我們使用政策的文本輸入提示，例如那些請(qǐng)求極端暴力、色情內(nèi)容、仇恨圖像、名人肖像或他人 IP 的提示。

還開發(fā)了強(qiáng)大的圖像分類器，用于查看生成的每個(gè)視頻的幀數(shù)，以幫助確保在向用戶顯示視頻之前，這些視頻符合我們的使用政策。

其實(shí)這是所有AIGC工具的通病，這個(gè)也是合規(guī)的重要評(píng)判標(biāo)準(zhǔn)之一。

好了，以上就是小編今天帶來的所有內(nèi)容了。想要了解更多資訊就來非凡軟件站，快快收藏吧，更多精彩不容錯(cuò)過！

標(biāo)簽：

常用軟件

原創(chuàng)軟件推薦

sora是干什么的

相關(guān)文章推薦

最新文章推薦