短視頻行業將被AI顛覆嗎?
相似的時間點,更甚于上次的震撼。2月16日,曾以大模型ChatGPT震驚全球的人工智能科技公司OpenAI再次祭出新“王炸”——文生視頻大模型Sora,只需輸入一段文本指令,即可生成一段60秒的視頻,畫面精致細膩。
“AI(人工智能)成長速度比想象中更快!”有人對此振奮,也有人表達擔憂:“人類是否真的準備好了?”但越來越多的聲音認為,人工智能將引領第四次工業革命。
首個視頻大模型橫空出世
Sora并非首個文生視頻大模型。此前,科技巨頭谷歌、創業公司Runway等都已布局這一賽道。Sora何以驚艷全球?相比此前應用,它將生成視頻的時間大幅延長至60秒,在畫面的細致逼真、流暢程度、三維空間多角度呈現等方面也有明顯提升。
360集團創始人周鴻祎就談到了幾個讓他印象深刻的鏡頭:小狗在雪地玩耍濺起紛飛的雪粒,毛茸茸的毛發根根分明、隨風浮動;咖啡杯里,兩只帆船“纏斗”掀起翻涌的波浪水紋;不同角度的街景通過運鏡流暢地呈現。
跳出視頻領域,更深廣的變革或許正悄然發生。
周鴻祎談到,Sora的顛覆性絕不僅僅限于一個文字生成視頻的工具,而是通用人工智能對世界理解的又一次突破。一年前,ChatGPT標志著人工智能對人類語言和知識的理解達到了一個突破點。而除此之外,這個世界還有很多規律,例如小狗拱雪雪會留在鼻子上、無人機在空中飛時視角如何變換等,而Sora目前生成的視頻,顯示它對這個世界的規律有了更為完整的理解。這意味著,通用人工智能時代或將加速到來。
同濟大學人文學院特聘教授解學芳也認為,Sora的出現意味著AI理解真實世界的能力進一步躍升,但這類大模型的突破性發展未來也會受到算力、算法、倫理法規的制約,應對其保持積極且審慎的態度。
視頻行業格局或被重塑
Sora的橫空出世,讓視頻領域從業者感受到了危機。“太震撼,感覺要丟飯碗了。”北京某文化傳播有限公司創始人胡娟坦言,Sora讓她危機感陡增,“這完全可以用于鏡頭樣板,一些復雜的特效制作,以前工期至少得好幾天,但AI將其縮短到了幾分鐘。”
攝影師李浩楠認為,Sora對影視相關的產業影響比較大,能大幅拉低制作成本,特別是涉及多角度、多機位的視頻,如果AI能夠部分替代人工拍攝和剪輯,成本可能只要原來的十分之一。
Sora的技術突破也讓大大小小生成式AI創業公司和投資機構的前景變得充滿挑戰。某專注全球早中期企業的風投公司運營合伙人羅超表示,Sora表現出的領先性讓Runway、Pika Labs等視頻生成大模型明星公司面臨強力沖擊,而相比這些自研大模型公司,純做應用的創業公司則更加前途未卜。
在新壹科技CEO雷濤看來,Sora的誕生,無疑會改變AI視頻生成市場格局。“就國內而言,要看哪些企業能結合、利用新技術,完善符合國情的產品。”
AI讓“眼見不一定為實”
Sora展示的生成視頻也被發現有不少“穿幫”鏡頭。比如,在一段老奶奶吹蠟燭的視頻中,老奶奶吹氣后蠟燭卻沒有熄滅;在另一段玻璃杯從空中墜落的視頻中,玻璃杯剛被抬到半空,桌上就已經有水流出來了。
這也是目前文生視頻大模型的短板——不懂物理世界以及因果關系等。在中國政法大學傳播法研究中心副主任朱巍看來,大模型所生成的視頻代表著AI對這個世界規律的理解,但這不一定都是正確的,因此也讓“眼見不一定為實”。
更廣泛的擔憂,是視頻的可信度高于文字和圖片,一旦生成門檻被大幅降低,難辨真偽的虛假視頻可能會被用于傳播謠言、詐騙等非法領域。對此,朱巍認為,應參考此前針對生成式AI的相關規定,對AI生成內容予以標識。
此外,創作者用一段文字生成視頻后,該視頻的版權歸屬等問題也需要重新梳理。目前,針對AI生成文字或圖片的著作權歸屬問題已形成爭論。去年年底,北京互聯網法院就針對一起“人工智能生成圖”著作權侵權糾紛案做出一審判決,這也是我國首例涉及“AI文生圖”著作權案件。法官認為,人們利用生成式人工智能生成圖片時,本質上仍然是人利用工具進行創作,如果能體現出人的獨創性智力投入,就應當被認定為作品,受到著作權法的保護。