• <ul id="wsmey"></ul>
  • 用戶登錄投稿

    中國作家協(xié)會主管

    輸入《繁花》,Sora能演出爺叔看向阿寶的表情嗎
    來源:澎湃新聞 | 鄧建國  2024年02月22日09:03

    北京時(shí)間2月16日凌晨,OpenAI發(fā)布了文生視頻大模型Sora及多個(gè)樣例視頻。相比于此前的類似應(yīng)用,Sora更加強(qiáng)大,一經(jīng)宣布便在全球網(wǎng)絡(luò)世界產(chǎn)生巨大反響,好評如潮,熱度不斷。Sora仍在快速迭代中,是一個(gè)移動的靶子,我在這里作為一名文科(傳播學(xué))教授,僅從媒介學(xué)角度對Sora做出一些試探性的分析,這些分析也許明天就過時(shí)了,因此聊作一時(shí)和一家之言。

    Sora:“畫出不可畫者”(super-media)

    此前的ChatGPT 是文生文,Midjourney 是文生圖,Pika 和Runaway等是文生視頻,Sora 可以基于文字、圖像和視頻提示(prompts)生成視頻,但是相對于此前類似應(yīng)用,Sora生成的視頻時(shí)間更長(60秒),可以變換視角(平行或無人機(jī)視角)和焦距(微距、特寫、近景和遠(yuǎn)景等)、清晰度(高至1084K)和長寬比,還能根據(jù)用戶提示依據(jù)物理原理對視頻中的內(nèi)容向過去或未來推演,以及表達(dá)出如孤獨(dú)、熱鬧等情感色彩。

    Sora能實(shí)現(xiàn)如此強(qiáng)大的效果,技術(shù)基礎(chǔ)有很多,但最重要的包括基于英偉達(dá)NVIDIA RTX的虛擬引擎Unreal Engine 5,它實(shí)現(xiàn)了對各種“元素型媒介”的靜態(tài)和動態(tài)的模擬,包括交通場景、物理原理(水、牛奶、云、雪等的流動)和材料表面(玻璃、金屬、木材、磚瓦、織物和皮草等)。

    人類如何再現(xiàn)云、水、火、土等自然元素,一直是一個(gè)極具挑戰(zhàn)性的技術(shù)難題。彼得斯在《奇云》中引用藝術(shù)史學(xué)家休伯特·達(dá)米西(Hubert Damisch)在《論云》(Théorie du nuage,1972)一書中的論述指出:云如霧如氣的特點(diǎn)給繪畫帶來了特殊挑戰(zhàn),因?yàn)樗h忽不定,缺乏邊界,讓文藝復(fù)興時(shí)興起的“點(diǎn)—線—面”幾何透視原理無效。達(dá)·芬奇認(rèn)為,繪畫不能忽視如灰燼、泥土和云彩這樣的難以表現(xiàn)的物體,它們都是“沒有面的體”。

    云讓我們想起一個(gè)古老的哲學(xué)悖論(sorites paradox)——多少粒沙子可以算“一堆沙子”?其從量變到質(zhì)變的分界線在哪里?對之我們根本無法確定。和聲音及音樂一樣,云的存在體現(xiàn)于其消失的過程中,它流動不居、意義深遠(yuǎn)卻又含混不清,因此云能激發(fā)繪畫才智,是對創(chuàng)作者如何使用媒介(各類筆、墨、顏料和書寫表面)“畫出不可畫者”、“傳播不可傳播者”之能力的考驗(yàn)。繪畫和攝影中記錄云的歷史,就是人類努力去捕捉那些既感性又抽象之物的歷史。彼得斯認(rèn)為,云、水、火、土等自然元素能引發(fā)媒介實(shí)踐和媒介研究中的一個(gè)基本問題(problematic):在使用現(xiàn)有符號系統(tǒng)和媒介都無效時(shí),我們?nèi)绾稳ビ涗洿嬖谟跁r(shí)間之流中的變幻莫測、模糊不清和稍縱即逝之物?這個(gè)問題一直困擾著眾多藝術(shù)家、技術(shù)家和研究者

    今天,UE5和Sora的出現(xiàn)卻將以上問題化為烏有。通過Sora,OpenAI終于大聲宣布:看,這個(gè)媒介表征難題已經(jīng)不復(fù)存在!這就是為什么我們在OpenAI公布的視頻中幾乎處處都看到水(地中海城堡邊的潮水、咖啡杯中的船)、云(坐在云朵中閱讀的青年)和雪(金毛狗在雪中的玩耍)等。

    達(dá)米西指出,“中國有著一個(gè)強(qiáng)大的畫云(cloud painting)的傳統(tǒng);與歐洲人相比,中國人并不那么焦慮或意圖超越;在中國畫中,云多半與山脈和海洋相處融洽,而不是要高于山海之上”。我認(rèn)為,如“水”一樣,“云”作為“沒有面的體”,類似于不可編碼的默會知識,恰可作為象征中國傳播實(shí)踐和思想的典型意象。今天,既然Sora已經(jīng)解決了此前“不可表征”的技術(shù)難題,不遠(yuǎn)的未來它也很有可能將一切此前“不可畫出和不可傳播的”默會知識變成顯性知識。這讓我們不禁遐思,東西方文化溝通的障礙也許很快會被克服?

    Sora: 世界模擬器(world-modeling media)

    有些人高呼Sora導(dǎo)致了“物理規(guī)律的消失和現(xiàn)實(shí)的消失”,我認(rèn)為恰恰相反,Sora證明了物理規(guī)律的強(qiáng)大和現(xiàn)實(shí)的堅(jiān)韌。

    Sora作為一種強(qiáng)大的媒介,當(dāng)然具有現(xiàn)實(shí)建構(gòu)能力。我們可以根據(jù)媒介類型和它們在相關(guān)社會中滲透的廣度和深度來區(qū)分社會階段:“無媒介的社會”(比如口語社會)、“有媒介的社會”(比如文字和印刷社會)、“媒介社會”(比如廣播、電影和電視社會)和“媒介化社會”(互聯(lián)網(wǎng)、社交媒體和元宇宙和人工智能社會)。在“有媒介的社會”,媒介僅僅是社會的一部分,它的主要功能是表征(represent)現(xiàn)實(shí);但是在“媒介化社會”,媒介成為一種環(huán)境包裹著我們。此時(shí)媒介就能建構(gòu)(construct)現(xiàn)實(shí)——一個(gè)事件或人物如果不存在于媒介之中(不被媒體報(bào)道),就相當(dāng)于不存在。這里我們可以模仿貝克萊“存在就是被感知”的名言說,“存在就是被媒介報(bào)道”,或者“存在就是被媒介化(mediated)”。Sora是“媒介化社會”的原因和結(jié)果,所以說它建構(gòu)了現(xiàn)實(shí)當(dāng)然沒錯(cuò)。

    但Sora的強(qiáng)大之處并非它扭曲了物理規(guī)律和真實(shí)現(xiàn)實(shí),而是它理解、學(xué)習(xí)、順應(yīng)和利用了它們。Sora背后的原理非常復(fù)雜,我作為一個(gè)文科教授讀了半天技術(shù)文檔都沒特別弄懂,也許我根本弄不懂。但它使我想起了人工智能的先驅(qū)之一諾伯特·維納的提出的控制論。在二戰(zhàn)期間,控制論被用來指導(dǎo)計(jì)算機(jī)捕捉和分析敵軍轟炸機(jī)的體積、質(zhì)量、所處的位置、飛行速度和方向等信息,然后這些信息被自動輸入高射炮,并根據(jù)物理規(guī)律從轟炸機(jī)過去的位置預(yù)測其下一刻的位置,以指引高射炮的自動瞄準(zhǔn)和射擊。這里,控制論幫助高射炮實(shí)現(xiàn)了時(shí)空操縱。類似的,Sora 操縱了所謂“時(shí)空patches”, 甚至因具有“涌現(xiàn)”(emergence)能力——能夠模擬物理世界中的人、動物和環(huán)境。這也許就是為什么說Sora具有如易經(jīng)八卦一樣的“一生二、二生三、三生萬物”的建構(gòu)和模擬世界的能力。它也因此被稱為“世界模型”(world model)或者“世界模擬器”(world simulator)。OpenAI將這個(gè)世界模擬器取名為Sora——它的日文意思是“天空”。我理解為,這里的“天空”指“大氣(層)”。正因?yàn)橛写髿鈱樱庞辛诉m合人類居住的地球(世界)。正如大氣層是地球的模擬器(constructer/enabler)一樣,Sora將成為人類建構(gòu)各種“小世界”的模擬器。

    Sora:建構(gòu)元宇宙 (meta-media)

    我曾指出元宇宙的本質(zhì)是數(shù)字孿生,包括人、物和環(huán)境的數(shù)字孿生,從而最終建構(gòu)出一個(gè)與現(xiàn)實(shí)世界平行且交互的世界。我們此前用夢境、口語、圖畫、文字、鋼筋水泥建構(gòu)出各種想象的和真實(shí)的世界,包括遠(yuǎn)古的巖洞壁畫、荷馬史詩、曹雪芹筆下的大觀園以及動畫和現(xiàn)實(shí)中的迪士尼樂園和環(huán)球影城。

    Sora 所基于的技術(shù),如芯片算力、算法以及圖形渲染引擎UE 5等,都是建設(shè)元宇宙的基礎(chǔ)設(shè)施,因此我認(rèn)為它的出現(xiàn)是向著元宇宙方向的邁進(jìn)。我曾將元宇宙定義為:一個(gè)由具有強(qiáng)大記錄能力和傳輸能力的媒介支撐的3D網(wǎng)絡(luò)生態(tài),用戶遠(yuǎn)程登錄其中后可以實(shí)現(xiàn)遙在(teleport/telepresence),從而能如在網(wǎng)下世界一樣在3D網(wǎng)絡(luò)空間中進(jìn)行各種交互活動。這個(gè)被稱為元宇宙的3D網(wǎng)絡(luò)空間既可以是大寫的單數(shù)(Metaverse),更應(yīng)是小寫的復(fù)數(shù)(metaverses)。換句話說,它既可以是“大型元宇宙服務(wù)提供商”(Metaverse Service Provider)提供的龐大制作,也可以是普通用戶自己制作后在以上平臺上免費(fèi)或收費(fèi)提供給其他用戶的小制作和小體驗(yàn),或稱為“全息體驗(yàn)媒介產(chǎn)品”(holograms)。

    在不久以前,為制作這類元宇宙“自媒體”產(chǎn)品,用戶還需要使用AutoCAD、Omniverse或Horizon World(類似于2D媒體時(shí)代的生產(chǎn)工具Photoshop 或Premiere)等3D工具。和此前古代和現(xiàn)代的藝術(shù)高手一樣,今天普通人通過簡單的文字描述,使用Sora就可以將自己的想象高效和逼真地可視化,創(chuàng)造自己的元宇宙。

    因此,Sora出現(xiàn)的意義和500多年前印刷術(shù)、100多年前的“火腿電臺”(ham radio)、20年前的Web2.0(以社交媒體為代表)的意義是一樣的——它們可能彌合人與人之間在擁有元宇宙生成技術(shù)上的鴻溝(技術(shù)鴻溝),因而可能彌合相應(yīng)的技能鴻溝,進(jìn)而可能將所有人都平等地置于僅憑自己的頭腦和創(chuàng)意取勝的競技場上。盡管這一設(shè)想可能過于樂觀,但我們畢竟向這一天的到來靠近了許多。

    Sora:冷媒介?熱媒介?(cold media, hot media)

    Sora讓我們能簡便絲滑地從文、圖和簡單的視頻生成復(fù)雜和逼真的新視頻,這很容易讓我們忽視不同媒介介質(zhì)在傳播效果上的差異。舉例說明,一名聽眾聽不懂舒伯特的某個(gè)小提琴曲,去問他是何意。舒伯特沒有說話,只是拿起小提琴又拉了一遍;此人仍然聽不懂,舒伯特仍然不說話,再拉了一遍。此人仍然滿臉疑惑,請舒伯特解釋曲子的意思。最后舒伯特說,曲子就是曲子,何須文字?然后離場而去。類似的,同樣是文字,《六經(jīng)》精簡濃縮,氣象萬千,含義無窮,而后人對《六經(jīng)》的注釋洋洋灑灑,但具體而狹隘。因此何者意義更豐富?是“《六經(jīng)》注我”還是“我注《六經(jīng)》”?由此看,在Midjourney, Stable Diffusion、DALL-E 等文生圖和Sora文生視頻的轉(zhuǎn)換過程中,是增加了意義還是刪減了意義?例如,一位讀者認(rèn)為,閱讀《紅樓夢》文字版與看電視劇給她以相當(dāng)不同的感覺;電視劇刪掉了原著中很難視覺呈現(xiàn)的細(xì)節(jié),少了原著的原汁原味。她說,“電視劇看到的是具體的畫面,閱讀小說更多是激發(fā)自己的思考與感悟。” 這就是為什么《紅樓夢》會有許多人百看不厭,甚至去手抄它,珍藏它,考據(jù)它,辨析它,爭論它,以至于產(chǎn)生“紅學(xué)”的原因。我們讀莎士比亞的作品,百人百議,“一千個(gè)讀者眼中就有一千個(gè)哈姆萊特”,道理也類通。

    麥克盧漢區(qū)分了冷媒介和熱媒介。冷媒介具有低清晰度(模糊性)、高包容度和高受眾參與度;熱媒介具有高清晰度、低包容性,或者說低受眾參與度。文字屬于冷媒介,視頻屬于熱媒介。在Sora文生視頻的過程中,存在于抽象和模糊的文字中的萬千氣象也被圖片和視頻具體化和清晰化了,因此也造成了豐富意義的損失。此時(shí),文字讀者就被轉(zhuǎn)化成了視頻觀眾,喪失了能動性和參與性。這顯然利弊參半。

    Sora:貧媒介?富媒介?(poor media, rich media)

    目前看,Sora將對影視制作、廣告業(yè)、短視頻業(yè)和大學(xué)影視專業(yè)的人才培養(yǎng)形成進(jìn)一步的沖擊。以上行業(yè)分工精細(xì),環(huán)節(jié)眾多,包括舞美、化妝、道具到燈光、攝像、攝影,從演員、編劇、劇務(wù)和動畫特效等。現(xiàn)在這些環(huán)節(jié)面臨著被精簡優(yōu)化的壓力。但我認(rèn)為Sora并不能完全代替現(xiàn)實(shí)拍攝、制作和真人表演。

    使用AI建構(gòu)一個(gè)新的現(xiàn)實(shí)需要其具有極強(qiáng)大的細(xì)節(jié)控制能力。目前Sora生成的視頻還不能做到完全精確,有的細(xì)節(jié)破綻人的肉眼就可以識別,例如東京街頭姑娘邁步時(shí)的左右腳不太自然,人在搬椅子時(shí)椅子竟然會漂浮在空中,籃球會穿過籃筐的邊筐而過,幾只小狗會不斷地變幻出更多的效果,人咬了一口餅干但餅干上沒有咬痕等;有的破綻通過其他AI能識別,例如有人用谷歌Gemini 分析Sora生成的視頻,發(fā)現(xiàn)東京的飄雪過于均勻,從而判斷其可能是AI生成的。當(dāng)然,這些問題在Sora的不斷迭代中都很快能如破解物理題一樣地得到解決。但是目前看,Sora能接受的“提示詞”主要是可以被輕松視覺化的描述性文字,但抽象的、概念性的文字或觀點(diǎn)能否視覺化,如何視覺化,這是Sora下一步需要回答的問題。

    更重要的是,正是文字媒介與視覺媒介(圖片和視頻)之間的差異讓我們作為用戶很難以文字提示通過Sora的“人工智能黑箱”來精確地控制和輸出我們想要的圖片或視頻。我們說“一圖勝千言”,反過來這也意味著即使是通過“千言”也無法精確達(dá)到一張圖片更別說一個(gè)視頻的效果了。比如,在熱播劇《繁花》中,90歲的游本昌老師扮演的“爺叔”看到穿上精致西裝的寶總就仿佛看到了年輕時(shí)的自己。他短短幾秒的面部表情和眼神注視,仿佛訴盡了自己一生的悲喜,也看哭了無數(shù)人。我很難想象,用多少以及什么樣的文字作為提示詞才能讓Sora 精確地輸出“爺叔”如此登峰造極的表演效果。Sora表面的無所不能恰恰再一次證明了如游本昌先生這樣的老戲骨對于一部情感劇的不可或缺。

    1986年,美國傳播學(xué)者Richard Daft 和 Robert Lengel 提出了“媒介豐富度理論”(Media Richness)。該理論認(rèn)為,不同媒介在信息豐富度上有差異,可從四個(gè)維度來區(qū)分:媒介傳遞多重線索的能力(例如聲音的變化、手勢等)、反饋的即時(shí)性(媒介使接收者對信息做出反應(yīng)的速度)、語言的多樣性(例如文字、數(shù)學(xué)公式和藝術(shù)表達(dá)等)以及媒介的個(gè)性化定制能力(例如針對不同受眾定制內(nèi)容)。目前看,提示詞文字可以說是貧媒介,Sora輸出的視頻似乎是富媒介(按照前述麥克盧漢的冷媒介和熱媒介之分,其實(shí)未必)。然而,《繁花》中的“爺叔”用他有著90多年大上海閱歷的大腦操縱自己的數(shù)十塊面部肌肉和深如海洋般的眼神,對著“阿寶”展現(xiàn)出(可視化)他內(nèi)心的澎湃情感時(shí),在“爺叔的臉”這一富媒介面前,Sora的視頻輸出只能算得上非常貧瘠的媒介了。

    實(shí)際上,基于金宇澄先生的同名原著的電視劇 《繁花》聚焦于20世紀(jì)90年代初,講述了以阿寶為代表的小人物在時(shí)代浪潮下抓住機(jī)遇、施展才華,憑借迎難而上的勇氣和腳踏實(shí)地的魄力改寫命運(yùn)、自我成長的故事。劇情充滿著引人入勝的欲望、挑戰(zhàn)和沖突(人物與自我、與他人和與社會),包括追求 (幸福生活) 、冒險(xiǎn)、自我證明、復(fù)仇、救贖、蛻變、重生、自我發(fā)現(xiàn)等。此劇的人物刻畫也相當(dāng)精彩,每個(gè)身處其中的普通人都選擇了向商業(yè)對手挑戰(zhàn),向技術(shù)變革挑戰(zhàn),向個(gè)體命運(yùn)挑戰(zhàn),哪怕失敗也不放棄,笑對人生起伏。這些欲望、挑戰(zhàn)和沖突都是人類經(jīng)久不衰的主題, 因而使得電視劇具有了普遍性, 在作者、人物和觀眾三者之間形成一種共情,導(dǎo)致了《繁花》電視劇的熱播和熱議。

    這也意味著,即使Sora可以高效地和逼真地輸出很多個(gè)某一類型的長達(dá)60秒或以上的視頻片段,即使這些視頻片段能讓某些自媒體或普通用戶更便利更廉價(jià)地創(chuàng)作,某些類型的視頻片段的表演仍然只有像游本昌先生這樣的專業(yè)老戲骨才能勝任;能將這些片段以符合觀眾接受心理的方式流暢編織起來、講述一個(gè)如《繁花》一樣精彩和賣座的故事的,目前也仍然只能是由專業(yè)的講故事高手通過專業(yè)(同時(shí)也是昂貴)的設(shè)備才能實(shí)現(xiàn)。盡管人類創(chuàng)造力的高峰已經(jīng)被Sora等人工智能技術(shù)重重包圍,步步逼近,但最高處的紅旗仍將獵獵招展,高高飄揚(yáng)。

    Sora:舊媒介?新媒介?(old media, new media)

    自2007年第一部iPhone智能手機(jī)發(fā)布(“iPhone時(shí)刻”)開始,人類的數(shù)字內(nèi)容生產(chǎn)的“視覺轉(zhuǎn)向”(a visual turn)就啟動了。智能手機(jī)微小而便攜,極不利于內(nèi)容(尤其是文字內(nèi)容)的生產(chǎn),而特別有利于內(nèi)容(尤其是視頻內(nèi)容)的消費(fèi)。隨著智能手機(jī)在攝影攝像上的能力越來越強(qiáng),年輕人的短視頻制作和消費(fèi)能力也越來越強(qiáng),文字閱讀理解和表達(dá)能力則越來越弱。此時(shí),文字儼然已經(jīng)成為過時(shí)的舊媒介。

    但ChatGPT、Midjourney, Stable Diffusion 和Sora的出現(xiàn)似乎告訴我們,文字并沒有老去,而是突然華麗轉(zhuǎn)身,成為“一生萬物”的媒介之母。

    文字本身就具有多媒體潛能。德國媒介學(xué)者弗里德里克·基特勒(Friedrich Kittler)認(rèn)為,古希臘字母表具有如今天數(shù)字計(jì)算機(jī)一樣強(qiáng)大的多媒體能力,能通過單一的“代碼”從整體上捕捉、傳播和呈現(xiàn)出人類的存有經(jīng)驗(yàn)。他甚至將使用文字者比喻成坐在駕駛艙里的飛行員或游戲機(jī)屏幕前的玩家,可以隨心所欲地操縱“代碼”表達(dá)自己的體驗(yàn)。而“閱讀”是“讀者從小坐在母親膝上學(xué)會的一種制造‘內(nèi)在幻覺’(inner hallucination)的技巧。通過它,讀者能將文字拆解成音視頻甚至氣味和味道流媒體。”這也意味著,文字(例如計(jì)算機(jī)編程語言)實(shí)際上是多媒體的基礎(chǔ)媒介。

    相對于擬音的古希臘字母,中國的漢字更加具有多媒體特性。首先是各種形聲漢字,然后是歷代文人對形聲漢字的創(chuàng)造性使用,如白居易的名詩《琵琶行》“大弦嘈嘈如急雨,小弦切切如私語;嘈嘈切切錯(cuò)雜彈,大珠小珠落玉盤”;王維的“人閑桂花落,夜靜春山空;月出驚山鳥,時(shí)鳴春澗中”;現(xiàn)代詩人卞之琳的《斷章》“你站在橋上看風(fēng)景,看風(fēng)景的人在樓上看你。明月裝飾了你的窗子,你裝飾了別人的夢”。這些詩歌雖為文字,但無不字中有聲,有畫,有情。在形聲漢字、對它們的創(chuàng)造性應(yīng)用的基礎(chǔ)上,再加上敘事性(narrativity)后,文字變成了有情節(jié)的故事,因此就有創(chuàng)造世界(text as world)的奇幻能力。

    Sora的橫空出世告訴我們,即使在“視頻為王”的今天,影視業(yè)和短視頻從業(yè)者仍然不能拋棄文字,而要精通文字表達(dá)。比如要寫出這樣的提示詞,高超的文字能力必不可少:

    “猛犸象。未來幾個(gè)月誰都可以生成,提示語是:幾只巨大的長毛猛犸象穿過被雪覆蓋的草甸,它們長而柔軟的毛在風(fēng)中輕輕搖曳,遠(yuǎn)處的樹木被白雪覆蓋,壯觀的雪山在遠(yuǎn)處若隱若現(xiàn),午后陽光透過稀薄的云層,高懸在遠(yuǎn)方的太陽營造出一片溫暖的輝光。低角度的攝像機(jī)捕捉到了這些龐大毛茸茸哺乳動物的美麗瞬間,攝影技術(shù)精湛,景深效果迷人。”

    我們一直認(rèn)為媒介技術(shù)是線性“向前發(fā)展的”,“茍日新,日日新”,除舊布新。然而,本雅明認(rèn)為,時(shí)間不是一以貫之的線性連續(xù)體,而是充滿裂縫和捷徑——不妨說充滿“蟲洞”(wormhole)。通過這些蟲洞,歷史并非總是以單線展開,而可以以星羅棋布、群星燦爛的方式呈現(xiàn),“現(xiàn)在”與“過去”的某個(gè)時(shí)刻之間總是存在暗合。比如過去的時(shí)尚(格子襯衣、絡(luò)腮胡子和喇叭褲)死亡了,無處可尋,但在未來某個(gè)時(shí)候,它們又突然流行起來。正如有人指出,人類的存在也許是為了引出人工智能、賽博人乃至最終替代人類的硅基生命,我們今天認(rèn)為已經(jīng)是舊媒體的,也許會通過蟲洞“回到未來”成為未來的新媒體。ChatGPT和Sora作為嶄新的新媒介復(fù)活和強(qiáng)化了我們以為的舊媒介——文字。

    Sora:真媒介?假媒介?(true media, fake media)

    Sora輸出的視頻幾乎可以以假亂真,是否會造成深度偽造(deepfake)和假新聞(fake news)泛濫?媒體和大眾該如何應(yīng)對?

    確實(shí),人工智能技術(shù)被用于多模態(tài)的內(nèi)容生產(chǎn)(AIGC)固然可以降本增效,但同時(shí)也引入了深度偽造和假新聞的風(fēng)險(xiǎn)。最近美國巨星Taylor Swift就被“深度偽造”出色情內(nèi)容,引發(fā)輿論關(guān)注。美國政府尤其關(guān)注基于AI深度偽造的假新聞對2024總統(tǒng)大選的干預(yù)。通過Sora用戶可以用文字描述“某明星或某新聞人物作出某些行為”,并生成逼真的視頻,這對新聞?wù)鎸?shí)性和受眾認(rèn)知的危害程度更大。

    如果整個(gè)信息市場假冒偽劣產(chǎn)品盛行,公眾該會怎么辦呢?歷史告訴我們,在難以獲得事實(shí)的時(shí)候,人們一般會逐漸發(fā)明出以下機(jī)制來過濾信息:(1)增加信源數(shù)量并比較這些不同信源,從中解讀出可能的真相;(2)加入到社區(qū)中,借助集體智慧來共同分析、解讀和判斷各種信息可能的真假;(3)從甄別信息本身轉(zhuǎn)移到甄別信源,并憑著對信源的信賴來選擇相信哪些信息。

    這意味著,當(dāng)市場上充滿著難辨真假的信息時(shí),媒體機(jī)構(gòu)作為信源的公信力將變得更加重要,它們也因此要更加珍惜自己的羽毛。如果自媒體通過AIGC產(chǎn)生很多低質(zhì)量信息,機(jī)構(gòu)型媒體就不應(yīng)該將自己自媒體化,反而尤其要堅(jiān)持自己的操守進(jìn)行差異化競爭,以更多的更權(quán)威的事實(shí)來對沖自媒體的虛擬。如果一個(gè)機(jī)構(gòu)型媒體,一方面缺乏新聞現(xiàn)場的視覺信息,另一方面卻因?yàn)橐獫M足視頻發(fā)布的壓力或無法抵御流量的誘惑而使用Sora配上了虛擬的視頻,結(jié)果讓讀者/觀眾誤以為真,從而造成誤信誤傳,這首先是這個(gè)機(jī)構(gòu)型媒體自身不顧自己的品牌形象逾越了真實(shí)與虛擬之間的界限的問題,而不是讀者/受眾是否具有識別真假視頻的能力問題。

    對于媒體而言,視頻記者和編輯的工作是否會被替代?新聞從業(yè)者應(yīng)該如何適應(yīng)“Sora時(shí)代”?我認(rèn)為,新聞報(bào)道追求真實(shí)(facts),而Sora幾乎全是虛擬(fictions),因此我認(rèn)為和chatGPT不同,Sora從本質(zhì)上它對新聞業(yè)應(yīng)用面不廣,甚至只有壞處沒有好處,除非新聞業(yè)淪為“創(chuàng)意業(yè)”。我想,Sora唯一可以被新聞業(yè)利用的也許是記者建構(gòu)在新聞事實(shí)基礎(chǔ)上的新聞現(xiàn)場的情景再現(xiàn)。

    “視頻記者”這四個(gè)字中重要的不是“視頻”而是“記者”。如果記者沒有腳力、眼力、腦力和筆力,而僅僅滿足于坐在空調(diào)房里進(jìn)行網(wǎng)絡(luò)內(nèi)容搜索和拼湊,或者不斷使用人工智能炮制內(nèi)容,那么這些記者在任何時(shí)候都應(yīng)該被人工智能替代。

    還需要指出的是,新聞業(yè)不能將對“新聞”的追逐異化成對“技術(shù)”的追逐。毋庸置疑,新聞業(yè)一直以來對技術(shù)保持高度敏感,這很有必要。例如在19世紀(jì),路透社和美聯(lián)社先后爭相使用鴿子、汽船、電報(bào)和電話等新媒體,其目的盡可能縮短“新聞的爆發(fā)”與“新聞為受眾接受到”兩者間的時(shí)間差。我認(rèn)為,新聞機(jī)構(gòu)的采納新媒體技術(shù)的指導(dǎo)原則應(yīng)該是“技術(shù)服務(wù)新聞”而不是相反。新媒介技術(shù)如果有利于更好地報(bào)道新聞,則應(yīng)該盡快采納,如果不利于更好地報(bào)道新聞,則應(yīng)暫緩采納。在各種“虛擬現(xiàn)實(shí)”技術(shù)盛行的今天,新聞業(yè)應(yīng)該更加堅(jiān)守“現(xiàn)實(shí)”本身。如果主動放棄自己的“現(xiàn)實(shí)”陣地不加區(qū)別地?fù)肀摂M現(xiàn)實(shí),這是新聞業(yè)自毀長城的失敗,而不是虛擬現(xiàn)實(shí)技術(shù)所向披靡的成功。

    對于Sora帶來的隱憂,管理部門應(yīng)該如何應(yīng)對?我認(rèn)為,技術(shù)革新在以加速度進(jìn)行,管理注定會滯后。讓事情更為棘手的是,從平臺算法開始到現(xiàn)在的人工智能,由于涉及海量數(shù)據(jù)、極為復(fù)雜的算法以及眾多用戶與chagGPT及Sora的個(gè)性化互動,即使時(shí)人工智能專家(比如OpenAI CEO Altman)也無法精確預(yù)測和解釋人工智能給出的每一個(gè)輸出背后的原因。這給對AI的規(guī)制帶來了前所未有的挑戰(zhàn)。

    Sora目前還沒有對大眾開放,估計(jì)要到美國總統(tǒng)大選之后。Open AI將對Sora生成的視頻設(shè)置類似于對DALL-E的限制:禁止暴力、色情、盜用真人形象和已知藝術(shù)家的創(chuàng)作風(fēng)格;它還將在生成的視頻中嵌入代碼以將其與人工拍攝的視頻區(qū)別開來。但從文字開始,媒介技術(shù)就是生產(chǎn)復(fù)制品(化身、幻影、鬼魂)的工具,也因此帶來了版權(quán)侵害和偽造的風(fēng)險(xiǎn)。我們要從技術(shù)生產(chǎn)者、政策制定者、新聞媒體、教育機(jī)構(gòu)和用戶等多方面共同規(guī)制AIGC。人工智能體現(xiàn)了人類的聰明才智,如何揚(yáng)長避短地規(guī)制人工智能,需要人類發(fā)揮出相同甚至更多聰明才智。這是對人類智慧的巨大考驗(yàn)。目前來看,Sora還不會對我國帶來什么風(fēng)險(xiǎn)。不過我覺得,對新技術(shù)的規(guī)制永遠(yuǎn)要基于數(shù)據(jù)風(fēng)險(xiǎn)防控和人工智能收益之間的平衡。

    結(jié)語: “天空”雖美,仍需一樹《繁花》

    加拿大媒介學(xué)者麥克盧漢說,媒介是人體的延申。德國媒介學(xué)者基特勒對此不同意。他認(rèn)為,菜刀或至多汽車,也許可以說是人體的延申,但計(jì)算機(jī)的工作原理跟人體的工作原理完全不一樣,因此說計(jì)算機(jī)是人體的延申就顯得人類有些自不量力了。到目前為止,主要的面向普通用戶的AI技術(shù),包括ChatGPT、Midjourney, Stable Diffusion、DALL-E、Gemini和Sora等,即使是技術(shù)專家在我們普通人面前就著技術(shù)文檔講解三個(gè)小時(shí),我們也根本不會明白它們的技術(shù)原理。AI早已成為技術(shù)黑箱,OpenAI也必然是ClosedAI。 所以我以上的所有分析都是一名文科教授都是建立在OpenAI目前公布的Sora視頻和它的公開宣稱之上的,少不了主觀臆測成分。很有可能,2月16日以來我們經(jīng)歷的關(guān)于Sora的火爆情形只是OpenAI通過Sora生成一個(gè)長達(dá)幾天的逼真視頻。你也許會問,這一切難道是假的?怎么可能?是呀,怎么可能是假的呢?但在我們?nèi)找姹蝗斯ぶ悄馨鼑纳疃让浇榛鐣校芽柕姆磫栐诨仨懀杭词鼓憧吹降囊磺幸苍S是真的,但你如何能排除它是假的的可能呢?—— 你如何排除“缸中大腦”的可能?是的,我不能排除,但因?yàn)槲矣猩眢w,因?yàn)槲彝涣恕盃斒濉钡哪槪胰匀粓?jiān)信:“天空”(Sora)雖美,仍需一樹《繁花》。(作者系復(fù)旦大學(xué)新聞學(xué)院傳播學(xué)系教授、博導(dǎo))

    精品一久久香蕉国产线看播放| 老汉精品免费AV在线播放| 日韩精品无码免费专区网站| 日本精品视频一视频高清| 亚洲国产精品无码久久久蜜芽 | 精品97国产免费人成视频| 亚洲国产精品成人午夜在线观看| 四虎成人精品无码永久在线 | 成人伊人精品色XXXX视频| 精品亚洲成A人无码成A在线观看 | 久久久久久国产精品无码下载| 国产精品久久久久一区二区三区| 91精品国产免费入口| 久久国产视频精品| 中文字幕一区二区三区日韩精品| 综合91在线精品| 中文精品久久久久国产网址| 国产精品成人99久久久久 | 亚洲精品无码成人片久久| 影院无码人妻精品一区二区 | 99久久99这里只有免费的精品| 无码精品蜜桃一区二区三区WW| 日本精品视频一区二区三区| 亚洲啪AV永久无码精品放毛片 | 精品国产男人的天堂久久| 亚洲精品无码专区久久| 97久久久久人妻精品专区| 国产精品久久99| 精品久久久噜噜噜久久久| 91精品国产综合久久青草| 99久久99热精品免费观看国产| 香蕉久久夜色精品国产小说| selaoban在线视频免费精品| 国产亚洲女在线线精品| 国产精品一区二区四区| 国产精品秦先生手机在线| 97久久精品一区二区三区| 99久久免费看国产精品| 亚洲乱码日产精品BD在线观看| 91精品久久国产青草| 亚洲乱人伦精品图片|