6月26日,世界互聯(lián)網(wǎng)大會(huì)數(shù)字文明尼山對(duì)話在孔子故里山東曲阜開幕。此次對(duì)話主題為“人工智能時(shí)代:構(gòu)建交流、互鑒、包容的數(shù)字世界”。
今年以來(lái),以ChatGPT為代表的生成式人工智能掀起新一輪科技熱潮,國(guó)內(nèi)一些大模型的發(fā)布引發(fā)廣泛關(guān)注,海內(nèi)外互聯(lián)網(wǎng)企業(yè)也在應(yīng)用層面加快布局。生成式人工智能成為社會(huì)各界廣泛關(guān)注的話題。
近日,中國(guó)日?qǐng)?bào)網(wǎng)就此采訪清華大學(xué)新聞與傳播學(xué)院教授沈陽(yáng),以下為采訪實(shí)錄:
請(qǐng)您介紹一下目前國(guó)內(nèi)外生成式人工智能的發(fā)展現(xiàn)狀。
沈陽(yáng):目前看來(lái),現(xiàn)狀是高開快走、蓬勃發(fā)展。
第一個(gè)特點(diǎn)是高開快走:高開快走是指ChatGPT發(fā)布后,迅速將生成式人工智能應(yīng)用的智能性能提升到一個(gè)新高度。基本上每周都有一些新動(dòng)態(tài)出現(xiàn)。
第二個(gè)特點(diǎn)是開源領(lǐng)域發(fā)展迅速,如LLaMA模型(Large Language Model Meta AI,F(xiàn)acebook Meta AI推出的開源大模型)以及許多其他大語(yǔ)言模型出現(xiàn)。
對(duì)比國(guó)內(nèi)和國(guó)外,目前國(guó)內(nèi)發(fā)布的大模型與GPT-4.0仍存在差距。按照創(chuàng)新擴(kuò)散理論,這個(gè)差距可能會(huì)擴(kuò)大。因?yàn)樵趧?chuàng)新事物高速發(fā)展的過程中,也就是起飛期,領(lǐng)先者通常會(huì)擴(kuò)大與第二名之間的差距。但目前,人工智能仍具有一定的爭(zhēng)議性。我們認(rèn)為,下一步中國(guó)通過開源模型的進(jìn)一步迭代,完全有可能縮短與美國(guó)的差距。
對(duì)于新聞媒體行業(yè)來(lái)說(shuō),AIGC的出現(xiàn)以及大模型應(yīng)用,可能會(huì)給內(nèi)容生產(chǎn)帶來(lái)哪些影響?
沈陽(yáng):首先是生產(chǎn)成本大幅度下降。過去很多內(nèi)容需要人去編寫,現(xiàn)在可能已經(jīng)不需要這么多了。
第二點(diǎn),從形態(tài)來(lái)看,可能會(huì)出現(xiàn)大量?jī)?nèi)容是真實(shí)的,但混雜了一小部分假的內(nèi)容,這種形態(tài)可能比較普遍。這帶來(lái)了一個(gè)嚴(yán)重問題,即辨識(shí)真相的難度增加,這個(gè)問題也很突出。
第三個(gè)情況是傳播者有所變化。以前的傳播者大多是人,但隨著時(shí)間的推移,他們逐漸轉(zhuǎn)變?yōu)锳I賬號(hào)。美國(guó)已經(jīng)出現(xiàn)了一個(gè)純AI賬號(hào)的社區(qū)叫Chirper,這類網(wǎng)站中的AI賬號(hào)是主流、是博主。因此,從傳播源、傳播渠道到傳播者,都會(huì)發(fā)生很大的變化。
AI可以用于核查新聞事實(shí)嗎?
沈陽(yáng):AI既是核查事實(shí)的工具,又是需要被核查的對(duì)象,它是一把雙刃劍。一方面它通過多個(gè)信息渠道進(jìn)行交叉驗(yàn)證,另一方面我們知道大語(yǔ)言模型具有幻覺和一本正經(jīng)的胡說(shuō)八道的特點(diǎn)。因此,有時(shí)候它內(nèi)部產(chǎn)生的內(nèi)容需要我們進(jìn)一步核實(shí)。所以現(xiàn)在在搜索引擎加入大語(yǔ)言模型的版本里,它會(huì)提供原始鏈接。我們稱之為溯源追查,但真正的溯源仍需回歸現(xiàn)實(shí),所以記者的作用仍然非常重要。
對(duì)于媒體機(jī)構(gòu)和從業(yè)者,您認(rèn)為生成式人工智能技術(shù)面臨哪些風(fēng)險(xiǎn)和挑戰(zhàn)?未來(lái)我們應(yīng)該如何應(yīng)對(duì)?
沈陽(yáng):首先,美國(guó)已經(jīng)出現(xiàn)了無(wú)記者新聞。其次,大家對(duì)新聞交互性要求提高,出現(xiàn)了對(duì)話式新聞。第三點(diǎn)是,在閱讀新聞過程中,對(duì)于新聞所涉及的有傳播價(jià)值的敏感新聞點(diǎn),它具有擴(kuò)展閱讀需求。這對(duì)新聞界帶來(lái)了幾個(gè)重大挑戰(zhàn)。
首先,AIGC技能需要進(jìn)一步提升。對(duì)于每個(gè)記者來(lái)說(shuō),要進(jìn)一步提升AIGC技能,提升自己的生產(chǎn)力。因?yàn)槲覀兊母?jìng)爭(zhēng)對(duì)手并非AIGC本身,而是掌握AIGC技能的其他人。當(dāng)整個(gè)社會(huì)的人員逐步掌握AIGC時(shí),作為社會(huì)風(fēng)險(xiǎn)的洞察者,記者應(yīng)該優(yōu)先掌握高科技生產(chǎn)力的工具。這是第一個(gè)原因。
第二個(gè)方面是,記者對(duì)判斷消息真假的能力要求更高。無(wú)記者新聞或者剛才提到的AI幻覺等現(xiàn)象,都可能導(dǎo)致信息變異和失真的程度在某些領(lǐng)域增加,并且傳播速度更快。因此,記者的真實(shí)記錄能力變得更加重要。
第三個(gè)方面是AI具有自動(dòng)交互能力。原來(lái)的記者可能僅是發(fā)稿,現(xiàn)在可能需要培養(yǎng)合適的AI分身來(lái)進(jìn)行交互。當(dāng)人人都具有AI分身并進(jìn)行交互時(shí),記者的AI分身在這個(gè)過程中應(yīng)該有哪些特點(diǎn)?這是我們需要先行嘗試的。因此,我認(rèn)為這對(duì)我們帶來(lái)的挑戰(zhàn)非常巨大。
我國(guó)網(wǎng)信部門也就生成式人工智能的服務(wù)管理向社會(huì)公開征求意見,您對(duì)此如何看待?您關(guān)注哪些條款?
沈陽(yáng):我個(gè)人認(rèn)為,首先一定要精準(zhǔn)治理,但不要過度治理或不治理。為了快速促進(jìn)AIGC發(fā)展,日本最近的動(dòng)作相當(dāng)猛烈,他們將AIGC訓(xùn)練語(yǔ)料的版權(quán)全部放開。這對(duì)AIGC行業(yè)發(fā)展的影響會(huì)非常明顯。因此,我們一方面要考慮技術(shù)發(fā)展邏輯,另一方面要考慮國(guó)際形勢(shì)和各行業(yè)的勞動(dòng)替代問題,這是一個(gè)均衡的結(jié)果,不應(yīng)該偏廢某一方面。
沒有發(fā)展的治理,就談不上治理。沒有治理的發(fā)展也談不上好的發(fā)展。因此,我認(rèn)為一定要辯證地處理,這是我想談的第一個(gè)大觀點(diǎn)。
第二大觀點(diǎn)是,我們需要促進(jìn)生產(chǎn)力發(fā)展,同時(shí)提升生產(chǎn)力技術(shù)。在提升過程中,要避免對(duì)現(xiàn)有生產(chǎn)關(guān)系的沖擊,實(shí)現(xiàn)平緩過渡。當(dāng)我們不希望這些沖擊對(duì)社會(huì)結(jié)構(gòu)產(chǎn)生顛覆性影響時(shí),我們應(yīng)該采取措施。社會(huì)也需要適應(yīng)沖擊,因?yàn)闆]有風(fēng)險(xiǎn)就沒有收益。我們要盡可能讓沖擊平緩,讓大家可以承受,同時(shí)促進(jìn)生產(chǎn)力發(fā)展。目前的狀態(tài)是AI技術(shù)發(fā)展過快,這可能對(duì)社會(huì)結(jié)構(gòu)產(chǎn)生很大沖擊。因此,我們需要做好預(yù)判,并進(jìn)行精準(zhǔn)治理。
您認(rèn)為當(dāng)前大模型在訓(xùn)練提示詞及生成方面,是否需要考慮版權(quán)問題?通過AI生產(chǎn)出的數(shù)據(jù)代碼和圖文等內(nèi)容,版權(quán)應(yīng)該如何界定?
沈陽(yáng):這是一個(gè)大家還在討論的問題。首先是訓(xùn)練語(yǔ)料的版權(quán)問題。其次是訓(xùn)練完成后,與交互過程中提示詞的版權(quán)問題,這是一個(gè)新出現(xiàn)的問題。第三個(gè)是生產(chǎn)內(nèi)容的版權(quán)問題。
我們最近在研究一個(gè)課題叫做“最小版權(quán)識(shí)別單元”。對(duì)于文本來(lái)說(shuō),我們是否能在非篇章結(jié)構(gòu)上進(jìn)行版權(quán)保護(hù),而是在最小版權(quán)識(shí)別單元上進(jìn)行一些版權(quán)保護(hù),這是我們最近在探討的話題。
“最小版權(quán)識(shí)別單元”的意思是能識(shí)別出具有獨(dú)創(chuàng)性的知識(shí)產(chǎn)權(quán)的最小單元。以“最小版權(quán)識(shí)別單元”為例,這8個(gè)字組成的詞語(yǔ)從未被大家使用過,我將這部分保護(hù)起來(lái)。如果AI將這8個(gè)字連在一起,我們可能會(huì)懷疑它侵占了我們的獨(dú)創(chuàng)性智慧。在這種情況下,如果他們連用這8個(gè)字,我們是不是應(yīng)該詢問他們要支付版稅?
圖像和視頻的版權(quán)保護(hù)可能比文字處理更復(fù)雜,我們還在繼續(xù)研究。大家都在思考這些問題。總的原則是,首先應(yīng)該延續(xù)原有法律,能適用的盡量適用;其次,針對(duì)新出現(xiàn)的情況,我們應(yīng)該如何調(diào)整。
(編輯:王輝)