
這份管理辦法(征求意見(jiàn)稿)共計(jì)21條,從適用范圍看,既包括了提供生成式人工智能服務(wù)的主體,也包括使用這些服務(wù)的組織和個(gè)人;管理辦法覆蓋了生成式人工智能輸出內(nèi)容的價(jià)值導(dǎo)向、服務(wù)提供方的訓(xùn)練原則、隱私權(quán)/知識(shí)產(chǎn)權(quán)等各項(xiàng)權(quán)利的保護(hù)等等。
GPT類生成式自然語(yǔ)言大模型及產(chǎn)品出現(xiàn)后,既讓公眾體驗(yàn)到了人工智能的飛躍式進(jìn)步,也暴露出安全風(fēng)險(xiǎn),包括產(chǎn)生帶偏見(jiàn)和歧視性的內(nèi)容、數(shù)據(jù)泄露、侵犯隱私、AI造假等問(wèn)題。全球范圍,各國(guó)對(duì)人工智能的監(jiān)管漸成趨勢(shì)。
在中國(guó),《生成式人工智能服務(wù)管理辦法》一旦出臺(tái),國(guó)內(nèi)生成式AI的大模型及產(chǎn)品提供方不能再無(wú)序亂“卷”了,采用者使用生成式AI時(shí)也有了規(guī)范圈。
1.為生成內(nèi)容設(shè)“禁區(qū)”
“研發(fā)、利用生成式人工智能產(chǎn)品,面向中華人民共和國(guó)境內(nèi)公眾提供服務(wù)的,適用本辦法。
本辦法所稱生成式人工智能,是指基于算法、模型、規(guī)則生成文本、圖片、聲音、視頻、代碼等內(nèi)容的技術(shù)。”
4月11日,網(wǎng)信辦公布的《生成式人工智能服務(wù)管理辦法(征求意見(jiàn)稿)》(以下簡(jiǎn)稱《辦法》)在第二條中明確了《辦法》的適用主體和“生成式人工智能”的定義。
從該條內(nèi)容看,諸如百度、阿里、騰訊、華為等目前已經(jīng)公開(kāi)表示有生成式大模型及產(chǎn)品的公司,如果對(duì)中國(guó)境內(nèi)用戶提供服務(wù),將在《辦法》的管理范圍內(nèi),而用戶使用相關(guān)產(chǎn)品和服務(wù),也需要遵守《辦法》的規(guī)定。
《辦法》也強(qiáng)調(diào)了,國(guó)家支持人工智能算法、框架等基礎(chǔ)技術(shù)的自主創(chuàng)新、推廣應(yīng)用、國(guó)際合作,鼓勵(lì)優(yōu)先采用安全可信的軟件、工具、計(jì)算和數(shù)據(jù)資源。
在這一前提下,《辦法》為生成式人工智能產(chǎn)品或服務(wù)的提供方劃定了“禁區(qū)”,包括生成的內(nèi)容和研發(fā)的基本原則。
在內(nèi)容上,《辦法》要求:利用生成式人工智能生成的內(nèi)容應(yīng)當(dāng)體現(xiàn)社會(huì)主義核心價(jià)值觀,不得含有顛覆國(guó)家政權(quán)、推翻社會(huì)主義制度,煽動(dòng)分裂國(guó)家、破壞國(guó)家統(tǒng)一,宣揚(yáng)恐怖主義、極端主義,宣揚(yáng)民族仇恨、民族歧視,暴力、淫穢色情信息,虛假信息,以及可能擾亂經(jīng)濟(jì)秩序和社會(huì)秩序的內(nèi)容;利用生成式人工智能生成的內(nèi)容應(yīng)當(dāng)真實(shí)準(zhǔn)確,采取措施防止生成虛假信息。
在研發(fā)上,《辦法》要求提供方在算法設(shè)計(jì)、訓(xùn)練數(shù)據(jù)選擇、模型生成和優(yōu)化、提供服務(wù)等過(guò)程中,采取措施防止出現(xiàn)種族、民族、信仰、國(guó)別、地域、性別、年齡、職業(yè)等歧視。
從這些要求看,《辦法》基本涵蓋了市面上的自然語(yǔ)言大模型產(chǎn)品在用戶實(shí)操中暴露出來(lái)的安全及倫理問(wèn)題,包括產(chǎn)生歧視性偏見(jiàn)、虛假信息等內(nèi)容
人類借由生成式AI產(chǎn)出的問(wèn)題內(nèi)容已經(jīng)層出不窮地出現(xiàn)在網(wǎng)絡(luò)上。
比如,ChatGPT曾為用戶咨詢“如何入店行竊”時(shí)提供過(guò)步驟,盡管附上了“入店行竊違法的提示”;它的“角色扮演”功能曾被用戶誘導(dǎo)以DAN(DoAnytingNow)身份回答問(wèn)題,給出的答案里出現(xiàn)了“爆粗口”的情況;還有人用ChatGPT測(cè)試的假消息在國(guó)內(nèi)傳播,成了“辟謠”的內(nèi)容。
微軟集合進(jìn)搜素引擎Bing的聊天機(jī)器人,被海外媒體人曝光“辱罵用戶”;AI生圖應(yīng)用Midjourney更是被人利用造出過(guò)“教皇穿巴黎世家羽絨服”、“馬斯克與通用汽車CEO約會(huì)”的假圖,甚至還有人用它制造了各種不存在的地震歷史和太陽(yáng)風(fēng)暴災(zāi)害等等。

有關(guān)教皇(左)與馬斯克的假圖
針對(duì)虛假信息、辨別AI生成內(nèi)容層面,《辦法》要求提供者從源頭上“能夠保數(shù)據(jù)的真實(shí)性、準(zhǔn)確性、客觀性、多樣性”;應(yīng)當(dāng)按照《互聯(lián)網(wǎng)信息服務(wù)深度合成管理規(guī)定》對(duì)生成式的圖片、視頻等內(nèi)容進(jìn)行標(biāo)識(shí);而生成式人工智能產(chǎn)品研制中采用人工標(biāo)注時(shí),提供者應(yīng)當(dāng)制定符合本辦法要求,清晰、具體、可操作的標(biāo)注規(guī)則,對(duì)標(biāo)注人員進(jìn)行必要培訓(xùn),抽樣核驗(yàn)標(biāo)注內(nèi)容的正確性。
中國(guó)監(jiān)管為生成式人工智能的內(nèi)容設(shè)置禁區(qū),某種程度上也是在要求提供大模型及產(chǎn)品的企業(yè)把好預(yù)訓(xùn)練和數(shù)據(jù)的關(guān)。
2.強(qiáng)調(diào)數(shù)據(jù)來(lái)源和個(gè)人信息保護(hù)
除了對(duì)生成內(nèi)容強(qiáng)調(diào)價(jià)值觀導(dǎo)向、社會(huì)公德、遵守法律及反歧視外,《辦法》也對(duì)生成式人工智能相關(guān)的預(yù)訓(xùn)練及數(shù)據(jù)來(lái)源、個(gè)人信息保護(hù)等權(quán)益做出要求。
例如,《辦法》要求,提供者應(yīng)當(dāng)對(duì)生成式人工智能產(chǎn)品的預(yù)訓(xùn)練數(shù)據(jù)、優(yōu)化訓(xùn)練數(shù)據(jù)來(lái)源的合法性負(fù)責(zé),不含有侵犯知識(shí)產(chǎn)權(quán)的內(nèi)容;數(shù)據(jù)包含個(gè)人信息的,應(yīng)當(dāng)征得個(gè)人信息主體同意;對(duì)用戶輸入信息和使用記錄承擔(dān)保護(hù)義務(wù),不得非法留存能夠判斷出用戶身份的輸入信息,不得根據(jù)用戶輸入信息和使用情況進(jìn)行畫像,不得向他人提供用戶輸入信息。
生成式AI產(chǎn)生的數(shù)據(jù)侵權(quán)問(wèn)題也確實(shí)存在,比如,用戶在使用對(duì)話式機(jī)器人滿足一些工作需求時(shí),難免會(huì)上傳公司的資料,如不注意,很可能造成商業(yè)秘密的泄露。此前,韓國(guó)電子巨頭三星在對(duì)ChatGPT提出“限問(wèn)令”后就表示,內(nèi)部數(shù)據(jù)因員工與該應(yīng)用的交互而出現(xiàn)泄露。
《辦法》不僅指向生成式人工智能產(chǎn)品和服務(wù)的提供者,也對(duì)產(chǎn)品和服務(wù)使用者劃定了原則。
比如,不利用生成內(nèi)容損害他人形象、名譽(yù)及其他合法權(quán)益,不進(jìn)行商業(yè)炒作、不正當(dāng)營(yíng)銷。
由于《辦法》時(shí)根據(jù)上位法《中華人民共和國(guó)網(wǎng)絡(luò)安全法》《中華人民共和國(guó)數(shù)據(jù)安全法》《中華人民共和國(guó)個(gè)人信息保護(hù)法》等法律、行政法規(guī)制定,這些法律法規(guī)將適用于違反《辦法》的行為,包括侵犯知識(shí)產(chǎn)權(quán)、侵犯?jìng)€(gè)人信息等違法行為。
《辦法》共計(jì)21條,其中有13條明確針對(duì)“提供者”,即利用生成式人工智能產(chǎn)品提供聊天和文本、圖像、聲音生成等服務(wù)的組織和個(gè)人。

公眾可通過(guò)三條途徑反饋意見(jiàn)
由此可見(jiàn),《辦法》一旦正式出臺(tái),國(guó)內(nèi)做生成式大模型及產(chǎn)品的企業(yè)及采用方將須在規(guī)則范圍內(nèi)行事。據(jù)網(wǎng)信辦官網(wǎng)顯示,公眾可以通過(guò)三個(gè)渠道提出反饋意見(jiàn),反饋的截至日期為2023年5月10日。