來源:新華每日電訊 發布時間:2024-10-28 10:7
新華社倫敦10月25日電(記者郭爽)谷歌旗下“深層思維”公司的研究人員設計了一種“水印”,可以無形地標記人工智能生成的文本,并將其提供給數百萬聊天機器人用戶。該研究成果日前發表在英國《自然》雜志上。
隨著大語言模型在質量、連貫性、覆蓋范圍和專業性方面的進步,區分其生成的高質量合成文本和人工書寫文本變得越來越困難。鑒于大語言模型在教育、軟件開發和網絡內容生成中的廣泛使用,人工智能生成文本的識別和歸屬對于確保安全和負責任使用該技術至關重要。
各國都希望通過水印來識別人工智能生成文本并限制意外或故意濫用問題,以幫助鑒別和打擊虛假新聞和學術造假等,同時避免因使用人工智能生成內容訓練而導致未來模型質量下降的問題。但迄今開發的水印都較容易被移除,或者用于欺詐。
此前,“深層思維”公司已經開發出圖像水印技術——SynthID,可以識別并應用在人工智能生成圖像上。在此基礎上該公司開發了一種被稱為SynthID-Text的文本水印技術,可以將水印應用于文本。
該技術將水印整合到大語言模型本身文本生成的步驟中,以一種隱秘但公式化的方式標記模型選擇的單詞,而這可以用密鑰檢測到。與其他方法相比,這樣產生的水印更容易被檢測到,而且應用它不會減慢文本的生成速度和質量。此外,由于密鑰復雜,移除水印或使用水印欺詐變得更加困難,即使使用第二個大語言模型來解釋文本,水印仍然可以被檢測到。
目前,“深層思維”公司已將該水印技術開源,開發人員可以將這種水印應用于他們的模型。