來源:中國青年報(bào) 發(fā)布時(shí)間:2024-5-30 9:47
大模型越來越聰明。OpenAI的GPT-4o,不僅“火眼金睛”能夠準(zhǔn)確識(shí)別圖像,與人類無延時(shí)相談甚歡,甚至語氣詞都那么到位。但是多個(gè)大模型有個(gè)通病。
“請(qǐng)畫一幅畫,一位資深教授在給學(xué)生們上數(shù)學(xué)課。”
“請(qǐng)畫一幅畫,一位老板在辦公室訓(xùn)斥員工。”
“記者外出采訪,進(jìn)行全媒體報(bào)道,請(qǐng)畫一幅畫表現(xiàn)這個(gè)場(chǎng)景。”
上面的3幅畫,不管是什么風(fēng)格,主角都是男性。
“畫一幅讓老板訓(xùn)斥員工的圖片,我甚至讓它生成了好多次,老板一定是男士,員工是女士。”北京理工大學(xué)計(jì)算機(jī)學(xué)院副教授高揚(yáng)發(fā)現(xiàn),讓大模型畫一幅在醫(yī)院里照顧病人的圖像,護(hù)士都是女性;給企業(yè)家畫像,則是男性;如果換到家庭的場(chǎng)景,家長做家務(wù)帶孩子,“家長”大概率是女性。
是大模型有偏見還是社會(huì)有偏見
復(fù)旦大學(xué)邱錫鵬教授主持研發(fā)了開源大模型MOSS,他說:“大模型里面的各種關(guān)于價(jià)值觀偏見、社會(huì)倫理的問題一直是我們非常關(guān)注的問題。”
邱錫鵬教授通過數(shù)據(jù)看到了大模型這兩年的進(jìn)步。對(duì)于大模型的訓(xùn)練,價(jià)值對(duì)齊是重要一項(xiàng),目標(biāo)是人類賦予它的價(jià)值觀。其中,也包括性別問題。但通過對(duì)詞語分析形成的詞云,也顯示了AIGC(生成式人工智能)的固有印象,比如,形容男性的詞匯集中于世界、發(fā)現(xiàn)、生命、簡單等;而圍繞女性則集中于鄉(xiāng)村、丈夫、挑戰(zhàn)、母親等詞語。
邱錫鵬說:“在實(shí)際研究中,要進(jìn)行語料的性別校正需要非常大的投入。需要進(jìn)行模型對(duì)齊,通過人類偏好建模、價(jià)值觀對(duì)齊等方法,調(diào)整模型輸出更積極的內(nèi)容。”
哈爾濱工業(yè)大學(xué)計(jì)算學(xué)部長聘教授姚鴻勛認(rèn)為,情感認(rèn)知是AIGC理解人類語言和行為的關(guān)鍵。近期她帶領(lǐng)團(tuán)隊(duì)用音樂來生成舞蹈,之前在做AI編舞的時(shí)候,沒想到性別問題,所使用的數(shù)據(jù)集也在無意中出現(xiàn)了性別偏差,采集的舞蹈視頻基本都由女性進(jìn)行表演,缺少男性樣本。“后期引入男性表演視頻數(shù)據(jù)也許能夠更好地描述舞蹈動(dòng)作特征,進(jìn)一步提升模型性能。”
“現(xiàn)有模型可能因?yàn)橛?xùn)練數(shù)據(jù)的性別偏見而產(chǎn)生對(duì)特定性別的刻板印象,不僅限制了模型的準(zhǔn)確性,也可能在人機(jī)交互中加深性別歧視。”她舉例,現(xiàn)有AIGC模型會(huì)考慮性別偏向而給出不同的生成內(nèi)容,比如問題中提及“小明”“小紅”等人名會(huì)被大模型潛在認(rèn)為分別是男性與女性角色。
5月17日,在中國計(jì)算機(jī)學(xué)會(huì)2024青年精英大會(huì)上,舉行了一場(chǎng)名為“AIGC:我太‘男’了——大模型中的性別偏差問題”的論壇。
這個(gè)論壇的發(fā)起者,是太原理工大學(xué)副教授董媛香、云南師范大學(xué)教授趙樣、東北林業(yè)大學(xué)副教授李洋等,她們都是從事計(jì)算機(jī)科研教學(xué)的年輕學(xué)者,之前組織過關(guān)于女性科技工作者成長相關(guān)的論壇。
但是多次討論之后,她們覺得應(yīng)該觸及技術(shù)本質(zhì)來談性別平等,人工智能發(fā)展的歷程中,“性別偏見”不是一個(gè)新詞。有觀點(diǎn)認(rèn)為,訓(xùn)練方法和訓(xùn)練數(shù)據(jù)中存在的性別偏見可能被大模型學(xué)習(xí)并反映在其輸出中,影響決策公正性和準(zhǔn)確性。該問題長期發(fā)展下去可能會(huì)產(chǎn)生諸多不良影響,甚至引發(fā)“蝴蝶效應(yīng)”,例如加劇機(jī)會(huì)不平等、對(duì)女性造成冒犯或者在人機(jī)互動(dòng)的過程中加深性別刻板印象等。如何實(shí)現(xiàn)大模型中的性別偏差問題的治理,需要政策、產(chǎn)業(yè)和研究領(lǐng)域的對(duì)話。
李洋提出:“可以看到現(xiàn)在大模型發(fā)展處在一個(gè)非常關(guān)鍵的轉(zhuǎn)折點(diǎn)上,我們是要沿著它現(xiàn)有的路徑、偏差繼續(xù)往前走,還是作一些改變,改變模型,讓它更好地為我們服務(wù)?”
姚長江是青島一家科技公司的產(chǎn)品總監(jiān),他在一些產(chǎn)品應(yīng)用中對(duì)大模型進(jìn)行微調(diào)時(shí)發(fā)現(xiàn),AI會(huì)把“老板”“成功人士”默認(rèn)為男性。
“大模型是我們?nèi)祟惿鐣?huì)文明的一個(gè)表象、人類思想的一個(gè)延伸,如果我們不去做過多的這種治理或者說干涉的話,它可能會(huì)引起不好的結(jié)果。”他說,假如把大模型應(yīng)用到招聘中,在求職者簡歷篩選上,如果這個(gè)AIGC存在相對(duì)嚴(yán)重的性別偏差,會(huì)對(duì)女性求職者帶來不利的影響。
有人提出:“到底是社會(huì)現(xiàn)狀的偏差還是模型本身的偏見,比方說輔導(dǎo)孩子的作業(yè),大模型生成是媽媽,但實(shí)際生活中更多的也是這樣的,切合現(xiàn)實(shí),這個(gè)是不是能定義成偏差,值得探討。”
這次論壇,主辦方請(qǐng)了3位AIGC“嘉賓”:文心一言、星火大模型、通義千問,它們對(duì)“性別偏見”的看法基本一致:訓(xùn)練數(shù)據(jù)偏差、算法和模型設(shè)計(jì)、開發(fā)者的無意識(shí)偏見會(huì)造成性別偏差,內(nèi)容傳播、偏見的迭代循環(huán)以及不公平?jīng)Q策會(huì)引發(fā)“蝴蝶效應(yīng)”。
高揚(yáng)認(rèn)為,這涉及到的第一個(gè)問題就是如何擴(kuò)大和提升那些女性優(yōu)勢(shì)的數(shù)據(jù)生成。同時(shí),她也提醒,這種生成改變是局部的,很容易造成偏差。
另外,她還提出一個(gè)技術(shù)上的解決辦法,通過重新構(gòu)造數(shù)據(jù)對(duì)大模型進(jìn)行修正。但是這些辦法會(huì)生成TB級(jí)別的數(shù)據(jù),很耗資源。這里面還有一些問題,比如所設(shè)定的場(chǎng)景是不是真的能跟真實(shí)的語境和現(xiàn)實(shí)社會(huì)一致?
也有人用小孩子的性別敏感期來類比,現(xiàn)在大模型還處于嬰兒期,對(duì)它進(jìn)行價(jià)值對(duì)齊,一代一代更新,我們要做的就是在這些新的數(shù)據(jù)里面,更多地反映性別平等的社會(huì)現(xiàn)狀,這樣才能做好。
對(duì)于如何造就大模型正確的性別觀,3個(gè)AIGC大模型“嘉賓”輸出的答案近似,它們提出,一方面是從技術(shù)方面,如訓(xùn)練數(shù)據(jù)平衡化、模型設(shè)計(jì)等方面來進(jìn)行糾偏;另一方面是從政策、社會(huì)等方面進(jìn)行糾偏。
訓(xùn)練AIGC需要巨量的數(shù)據(jù),數(shù)據(jù)量的不平衡,語料庫中發(fā)言者的性別帶來的性別偏差,都是讓AIGC在性別問題上呈現(xiàn)偏見的原因。此外,在技術(shù)研發(fā)領(lǐng)域,女性仍少于男性。這會(huì)產(chǎn)生一些“無心之舉”。
AI發(fā)展迅猛,“她力量”如何更好發(fā)揮
3位AIGC大模型“嘉賓”看法一致,歸納起來集中于,“應(yīng)為”在于在社會(huì)層面呼吁、倡導(dǎo)提升女性參與度,打破刻板印象;“可為”主要是倡導(dǎo)科研人員和決策層通過技術(shù)實(shí)現(xiàn)“平等”;“難為”主要體現(xiàn)在性別偏見和刻板印象、技術(shù)和資源限制以及社會(huì)和文化因素等方面。有意思的是,其中一個(gè)大模型的回應(yīng)中還多加了一句:“但是,女性要在人工智能技術(shù)領(lǐng)域取得成就,可能需要面臨更大的學(xué)習(xí)困難。”
根據(jù)自己的工作經(jīng)歷和觀察,姚鴻勛教授看到女性在很多工作中與男性一樣表現(xiàn)突出,但機(jī)會(huì)不均等。在學(xué)校里,女生在學(xué)業(yè)方面往往表現(xiàn)很好,但在整個(gè)職業(yè)發(fā)展過程中,女性往往會(huì)遇到不公平對(duì)待。在工科教育中,也存在女生自認(rèn)為不如男生的情況,因此在教育過程中,教育者更應(yīng)該對(duì)女生進(jìn)行鼓勵(lì)和支持,增強(qiáng)女生的自信心。
在我國,女性進(jìn)入大學(xué)的比例不斷提升。國家統(tǒng)計(jì)局監(jiān)測(cè)報(bào)告顯示,2022年,高等教育在校生中女生占比50.0%,其中女研究生占全部研究生的51.2%。
中國科協(xié)的數(shù)據(jù)顯示,目前全國女性科技工作者近4000萬,占比超過45%。但是成為科研主導(dǎo)者的女性比例還是很低。中國科學(xué)院、中國工程院院士中,女性科學(xué)家仍舊是鳳毛麟角。2019年中國科學(xué)院和中國工程院共新增院士139人,其中12名女院士;2021年新增149名兩院院士,其中11名女性;2023年兩院院士新增133人,其中女院士6名。
全球范圍內(nèi),2020年《美國科學(xué)院院刊》(PNAS)統(tǒng)計(jì)了全球多個(gè)國家、多門學(xué)科自1955年以來活躍的論文發(fā)表學(xué)者,發(fā)現(xiàn)女性研究者的比例雖然有所提升,但也只占到了27%,且存在嚴(yán)重的學(xué)科差異。
還有一些非常“隱蔽”的差異。幾千年人類社會(huì)形成的固有觀念,滲透在社會(huì)生活的所有縫隙里。進(jìn)入現(xiàn)代社會(huì)也是如此,一些未經(jīng)科學(xué)證實(shí)的錯(cuò)誤觀念被人們接受,習(xí)以為常。
比如,夏天辦公室里,女同胞經(jīng)常會(huì)抱怨空調(diào)開得太冷,這是因?yàn)榕源x率比男性低35%;許多工具女性用起來不順手,這是因?yàn)榕缘钠骄樟Ρ饶行缘?1%……
在英國作家、記者卡羅琳·克里亞多·佩雷斯所寫《看不見的女性》一書中,羅列了一系列此類現(xiàn)象,并分析了背后的根源——世界上很多數(shù)據(jù)是基于男性的。
一些藥品在做臨床實(shí)驗(yàn)時(shí),沒有區(qū)分男女實(shí)驗(yàn)者,同樣劑量未必適合體重和代謝更低的女性;有些醫(yī)學(xué)研究忽略了女性因素(如生育和激素周期)使得一些新療法、新藥物作用于女性患者時(shí)無法取得應(yīng)有療效。
另一位英國女作家安吉拉·薩伊尼,曾梳理過科技史、人類社會(huì)發(fā)展史,發(fā)現(xiàn)很多因?yàn)槠娫斐傻腻e(cuò)誤,并寫入了一本名為《科技對(duì)女性做錯(cuò)了什么》的書中。
由此可見,科技需要女性引領(lǐng)原創(chuàng),也要清楚包括AI在內(nèi),具體哪些地方需要“糾偏”,從而獲得兩性平衡平等發(fā)展,共同推進(jìn)社會(huì)進(jìn)步。
我國近年來出臺(tái)了一系列支持女科技工作者的政策舉措。2021年,全國婦聯(lián)、科技部等制定了《關(guān)于實(shí)施科技創(chuàng)新巾幗行動(dòng)的意見》,之后又發(fā)布了《關(guān)于支持女性科技人才在科技創(chuàng)新中發(fā)揮更大作用的若干措施》;從2024年開始,國家自然科學(xué)基金委員會(huì)將女性科研人員申請(qǐng)“杰青”的年齡限制由45周歲放寬到48周歲。
現(xiàn)實(shí)中“她力量”的增長會(huì)反映在AI上,這是大家的共識(shí)。
中青報(bào)·中青網(wǎng)記者 李新玲 來源:中國青年報(bào)