數據就是權力:演算法政治與數據女性主義

主講者:余貞誼 助理教授
題目:數據就是權力:演算法政治與數據女性主義
時間:2021年11月18日(四)


本週的週四社會學專題演講,邀請到了本系系友、目前任職於高醫大性別所的余貞誼老師,來跟我們分享演算法及數據女性主義的議題。

老師首先從數據計畫開始談起。究竟何謂數據計畫呢?從本體論來說,它指的是把事物轉成後設資料(資料的資料),例如錄音檔案,可以抽出時間、主題、演算法、參與主題等等,而所有後設資料都要可以轉成數字,例如把文字分析的詞向量做成網絡圖。就認識論來說,演算法可以梳理肉眼不能察覺的模式和結構。最後就方法論來說,數據計畫指的是可以以數學普遍性等性質得出號稱嚴謹客觀之結果。

接著老師進入數據計畫和客觀性關係的討論。老師提到,只要是人類所設計,演算法就沒有絕對客觀的存在。例如,資料科學家Cathy O’Neal以數學毀滅性武器形容有害的數據模型。她以棒球分析對手數據為例,解釋演算法會讓球隊快速適應最好的策略,很少人會去懷疑演算法的演算結果。這是因為棒球的數據是「直接相關」的數據,但是在其他領域其實很少有直接相關的數據,於是常以替代的數據進行分析,卻因此可能造成問題。例如Cathy舉例預測犯罪的PredPol是有害的演算法。這個演算法會把嚴重犯罪(例如強暴、殺人)和小奸小惡(例如喝醉酒倒在路上)都納入模型。但在比較貧窮的少數族裔社區,會因為抓到很多犯輕微犯罪的人,而在模型計算建議下部屬較多警力;這又進一步導致更容易在此抓到罪犯,所以模型最終會得出少數族裔社區較容易犯罪的結論,也讓少數族裔入獄的機會變高。

那我們要如何理解數據計畫?老師認為,數據計畫涉及一種科技—文化政治:因此要採取批判的技術實作立場,探究符碼如何運作、了解其過程、目標、能力與局限等等,以數據女性主義的觀點,解構數據霸權地位,分析批判它危害弱勢的力量。

第一,數據女性主義的觀點提供我們檢視權力的機會。我們應當檢視,究竟是誰在做和誰沒有做數據工作?雖然專業職業總的來說男女勞參率已經很平衡,但是在Data和AI的部分幾乎都是男性在做。但誰在做為什麼重要?以目前User Experience行業的 “I Methodology” 為例,當使用者介面都是從設計者視角出發,就無法服務所有使用者。具體來說,一個MIT Media Lab的黑人學生發現黑人的臉部辨識比白人的臉部辨識要花更久的處理時間,當她拿一個白面具的時候辨識速度就變快了。這是因為訓練模型多是用白人的臉做測試,所以系統很難辨識黑人臉孔。

此外,演算法還有許多其他問題。訓練資料庫有資料不均的問題,大部分圖片資料來自美國,來自中國和印度的僅占極少數。如果要找出「新郎」的資料,美國的識別相當準確,但是巴基斯坦的新郎辨識變異性就很大。訓練資料庫也常有指標偏見,如Amazon以過往履歷作為訓練樣本,發現演算法只會錄取男性。在台灣工研院和某大學合作研發的「AI面試官」來說,如果希望面試官找出領導力等正面特質,可能會以主動說話的次數、臉部表情變化的次數等等指標判斷;但這些指標會找出社會中比較被鼓勵表現的有野心侵略性的人,也就是男性。

選擇資料庫也常會落入偏見。如果用公共健康數據偵測哪些家庭的小孩容易受虐,以美國的情境來說,因為保險都是私人保險,所以公共健康數據不容易找到富有家庭的資料。貧窮父母被oversample之後,他們的小孩就可能會被高估遭遇家暴的風險。又例如,現在有很多智慧醫療、精準醫療嘗試透過數值評估未來潛在疾病的發生。但在這些醫學分析當中,有相當多尚難以解讀的指標、發現、結果;或是可能僅考慮客觀指標,而忽略了可以反應病人感受的主觀指標。例如近期台灣醫療界也相當關注治病的基因,而只是要找出病人痛感指標的研究就沒有受關注,但是後者可能是對患者較有益處的研究。

第二,數據女性主義的觀點可以挑戰權力。老師也提醒,納入情感和身體知識相當重要,而不是只有號稱理性、中立、客觀的神聖科學想像。例如,以更有表現力的形式(https://periscopic.com/#!/) 呈現槍擊案中生命的失去,比冷冰冰的bar chart有感很多。墨西哥城的行動藝術以紅色女鞋來具現化頻繁的性別暴力與低破案率,讓觀者比單純看bar chart能感受到傷痛。

老師接著提出重新思考數據的重要性。關鍵在於,數據如何被蒐集、清理?數據有什麼脈絡?許多未置入脈絡的缺陷敘事,可能會導致汙名等負面效果,彰顯出數據計畫的兩難。例如,數據分析指出非裔美國人較容易染疫,提出特別關照非裔美國人的公衛計畫,卻遭到非裔美國人族群的強力反對,是因為去脈絡化的呈現結果,反而強化了對於非裔美國人的污名,即使汙名化並非數據分析的本意。此外,涉入數據計畫的勞動力也應該被看見:數據計畫不是只有少數菁英,中間所牽涉的大量人力也應該受到關注。當疫情初期大家不能去工作、在家工作機制未建立的時候,臉書和Google的準確度與效能都下降了,顯示出智慧防疫的建立與運作也仰賴很多很多基層工作人員。

最後,老師引用Pasquale(2015)的觀點,提醒「打開數據的黑箱,才能帶來透明、反省與問責。」

分享此文:
返回頂端