主講者:李宣緯(中央研究院社會學研究所助研究員)
題目:當數據科學遇上社會科學—從複雜系統角度看動態社會網絡
主持人:郭貞蘭 臺大社會系副教授
時間:2021年10月25日(四)
速記:徐連毅
本周週四社會學專題演講是本學期第一場,臺大社會很榮幸邀請到李宣緯研究員、同時也是台大政治和社會系的兼任助理教授,來和本系師生及參與者分享從數據科學的角度分析社會系統、社會網絡的取徑。李宣緯研究員本身是北卡羅來納大學的數學博士,並在內布拉斯加大學進行社會學的博後研究。
李宣緯表示,相較量化的社會科學會從統計模型去討論社會現象、顯著與否等,他所鑽研的數據科學及複雜系統理論,會傾向使用抽象思考、事先定義的方式去看待資料,再建構一個全新的模型去跑資料,在操作及研究取徑上就有很大的差異。然而,究竟什麼是複雜系統(Complex System)呢?李宣緯解釋,複雜系統的提問是簡單規則支配下的個體在組成巨大體系時,其會如何運作、又要如何操作和研究。複雜系統理論已經被使用在許多層面的研究,包含賽局、群體行為、社會網絡,以及演化、非線性動力學等其他領域。
在複雜系統的定義下,系統是由個體(elements)、個體之間的關係(relation)、和非線性的湧現(emergence)所構成,複雜系統的數學模型就是要預測,在給定簡單規則的前提下,這種社會現象或人際網絡的湧現,是要在什麼樣的條件下才會產生。李宣緯舉例,許多生物(鳥、魚)也會有群體行為,科學家如果給定了個體間不能太近、也不能太遠、要相同方向的前提,就可以在反覆模擬中,預測這個群體、還有裡面個體的位置和移動方向;再將這些模擬和實證資料對照。
若將複雜系統套用在個體及群體行為上,則可以從哪些部分(parts)構成、其非線性(nonlinerity)的狀態如何展現、其又是怎麼和彼此連結(connectivity)、又如何展現出群集中的配適性(adaptation)的面向來研究。從複雜系統出發,李宣緯接著介紹其關懷的社會學次領域:網絡科學(Network Science)。網絡科學作為一門方法學,主要關注個體之間的連結、而非討論個體差異,以中層(meso)視角和結構與個體的討論作對話。由於網絡科學強調個體與個體之間的連結,很容易在討論完每一個個體的連結後,產生指數型的複雜性,如何在數學上將其化約成 ”network structure topology” (網絡結構的拓樸學),就仰賴複雜理論的理路。
網絡科學中和社會學最相關的自然屬社會網絡(Social network),這也是講者的研究領域。李宣緯介紹,在社會網絡中,他們定義個體在服從簡單的規則,並經過數以千計的模擬和資料蒐集,討論個體之間的關係、這個群體如何運作、又會在哪些情況下行動、並加入時間的尺度,是相當具挑戰性的分析和研究方式。如同社會隔離的研究案例顯示,只要個體稍微動一點,整個群體就可能有巨大的改變,李宣緯也提醒,雖然複雜系統下的社會網絡要求模型簡化,但是他們所追求的是「最適複雜度」,也非最簡單就是最好。
而這種將人先預設成原子(atoms)般均質單純、又先建立簡單規則的研究方法(agent-based),往往在模擬後持續調整參數,來達到最佳成效,這種方法不僅運用在社會網絡中的隔離研究、包含社會擴散、關係探討等都被普遍使用。李宣緯指出,其實在經濟學的行為研究也早已用過,在經典的棋盤實驗中,假設不同顏色的棋子代表人、其有住在相同顏色者周邊的趨向性,給定黑白兩色棋子預值後,在充分混合、隨機分布的狀態下,棋子的遷徙幾乎馬上就會開始,這個實驗展現了複雜系統運用在社會網絡的可行性。
同時,李宣緯也解釋社會網絡和其他網絡科學的差異,因為社會網絡研究的是「人」,也因此其網絡會有趨同性(homophily)、高度從眾性(high clustering,如朋友的網絡很容易連成三角形、彼此互相認識)、小世界態(small world,如六度分隔理論、寄信實驗)、巨大部分態(giant component,網絡會連成一個主要的巨大密集體)、模組化構建(modular structure)等特色。
在複雜系統的數學理路下,李宣緯介紹其曾經或正在執行的四個研究計畫:首先其與內布拉斯加的研究人員要了解人與人之間如何相互影響,他們經過給定規則,發現模擬後可以區分選擇(主動)和擴散(被動)在人際網絡之間的影響。與此同時,其也研究了社交媒體上的朋友關係,被觀察用戶(ego)要如何讓朋友的朋友變成自己的朋友,李宣緯和研究同儕發現在某些影響因子下,如教育程度、婚姻關係、外向度、與第一層直接朋友的互動程度等,都會有相關。另外,其也正在進行大學生轉系組或雙主修之間的動機和起薪研究、以及高中生的班級網絡研究,都十分令人期待。
在問答環節中,李宣緯也闡述了複雜系統與社學模型處理社會網絡的侷限,包含一次只能處理一個主要問題、假設與社會實際狀況有所落差等,而這種路徑的研究先將個體假設相同、再按照核心提問及關鍵影響因素去給定條件,是否真的適用在缺乏實證資料的群體,也引發討論。但李宣緯和主持人也肯認,這種研究路徑也為在大數據與跨學科領域浪潮衝擊下的社會學,開闢了有別傳統量化研究的、一條新的研究理路。