週三社福-不只是大數據:計算社會科學在社會福利研究與政策應用的可能性

中正社福
13 min readAug 1, 2023

2023.04.22

文章撰稿:蔡承宏、鄧宇君

主講人:劉豐佾助理教授(國立中正大學社會福利學系暨研究所)

主持人:王舒芸副教授(國立中正大學社會福利學系暨研究所)

根據美國計算社會科學學會(CSSA)定義,計算社會科學是一種透過社會模擬、社會網絡分析以及社群媒體分析了解人類行為與社會動態的一種研究。隨著電腦科技的爆炸性發展,2012年之後資料科學快速地佔據社會科學研究者的目光,大數據、AI 等名詞也時常出現在中文語境之中,公部門與社會政策學者嘗試在這看似新穎的工具與方法中,尋找可以回應的研究文題以及帶著新的研究利器重新探索社會現象──在本次社會福利專題討論(04月26日)中,我們邀請到本系新進的劉豐佾助理教授,透過自身在美國與台灣推行計算社會科學的相關行動經驗,與我們分享「不只是大數據:計算社會科學在社會福利研究與政策應用的可能性」,探討資訊與計算社會科學在社會福利與公共政策研究中的發展與應用。

本場次專題演講宣傳海報(王芷庭製作)

劉豐佾老師是中正社福系的系友,從大學深耕到碩士班──豐佾老師也自述過去以學生的身分站在同一個講台上發表,現在重新站在這個舞台上覺得時間飛逝。就豐佾老師的自我介紹,其研究領域相當廣泛,從「社會不均與階層」到「兒童福利與兒童發展」,目前則也跨越到「移民社會與福利體制比較」的範疇。對於量化研究的關懷、及興趣,是在大學的時候受到本系退休教師陳昭榮老師的啟發,從GIS開啟量化研究的世界──就本場演講主持人,舒芸老師所下的註解,聆聽、及參與豐佾老師與昭榮老師的相互對談,將能身感親臨計量、數據與統計專家間的學術交流饗宴。

本次專題演講由中正社福系王舒芸副教授主持(王芷庭拍攝)

在這場演講與分享中,豐佾老師從自己的學術歷程以及思考脈絡中出發,探索究竟什麼是計算社會科學?它的本質與核心可能為何?以及身為社會科學研究者,身為社會福利政策研究者或行動者,我們可以怎麼嘗試將這個新穎研究工具應用在社會科學研究中。豐佾老師在這場演講中,企圖涵蓋討論資訊/計算社會科學在社會福利與公共政策研究中的三種研究工具,以及過去研究是如何應用這三種研究工具在研究之中。

本次社福專題演講邀請到國立中正大學社會福利學系暨研究所的新進教師,劉豐佾助理教授分享大數據與計算社會科學的研究應用(王芷庭拍攝)

何為計算社會科學?實作與定義、抑或重構內涵

豐佾老師在演講之初,引述「數據科學家:二十一世紀最性感的工作」(Data Scientist: The Sexiest Job of the 21st Century),指出數據科學作為嶄新領域,使大型且多樣的數據資料得以被集結與分析,而在對計算科學不清晰、摸索之時,豐佾老師便實踐「數據分析作為改變社會的行動」──包括:2016年的G0V 黑客松、2019 SICSS in NYC、2021 SICSS in Taiwan,以及2021–2022 Center for State Health Policy: Integrated Population Health Data(iPHD)。其中,豐佾老師分享到他所參與的那次黑客松主題,在於結合公民社會運動與資料科學,達成「g0v 零時政府」,尤其是藉由大數據與資料庫的建構,形成一個開放、免費、中立且具有近便性的系統。那次活動中,豐佾老師所在的組別便聚焦於整理各縣市的福利補貼資源,並加以視覺化呈現,進而了解福利政策的去中心化,是否真的造成民眾往津貼、福利相對優惠的地方遷徙,形成福利移民的現象。

藉由「福利移民」的討論,豐佾老師指出,目前相關的學術社群大致認為計算社會科學是一種透過社會模擬、社會網絡分析以及社群媒體分析了解人類行為與社會動態的一種研究(Computational Social Science Society of the Americas),就如在社會科學領域中,計算社會科學的詞彙多集中於代理人模型(Agent-Based Modeling)的研究,是使用電腦程式語言去模擬人類行為(Bruch & Atwell 2015; Macy & Willer 2002)。而Margetts & Dorobantu(2023)更進一步將計算社會科學定義為資料科學和社會科學的結合,這也契合豐佾老師最初接觸時的疑惑:資料科學可以跟社會科學做結合嗎?它是一個新興的研究方法嗎?又或是說,資料科學這些新興工具應用在社會科學的研究上,是不是量化研究的延伸?

豐佾老師的疑惑,是一種在量化研究訓練(Quantitative Training)與數據科學興趣(Data Science)之間的衝突,若僅是純粹的數據挖掘(Data Mining),將數據資料放入模型(Try Data)、檢測顯著性(Significant)與提出相關性解釋(R Square),那麼計算社會科學的獨特性為何?對此,豐佾老師進一步重新定義計算社會科學,認為計算社會科學(Computational Social Science, CSS)是數位資料(Digital Data)、資料科學(Data Science)與社會科學(Social Science)的結合,而在這樣的理解下,社會學領域、網絡分析、資料視覺化、模擬、數據科學倫理、自然語言處理、找出難以尋找的資料(從網路中抓取複雜的數字數據)及數據實驗等面向都是計算社會科學的範圍。那麼,在複雜、多元的範疇中,我們如何理解實踐計算社會科學?

豐佾老師指出「踏進CSS領域,研究者不一定要深入了解深度學習(deep learning)背後的CNN、RNN、神經網絡分析演算法的概念是什麼,但是社會科學家、政策制定者在使用這些資料科學的技術與工具的時候,一定要透過不同方式去重複驗證自己的測量、研究發現和假設,知道你使用的這些工具的限制是什麼。」就如使用ChatGPT一樣,ChatGPT 不一定可以回應你提出的所有問題,但我們本就不能寄希望於AI、計算社會科學作為全知全能的系統,而是將其放置於工具的性質、讓我們能更了解社會的工具──如何應用工具,便是計算社會科學的範疇。「社會福利政策制定者與研究者如何透過資料科學工具改善政策制定與研究?」豐佾老師以Handbook of Computational Social Science for Policy(2023)一書,介紹社會政策研究應用計算社會科學工具,有五種途徑,分別為:偵測(Detecting)、測量(Measuring)、預測(Predicitng)、解釋(Explaining)與模擬(Simulating Human Behavior)。

首先,豐佾老師指出政府經常藉由偵測(Detecting)來蒐集資料,就如在新冠肺炎(Covid-19)疫情期間,「臺灣社交距離」app追蹤活動軌跡、並匡列接觸者,這便是以偵測、追蹤的方式來蒐集資料並分析。而國外的相關應用案例,則是聚焦於前美國總統川普(Donald Trump)身上,包括追蹤川普的臉部表情來分析他的情緒,又或者追蹤美國總統政見發表時,候選人的情緒變化推敲其競選策略。再來是測量(Measuring),豐佾老師指出如隨技術演進,測量的資料尺度並不限於資料庫中的數據樣貌,如衛星雲圖亦可被廣泛地運用,用以測量不同地區的特徵,包括以路燈的亮度來測量區域貧窮程度的差異──這也同時意味著計算社會科學的技術方法提供了另一種在公共政策治理上的差異性變項測量之可能,因此未來也須關注「測量創建與信效度的確定」等方法論議題。第三項則是預測(Predicitng),主要是預測可能但尚未發生的事情提供預防性的措施,相關的應用包括:藉由數據預測芝加哥地區的治安,在預測犯罪機率較高的範圍加強警察巡邏,或是美國歐巴馬執政期間推出健保,預測將出現的政策效應與結果。台灣在地的預測應用則可看到陳淑娟(2023)於台灣社會福利學會年會中分享臺北市家庭暴力暨性侵害防治中心應用相關數據資料,預測較高暴力發生地區,加強社區介入、處遇。

最後兩項策略,則是解釋(Explaining)與模擬(Simulating Human Behavior)。解釋主要在於釐清研究中的因果關係,傳統的數據分析方法包括:差異中的差異法(difference in differences, DID)、斷點迴歸(Regression Discontinuity, RD)與經驗性研究(Experimental Research),而計算社會科學則是藉由線上使用經驗與準實驗的研究設計方法(Online Experiment and Quasi-Experiment),又或是採取可移動性應用裝置(Mobile App)的資料蒐集管道,進行資料與研究的因果關係判斷。模擬則是顧名思義地建構一個可運作、預測與分析的模型,如行為者模型(Agent-based Model)、空間微觀模擬(Spatial Microsimulation),藉由相關的模型模擬,我們便有機會發展針對健康照顧(Healthcare)、兒童托育據點(Childcare center)與福利服務提供(Welfare Service Deliver)的民眾態度、資源部署等議題的模擬狀況。

計算社會科學的在地實踐性?反思、行動與展望

最後,我們可以如何理解計算社會科學作為政策研究的嶄新技術?換言之,進行政策分析(Policy Analysis)的策略有很多種,那麼該如何凸顯計算社會科學的運用價值性?豐佾老師以一個送花與卡片的故事說明。豐佾老師分享到他在送花給太太時,發現到是否附上「卡片」的動作,會使送花行為的浪漫、感人效果有所差異──這也可反映在計算社會科學研究者在政策研究的領域中,必須重視「政策敘事分析」的技巧(莊文忠,2020)。藉由對社會政策的脈絡堆積,以及大數據資料不停地進入研究體系中,研究者可以憑藉著類似質化研究的紮根理論(Grounded theory)操作,利用歸納的方式,反覆、互動的對照,在數據資料群的共同、相近特質中,研究者得以淬鍊、描繪及勾勒當代社會的圖像與社會問題的界定,並且提出具體的解決方案。這也是中正社福的特色,藉由跨學科與領域,及嚴謹的理論和政策論述訓練,使學生看見政策的複雜性(Policy Implication),並裝備其具有社會、政治、經濟與文化等面向的理解能力,進而使其能對研究資料與文本有所敏感度,在敘事的過程中賦予其血肉,再現當代社會的紋理與特質。

接續,豐佾老師進一步提出當前臺灣學術研究圈在引入計算社會科學的技術時,要考慮幾項議題:首先是「跨域合作」的可能性。社會科學的研究者可嘗試與其他領域的研究者合作,雖然過程可能存在陣痛期,就如不同學術訓練中的語言可能不同,但我們也必須學習與不同領域的人溝通,在跨領域之間達到雙向溝通而非單向的交派任務。再者是隱私保護與學術研究間的倫理議題拉扯。豐佾老師指出計算社會科學得以發展,高度仰賴政府部門的數據,然而政府為避免其蒐集之數據資訊若全面開放,可能會造成非預期的隱私保護負面效果,因此僅會將相關重要資料提供給特定的學者,以避免資料外流、受到攻擊。最後則是資源分配的突圍。豐佾老師提醒道政府的公開資訊可能是不完整、有欠缺的,而這將使得資料的引用、及分析是有困難的,因此研究社群也必須思考資料庫的建置議題,是研究時並非僅能獨尊政府資訊,社群成員也可藉由爬梳網路上的大量資料來建立資料庫。

在講座的最後階段,豐佾老師以Taylor Swift的〈22〉,分享到現在的自己很想念22歲時的自己,虛懷若谷而仍不停地學習,生命尚未足夠飽滿卻仍以足夠成熟地計畫人生,並且「但當意識到人生有許多有待回答的問題時又顯得不夠成熟,這帶給我基於猶豫不決和恐懼之下又同時放鬆的無憂無慮的感覺」。接續,引述其在美國攻讀博士學位時,最深受觸動的一句話,「我們是一個家庭要互相合作」,豐佾老師認為在計算社會科學的領域、及社群也一樣適用,尚待發展的學術、知識與技術範疇正需要一群志同道合的朋友一起前進──豐佾老師正是抱持這樣的心情回到台灣、回到中正,企圖尋找一群好夥伴一起在計算社會科學的路上努力。而作為新進教師,豐佾老師最後引述〈每個人都有自己的時區〉,「你有自己的時區,不用跟別人比較,碩士無論讀幾年你都不落後,莫要擔心繼續努力」,勤勉所有在研究中掙扎的學術工作者都能在自己的時區中勇往直前,對自己的世界充滿熱情。

專題演講後,參與的老師、同學與劉豐佾助理教授合影(王芷庭攝)

海報製作、照片攝影:王芷庭

行政業務:陳佩吟

統籌策劃:郭惠瑜、王舒芸、鄭清霞

參考書目

Taylor Swift (2012). Twenty-two. In her album Red.

Margetts, H., Dorobantu, C. (2023). Computational Social Science for Public Policy. In: Bertoni, E., Fontana, M., Gabrielli, L., Signorelli, S., Vespe, M. (eds) Handbook of Computational Social Science for Policy. Springer, Cham.

Bruch E, Atwell J. (2015). Agent-based models in empirical social research. Sociol Methods Res, 44(2):186–221.

Michael W. Macy & R. Willer (2002). From Factors to Actors: Computational Sociology and Agent-Based Modeling. Annual Review of Sociology, 28, 143–166.

莊文忠(2020),〈大數據的政策敘事分析:基本框架與案例演示〉,《國家文官學院T&D飛訊》,(268),1–34。

--

--