
第三場【學人開講】由本中心祝平次執行委員主持。活動由數位工程一端、道易科技有限公司負責人的鄭文信先生,以及人文學一端、曾推動數位人文研究計畫的祝平次副教授,對談幾年來在數位人文上耕耘的心境與成果。
鄭文信透過實際案例,分享自己如何在資料庫、程式設計等環節,客製化的協助人文學者;而祝平次則是著重數位人文為人文學者帶來的影響,像是能夠對領域有更完整的理解、學習如何從大量資料中聚焦以及重新組織。並且雙方在演講最後,分享了對於數位人文新進者的建議。
鄭文信曾在資訊業工作了十年,在祝平次的邀約之下,2017年一腳跨進數位人文之中。經過幾年的合作,鄭文信注意到人文學者研究時,如果有資訊(技術)的加入,能夠減少許多工作量,甚至讓成果更好。祝平次則從人文學者的觀點回應,以台灣有名的三大數位人文中心為例(台大數位人文研究中心、中研院數位文化中心、法鼓文理學院數位研究平台),點出若資訊學者想探索人文學科,透過人文學者的input,也能夠節省資訊學者的時間。
鄭文信以過去曾建立的平台為例,其合作對象包括國內外學者,如捷克科學院、香港中文大學圖書館、中央研究院、清大中文系的個別研究人員,建置了十幾個平台。具體以台灣文學館合作架設的「台灣文學主題平台」為例,展示人文資料轉做成作者出生地的GIS(地理資訊系統)、作家參與組織與作家的社會網絡分析圖等成果,以及「針對關鍵字,作者會如何寫成文章」的文學素材生成器AI。還有像是與李宗信老師合作架設的「社會網絡分析平台」,看見林獻堂日記的文本,如何轉換成不同的架構形式,像是依據見面次數的社會網絡圖,或是親屬關係的社會網絡圖。此外還有香港作家及藝術家的傳記資料庫、捷克科學院圖書館管卡的搜尋平台等。
祝平次指出,透過案例呈現出了數位人文研究的長處,上述成果都能夠在短時間內,從大量資料中擷取研究焦點,也能進一步再重新組織,並解釋道:「這是一種程序性的思考,進入數位人文以後,資料不再是一團資料,而是怎麼運用資料。」起初的文字資料經由串連,以不同的形式(圖表、數字、地圖)再呈現,幫助人文學者重新觀察資料,祝平次表示正是數位人文有趣的地方。
祝平次接續詢問鄭文信的合作經驗,經歷過幾次合作,對於人文、歷史、中文等人文學科,有什麼想法。鄭文信側重於人文學者處理資料的手法回答道:「即使研究同一份文本,每位學者儲存資料的方式都非常不一樣。」根據學者研究重點的不同,建立資料的屬性也十分需要客製化。也是在實作經驗中,體會到資訊如何確實幫上人文學科。像在協助捷克學者抓取資料,分析台灣新舊家族延續狀況時,如何將家族之間的最短路徑計算出來,若使用程式,光是以層次計算,就需要花費兩三個小時,若是少了資訊的輔助,恐怕要學者耗費一生來處理問題。
那當與人文學者合作時,溝通上最大的困難會是什麼?鄭文信以與祝平次合作的「經典注疏數位平台」為例,認為一開始理解經傳是最難的階段。由於程式設計師需要理解與資料相關的各種專門術語與概念,才能建構出好的平台與資料,但當雙方領域具備的常識基礎不同時,在前期需要來回溝通詢答許多次,才能達成共識。
接續鄭文信,祝平次轉換視角,回應這幾年經常聽見的疑惑——「資訊學者到底可以幫人文學者什麼?」分享多年來的觀察,「實際上人文學者的慾望,資訊學者都能達成,但是不一定能夠馬上做出來。」鄭文信建議尚未接觸數位人文的人文學者,能夠先去台大數位人文研究中心DocuSky、中研院數位人文研究平台、CBETA數位研究平台,去嘗試看看資料能做哪些應用與呈現,就能對研究有初步概念。
至於資料庫建置,鄭文信則點出,透過excel彙整的資料,實際上在匯入資料庫的過程會遭遇很多問題,像是資料無法正規化、不同助理輸入資料的格式不同,導致無法統一搜尋等。以家譜為例,層級性(第一代、第二代、第三代)的資料就難以透過excel建立。所以鄭文信建議如果希望將資料數位化,在初期就找資訊相關人員幫忙,提前建設輸入資料的平台會是不錯的方法。祝平次回應,這其實是人文學者的痛處,由於好的數位資料,通常是透過學者運用大量時間與精力才能累積,個別學者往往受限於研究經費、研究期程,無法建置自己較為合用的資料庫。但祝平次也提醒,目前網路上有許多可取得的數位資料,如維基文庫、ctext等,應能夠考慮多加利用。
祝平次對於資料庫的累積表達十足肯定,表示當學者要開啟某些領域的研究,若是有資料庫,能對該領域有相對完整的想像,會去思考資料還有哪些不足。但建立資料庫是一件非常累的事,以美國加州大學柏克萊研究唐代墓誌銘的學者Nicolas Tackett(譚凱)為例,花費兩年才建置完成資料庫,對於研究者來說無疑是相當大的投入,但研究的學術貢獻也相對地大,得到的結論也相對地穩固,難以動搖。最後鄭文信針對技術提出意見,指出資訊工程技術不斷在進步,相應地資料庫也需要持續改進,呼籲數位人文的投資應該繼續持續下去。