2015年11月11日專題報告摘要

地點:國立臺灣大學台灣文學研究所

講題:中文文史資料的文本分析

文本分析是資訊領域的一項技術,提供從多種角度分析專業領域語文資料的機會。在過去幾年,我們與政治大學的人文學者合作,分析過許多類別的文本資料。我們分析了「中國近現代思想及文學史1830-1930專業數據庫」中的許多史學文本檔案,藉以探討"華民"的生成、"平等"和"世界"概念的演變;探索了《二二八事件台灣地區新聞史料彙編》中一些關於228事件的官方報導;我們也分析了人民日報關於"人權"的報導和台灣地區的主要報紙關於"硬頸"一詞的引入與使用。我們也與哈佛大學的「中國歷代傳記人物資料庫」研究團隊合作,希望以資訊技術協助擷取中國地方志中的人物資料。最近一年,我們更同時與哈佛大學與政治大學的團隊合作分析《全唐詩》的內容。就歷史面向來說,我們可以研究《全唐詩》所攜帶的詩人社會網路。就文學面向來說,我們研究《全唐詩》中的顏色與詩歌意象的關係。在這一次的專題報告之中,我們希望透過分享前述的數位人文經驗,吸引台灣文學、史學的學者,也加入數位人文的研究社群。