学术讲座

讲座纪要|胡其瑞:什么是DocuSky?

时间:2022年04月27日

浏览:

为了响应教育部跨学科人才培养战略,厦门大学历史系本学期组织数字人文系列演讲。2022年4月14日,胡其瑞教授做《什么是“DocuSky”?》报告,此次报告也是新文科“数字人文与民间历史文献学研究”的系列活动之一。胡其瑞,湖北阳新人氏,于台湾政治大学取得历史学博士学位,现任职于彰化师范大学历史学研究所,致力于西南民族史与数位人文研究。

讲座开始,胡其瑞通过《木兰辞》中的诗句“东市买骏马,西市买鞍鞯。南市买辔头,北市买长鞭。”引出了在当今数字人文发展的突出问题:虽然当下获取资料数据更加便利,但我们搜集的资料来源不一、格式不同并缺乏合适的数字工具进行分析。因此,我们需要一个数位人文平台来整合和分析资料。

由此我们进入第一个议题:“什么是数字人文平台?”胡其瑞指出现有的数据库可以为研究者提供海量的资料,但它无法甄别哪些资料是研究者所需要的。因此未来数字人文平台的发展方向应在于脉络分析。胡其瑞以流行歌曲的分类为例,简要介绍了“脉络”的含义。按照歌曲的歌名、专辑名、发行年等不同方面的信息入手对歌曲进行分类,就可以呈现出歌曲间不同的关系,即所谓脉络。接着我们再以表格的方式呈现脉络关系,根据分类赋予其各自的栏位,就能得到元数据。而后胡其瑞以台南的六间宫庙为例,说明脉络分析在研究中的意义。从地理位置、主祀神、建造时间等不同切面入手,研究者可以对庙宇进行分类,由此呈现出不同的脉络关系。同样在对数量较大的契约进行研究时,胡其瑞指出研究的重点在于分析契约间的脉络关系,这便是利用数位人文进行研究的意义所在。与建设完成后不易增加新资料的数据库相比,DocuSky数字人文平台允许使用者以平台的方式将不同来源的资料整合在一起,随时根据使用者的需要加入新的资料或是建立新的数据库。同时胡其瑞也提醒我们,数字人文平台为我们提供的庞大云空间和数据分析工具只是一种外部因素,在研究中还需要与内部因素即研究者对资料的认识相结合才能使数字人文平台更好地助力我们的研究。

第二个议题是“什么是DocuSky?”DocuSky数位人文学术研究平台是由台湾大学数字人文研究中心项洁教授主持,资讯工程学系杜协昌博士建置的个人化数字人文学术研究平台。使用者可以通过平台自带数据库检索资料,也可以向平台上传自己的资料,并通过DocuSky的转换器将不同格式的文档转换为DocuXML格式,而后就可以建立个人化数据库,并利用平台工具进行资料分析。接着胡其瑞简要介绍了文字云、比例图、时间轴、前后缀词探勘、二元关联分析、地理信息系统、词频统计、文本对读等几种工具。DocuSky平台现已上线三十多种工具,一般常用的有十余种,而在后续讲座中胡其瑞将会就其中最常用的两三种工具进行具体讲解。

接下来的第三个议题是“DocuSky能做什么?”胡其瑞从在线取得文本与转档、文本与词汇统计分析、社会关系网络、文本与地理信息的运用四个方面,简要介绍了DocuSky的功能。

第一个常用功能是在线取得文本与转档功能,胡其瑞以金门大学何家仪同学所作的月老庙研究为例,指出当我们将电子文本资料整理为EXCEL表格后,需要通过六个步骤将表格转档为DocuXML格式,然后就能建立数据库并进行研究。

第二个常用功能为文本与词汇统计分析功能。胡其瑞利用词汇标记工具分析《红楼梦》、《西游记》中的人物和妖怪出现频率,并指出出现频率较高的词汇可以反映作者的某种想法。接着胡其瑞利用CBETA平台统计功能统计不同时代动物在大藏经中出现的频率,并提醒我们这可以反映翻译者所接触的世界,有助于启发我们的研究。最后,胡其瑞又以福建金门传统民间文书资料库为例,说明了研究者可以利用词汇标记统计功能对文献中出现的人物进行分析研究。

第三个常用功能是绘制社会关系网络,胡其瑞首先介绍了小世界理论,然后简要说明利用SNA工具绘制社会关系网络的基本步骤:先建立EXCEL表格并在表格中做出相应标记,然后将表格置于工具中绘制关系网络。简要说明后,胡其瑞使用SNA工具绘制了北齐僧人关系网络、道教神祗在《西游记》和《封神演义》中的词汇关联图、药物名称在不同律部中的呈现关联图等三幅关系网络图。这些范例说明了SNA工具的使用方法及其对研究的意义。

在文本与地理信息的运用方面,胡其瑞首先将台湾“中研院”文化资源地理信息系统所收录的台湾部分宫庙数据制作为EXCEL表格,并将该表格信息通过DocuGIS工具呈现在地图上,以此示范DocuGIS的基本功能。而后胡其瑞又展示了利用DocuGIS所做的台湾桃园中坜区基督教会的分布、福建金门风狮爷的时空分布、马偕日记作者的生命足迹、《大唐西域记》地名的坐标位置与文本互动等四项研究。这些范例说明了在研究中我们可利用DocuGIS工具展现资料中地理信息的脉络关系。

提问讨论环节,首先是罗安琪同学提问:“《西游记》与《封神演义》中出现了一些相同的道教神祗,请问这能反映什么问题,如何启发我们研究?”胡其瑞回应:“《西游记》的作者和成书年代学界已有共识,而《封神演义》的则尚有争议。因为一个区域内神的名称会随着时间而发生变化,所以同名神祗的出现可以反映两部作品在成书时间和作者籍贯上的共同点。”接着是江韵琳同学提问:“如何确认《大唐西域记》中与现在相异地名的经纬度?”胡其瑞回应:“这需要用到一些线上的资料库,在下一节资料库标记课上将会具体介绍。一些在线工具如哈佛大学中国历史地名资料库、法鼓文理学院地名资料库、台湾历史地名GIS资料库可以提供帮助。若要查询西洋史相关地名则还需查找不同的资料库。”然后是刘堃睿同学提问:“前面提到的师生关系网络的绘制是需要自行输入分析,还是有现成的数据库工具可资利用?”胡其瑞回应:“如果有现成数据库,就可以利用数据库进行人物检索并呈现关系。否则可利用数字工具如Gephi标记资料,然后再绘制关系网络。”

撰稿人&硕士研究生林锴琦

友情链接