数字人文理论基础的探索:从知识论的角度


       首先,就数字人文的理论基础而言,本书所收录的金观涛(数字人文研究的理论基础〉一文,是篇很特殊的文章,不同于目前多数的讨论都是从数字人文自身展的角度出发,去讨论数字人文该如何界定与看待,金文改从哲学的视界,试图从知识论的角度,去讨论人文科学的本质是什么,而数字科技又能从中扮演什么样的角色。或因为金观涛作为一个长期钻研于思想史和观念史之中的研究者,所以才使他能有那么独特的视角,从另一个层次探索数字人文的理论。

 

       金观涛首先指出人文知识和自然科学、社会科学的知识不同,并无客观性的原则,而是基于他人经验在研究者心中的可重演性。因此数字分析在人文研究中所扮演的角色也不同于其在自然、社会科学中的应用,不是针对数据统计(事实分析),而是在处理历史文献和各式各样的文本;又因为文本直接涉及了人文研究的核心,所以数字科技在人文研究的重要性势必将远大于它在自然、社会科学中的比重。为了适应各类人文研究的需求,不同的研究皆需要有适合、能与之对应的计算机数据库的建立;金教授认为在这样的条件下,随着IT技术对文本深度挖掘技术的开展将会出现一门称之为数字人文学的新学科。金教授回顾了由R.G.CollingwoodReinhart Koselleck,一直到中国当代观念形成之研究,勾勒出数字人文学在观念史研究中的起源、发展过程,以及数据库统计之分析、文本深度挖掘和数字分析技术在人文研究中所扮演的意义。金教授在最后总结道,数字方法和人文研究的结合,犹如科学假说与实验配合,将形成人文研究中长程的二阶( second order)反思视野。

 

       当然,作为一个还未定型、充满各种可能的学术领域,数字人文的理论亦未定论,金观涛的论述是重要的参考,开启了一个可能的思索方向,毕竟从抽象角度去思考数字人文在知识光谱上的定位,是十分难能可贵的;一个成熟的学术类也必须具备本体论和知识论上的严谨规范的定义,才能禁得起考验。但这并不等于这样的洞见即是最后的定论。一方面,即便如金观涛所言,数字人文在观念史研究上有着明显优势,可是并不等同于数字人文全部的潜能。从历史研究角度而言不论是政治史、社会史、文化史乃至生活史等等,一个数据完备、功能强大的数据库,无疑都能带来很大的帮助。更重要地,观念在历史的进程扮演着很重要的角色,但人类的发展不单仅依靠着观念的作用;观念的演变历程该是研究者审视过去时的重点,但不应是唯一;作为以人文世界为核心关怀的“数字人文”,自然亦不该以此自限。

        此外,虽然金观涛和刘青峰两位学者,很努力的强调其研究和计量史学的不同,却很难化解其他研究者对此点的质疑与不安。面对这样的诘问,他们作出如下的回复:“我们所作的观念史研究不能与计量史学混为一谈,我们自己的定位是以关键字为中心的观念史研究,这是典型的人文学科,只不过引进了资料库方法。......

       我们强调了数据库在人文研究中只有辅助作用,它为研究者提供了极大的便利,也提出了更高的要求。它只是在对关键词的使用情况和类型分析这一素材搜集和整理环节上提供了工具,而研究者在此基础上,要以人文学科的基本范式和自己的研究素养来分析这些资料。只要不存偏见,阅读我们相关论文,就可以看出,论点的得出,并不完全依靠统计。实际上,统计只是思想史分析的一项工具。否则,单凭计算机,列一大堆图表,就可以交差,研究也不必做了。简而言之,以关键词为中心的观念史研究并不是计量史学,它本质上利用计算机数据库这一工具,令其服务于人文研究,套用一句学者的评价,它是数字人文研究的开始。”(金观涛、刘青峰2010) 但这还是不能说服质疑者,毕竟在面对大量的统计和图表下,很难不令人直觉地将其与计量史学加以联想。

        这样的挑战并不是金、刘二人所独有,在很大的程度上,是现阶段许多数字人文技术于史学应用时很容易会面临的怀疑;因为信息技术的长项本来就在于大规模数据的处理上,其结果的呈现很自然地会和统计与图表相结合。是以,对于这样的质问,一时之间很难轻易的加以回答。不过我们必须强调,计量史学的失败并不等同于统计方法于人们看待过去时毫无用武之地,正好相反,计量史学的失败并不在于统计本身,而是在于过度迷信统计,失去了人文的眼光和判断;这正好是数位人文的起点,数字工具肩负起数据保存和处理的功效,但要能真正产生意义和影响还是需要人文思维和专业的投入,两者的有机结合,才能避免重蹈计量史学的覆辙,才能开展出数位人文的独特气象,金、刘二人的答辩绝非只是避实就虚的遁词而已。诚如我们再三强调的数字人文不同于人文计算,绝不迷信数字可以解决所有人文问题。

       再者,金、刘二人的响应无法说服质疑者的另一个关键,在于这是一个典型“有待来者”的难题,因为所谓数字和人文之间的“有机融合”是个十分抽象、微妙的概念,仅从理论的面向回应,也难以一言道尽,取得理解的共识。唯有持续不间断缴出实绩,让研究成果自己为自己辩护,才是最好的解答。在下文中我们将具体的从“系铳”出发,提供方法论上一个实质的关键环节。

... ...

       除了检索之外,还希望提供研究者“观察”史料的工具。观察史料的作用有二:一是解决研究者原本的问题,即让已有自身问题意识的学者,可以轻易于史料中找到论证对象。另一个作用,则是“发掘问题”,这也才是数位人文所该关注的焦点

       该文提出各种信息技术,针对数字化的台湾史料进行分析,提出一些有待深究、有待讨论的问题。这些问题可分成四类:

其一是从年代与空间分布的提问,尤其是前者。利用年代分析图,可以快速掌握一群资料的时间概况,但其分布状况,经常与预设有些差异,其间的落差因此有待进一步解释。

其二是词频的分析,我们举了朱一贵与张公艺两个不同文件集的例子。有时值得研究的问题不见得是在词频上位居前面的名字,反而是应该出现而没有出现的状况。如嘉庆年间对中部平埔族发展影响甚大的郭百年事件,郭百年的名字却未见于明清档案之中。换言之,除了注意史料中“所有”之外,我们也应该对史料中“所无”保持敏感度。

第三种形式的问题,来自史料间的关系。利用计算机进行一些繁琐的比对,进而重建史料间关系,往往会浮现一些以人工难以发现的现象。

最后一类,则是从相似文件出发的问题。与前一项类似,相似文件也是利用计算机对文件进行大量的、重复的比对,这样的工作交由人工,十分辛苦,对计算机而言却是轻而易举。另一方面,当计算机取代了重复却单纯的工作时,更复杂的问题,唯有靠能够深思的研究者才能处理。

      在该文结论中指出,这些工具和问题,都企图要说明在数字人文的研究中,资讯技术可以协助历史学者发掘一些意料之外的问题。这些问题可能无法轻易回答但却很可能能够刺激人文研究者开拓出新的视野,这或许才是下一阶段数字人文所该试着回答的,即主动去挖掘人力所“始料未及”的学术问题,而不只是单纯的被用来搜寻、统计的工具。要完成这样的目标,其前提要仰赖人文研究者和系统开发者间无止境的互动与对话,也或许唯有在这样的系统不断进化、完善的过程里,才能真正回答关于数字和人文结合的种种怀疑和不信任,才能渐次捕抓、形塑数字人文的专业边界。

 

本文摘自:项洁 编《数位人文研究的新视野 -基础与想像》之“导论”