港台古籍数字化现状分析及启示_中央研究院论文

港台地区古籍数字化现状分析及启示,本文主要内容关键词为:古籍论文,启示论文,港台论文,现状分析论文,地区论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

修回日期:2006-03-27

〔分类号〕G255.1

信息技术的发展,推动了古籍数字化的进程。古籍数字化不仅是更有效地保存古籍资源,也是借助现代信息技术使之有序化从而充分挖掘其中隐含的知识内涵,同时也是完善中文网络信息资源的需要。港台地区在古籍数字化方面起步比大陆较早。近些年来,香港、台湾和大陆三地区的古籍数字化形成了互为补充、共同发展的局面,为传承中国传统文化做出了贡献。

1 中国香港、中国台湾(以下简称港台)地区古籍数字化现状

1.1 台湾地区

台湾收藏有丰富的古籍。据统计,台湾地区共藏古籍约100万册,其中,善本有27-28万册。1984年,台湾的最高学术机构“中央研究院”开始了“史籍自动化计划”,意在选择对中国传统人文研究具有重要价值的古代文献,建立《廿五史》全文资料库,作为学术研究的辅助工具。依据“中央研究院”研究人员的专长与兴趣,首先输入和建立的是《食货志》全文数据库,其后《廿五史》全部资料也陆续建立。经过数年的积累和发展,现在全球因特网上,由台湾地区研发的中国古典文献资料已有数亿字,而且检索功能齐全,媒体资料多样。

就古籍书目数据库的建设而言,1983年台湾“中央图书馆”就开始建立古籍善本书目数据库,现已基本完成,可以提供题名、个人作者等多种查询途径。显示格式包括简略、标准、详细及机读格式4种。除善本外,“中央图书馆”也建设了普通本线装古籍书目数据库;此后,其他一些收藏有古籍的图书馆也都陆续采用不同的系统,建立起相关的古籍书目数据库。

1998年9月9日,“中央图书馆”、“故宫博物院”图书馆、“中央研究院”历史语言所、台湾大学图书馆、台湾师范大学图书馆、东海大学图书馆、政治大学图书馆等台湾地区重要古籍收藏单位开会讨论“台湾地区善本古籍联合目录”建设计划。会议决定分阶段完成古籍书目数据库的建设,首先就善本书、普通本线装书进行整合;古籍著录力求完整,但各馆可就个别情形作初步斟酌;分类以四部分类法为主,也可提供多种分类号;按照机读格式著录,并决定尽早进行。目前,在“中央图书馆”规划的“全国图书书目资讯网路”(http://nbinet.ncl.edu.tw)上已经建设了“善本古籍联合目录”。

古籍全文数据库在台湾比较受重视,用户可以通过利用古籍全文数据库直接获取相关的古籍资源,节省大量的时间。台湾的古籍全文数字化的成绩非常突出,重要的古籍全文数据库有汉籍全文数据库、“中央研究院”历史语言研究所古籍数据库、中华电子佛典线上藏经阁大正藏CBETA电子数据库、故宫寒泉古典文献全文资料库等。作者对台湾地区主要古籍数字化成果进行了网络调查,如表1所示。

表1 台湾地区主要古籍数字化资源调查统计

续表1

1.2 香港地区

香港的古籍数字化工作由于政府重视,又兼有技术优势,经过20余年的发展,也取得了一定的成就。在香港,从事古籍数字化工程的中坚力量是香港中文大学中国文化研究所下属的“汉达古文献数据库中心”。该中心成立于1988年,是香港中文大学中国文化研究所“古文献数据库研究计划”的专门出版单位。其研究和开发目的“在于将中国古代全部传世及出土文献加以校订、整理,并收入计算机数据库,然后通过各种媒体出版,从而为研究工作者、教育界以及大众提供一重要学术工具与文化宝库。另外,香港的一些出版公司以及其他单位也开始与大陆、台湾等相关机构合作,充分利用各自的资源优势来开发出版数字化古籍。作者在互联网上调查了香港地区的古籍数字化资源,如表2所示。

表2 香港地区主要古籍数字化资源调查统计

2 港台地区古籍数字化的特点

2.1 发展历程随技术的发展由浅入深,逐步完善

现代信息技术的发展是古籍数字化的基础条件,因而港台地区的古籍数字化发展历程亦与现代科技发展息息相关。以台湾地区为例,其最初始于中文文字资料的处理,实际上也是古籍数字化的萌芽,而后张仲陶教授、谢清俊教授在“中央研究院”开始研发单机版的古籍全文资料库,并在谢清俊、林晰于《“中央研究院”古籍全文资料库的发展概要》一文中有详细说明,主要成果有《汉代墓葬综合研究资料库》、《史记》、《汉书》等。20世纪90年代后,随着网络技术的出现,逐渐开始了网络版古籍全文资料库的研发,1994年将单机版的《红楼梦》多媒体全文检索系统改为网络版《红楼梦》网络教学研究资料中心,继而推广,使得更多的科研机构和学者甚至普通民众都能查阅典籍资料。进而又发展到多功能、多媒体、多文化的文献资料库,资料形式从文字资料扩充到多媒体资料,而文字资料也从文献原典资料扩充为研究论著资料。这个时期因为网络带宽不足,传输速度缓慢,文物书画等文献资料大多以光盘形式出版(如《清明上河图》),网络带宽改善后,逐渐以3D(dimension)动画技术呈现立体文献资料,此发展主要始于“中央研究院”于数位博物馆专案先导计划项下研发网络版的《不朽的殿堂——汉代的墓葬与文化》,以综合文字、影像、原典与研发资料,使利用者能够更方便地从多角度、全方位了解古籍的原貌。

2.2 强调区域规划与发展,追求数字化规模

良好的规划为古籍数字化的有序发展奠定了坚实的基础。如前所述,早在1984年,台湾的最高学术机构“中央研究院”即开始了“史籍自动化计划”,1998年,“数位博物馆专案先导计划”开始,有关部门有计划地规划文献数字化的工作;1999年进行第二年度的“数位博物馆计划”,将范围再次扩充;2000年,“中央研究院”受到委托,全面规划“数位典藏计划”。台湾地区在古籍数字化工作之初就很重视计划的制定,从宏观上为这项工作的长远开展描绘了一个框架。

台湾古籍数字化的主要目的有典藏、流通、研究、教学四方面,典藏与流通以保存和传扬文献为目的,研究与教学致力于古文献为现代人所用。典藏与流通强调管理,研究与教学重在应用。台湾地区古籍数字化始终强调:如何设计出符合文史学界使用,使古籍数字化资料成为文史学界教学与研究的工具,以提升其使用效能,成为古籍数字化方向的重要指标。因而台湾的古籍数字化出现了一些规模比较大的项目,如汉籍全文数据库目前在互联网上提供一亿八千万字古籍资料的计算机检索服务,是迄今较具规模的大型中文古籍数据库。

2.3 多以公益性为主,重视古籍数字化的学术性

港台地区古籍数字化多是在政府或研究院所的支持下进行,属于非赢利性质,这在很大程度上保证了古籍数字化的公益性和学术性。如香港的“汉达古文献数据库中心”主要受到“香港大学及理工拨款委员会”、“台湾蒋经国学术交流基金会”等机构的资助。古籍数字化是一项需要强大资金做后盾的工作,正是由于此,“汉达古文献数据库中心”先后开发出版了“汉达古籍资料库”系列光盘,并已提供1100万字的古籍网络检索服务。香港地区的古籍数字化由于有较为充分的资金保障,因而无需过多考虑市场的因素,学术性成为古籍数字化的重要方向,并提供多途径的检索方式,强调数据库的知识发现功能。

2.4 数字化成果的检索功能强

港台地区古籍数字化成果中有许多系统都能提供全文检索,部分可获得免费检索,而且大多数系统也都支持高级(复杂)检索。台湾“中央研究院”的《汉籍全文资料库》、台湾元智大学的“网络展书读”《中华典籍网络资料》、台湾大学的《中华电子佛典线上藏经阁大正藏CBETA电子数据库》以及陈郁夫先生主持开发的《故宫寒泉古典文献全文资料库》等都可实现复杂检索。

2.5 主办机构类型以大学、研究所、图书馆为主

纵观台湾地区20年来古籍数字化发展历程,初始是由台湾“中央研究院”牵头,继而有更多类型的机构加入这一行列,如大学、博物院、“中央图书馆”以及一些出版社(公司)和个人等,当然看其数字化成果,大多数仍由研究所和大学所主持开发。台湾的“中央研究院”所属的各研究所、台湾大学、香港的中文大学等都开发了一些颇具影响力的古籍检索系统,是古籍数字化的中坚力量。

2.6 服务对象多元化

观台湾数亿字的数字化成果,其内容级别层次有所区分,有的是一些研究性学术成果,专为一些专家学者提供服务,也有一些则是普及化读物,甚至还有为中小学生服务的,如由“中央研究院”开发的《汉籍全文资料库》中在汉籍资料库的一级栏目的最后,有一个不太引人注目的人文资料库师生版,就是为普及文史教育而向台湾大中小学师生免费开放的,其中包括了许多文史研究的重要典籍,约7千万字,占整个汉籍资料库文献的一半。

3 港台地区古籍数字化给我们的启示

3.1 有效规划,统一标准

台湾古籍数字化在受到政府重视的同时,已逐渐成为有计划、有规模的政策性工作。在资料整合方面,为了方便不同资料库之间资料的交换、流通,建立了对设资料的标准格式,并将发展后设资料与XML技术相结合,以提高资料检索的完整性与精确性。目前大陆的古籍整理出版规划并没有明确规定古籍数字化的规划问题,古籍数字化工作基本上处于一种缺乏宏观管理和调控的状态,古籍数字化的选题多由各个单位自行决定,这在很大程度上阻碍了我国古籍数字化的发展进程。随着古籍数字化的深入开展,标准规范问题日益突出。笔者认为应该由相关部门来联合从事古籍数字化的主要单位进行有效规划并制订古籍数字化的统一标准,实现其标准化、规范化,从而实现数字化成果的最大范围的共享。而且,有相关部门专门负责这一方面工作,也可起到协调、督促开发部门对其数字化成果的有效维护。

3.2 联合开发,资源共享

古籍数字化目前存在的一个重要问题就是缺乏合作,开发机构独立进行的居多,既造成了大陆及港台地区许多资源的重复开发,又同时存在许多古籍信息孤岛,浪费了巨额人力、物力和财力。今后,应该以有关部门牵头,借助于网络,走联合开发、资源共享之路,大陆发挥资源优势,港台地区则可利用数字化技术优势与经验,互为补充,以便充分发挥数字化成果的价值。近年来,港台地区的古籍数字化系统的底本逐渐采用了大陆出版的标点和校勘成果,这也有力地显示出了合作的重要性。比如,香港的迪志公司利用自身的资金与技术优势,与北京书同文公司以及上海人民出版社共同研制开发了“国家九五电子出版重点项目”——文渊阁《四库全书》电子版,这项成果也是迄今为止世界上最大的一项中文电子出版物工程之一,在整个古籍数字化进程中有重要意义。

3.3 注重开发特色资源

仔细分析大陆和港台地区的古籍数字化现状,不难发现许多单位为了充实自己的数字化成果,不惜花费巨额人力、物力和财力去开发一些非常有影响的古籍资源(如1998年一年内至少出现了3种光盘版的四库全书),而忽视了对其本身特色资源的开发。重复的工作不仅造成了很大的浪费,还容易影响本单位数字化工作的重点。浩瀚的古籍资源由于历史的原因被分散保存在许多各不相关的部门,而不同的部门都会有自己的一些特色资源,那么在数字化过程中应注意优先顺序的安排,尽量突出自己的特色,不能随波逐流,粗放式发展。台湾陈郁夫先生主持开发的故宫寒泉古典文献全文资料库就有类似“通鉴、续通鉴等”的特色收藏。

3.4 重视版本选择,注意知识挖掘

版本的问题在很大程度上影响着古籍数字化产品的质量,台湾许多官方建立的古籍全文数据库都比较注重版本,力求将最好的底本收入数据库,而且对于数据库所收的每一种古籍,在版本与校对上皆尽力忠实于底本。如《汉籍全文资料库》最显著的特点是内容全面、版本精赅。参加数据库建设的主要是台湾“中央研究院”的科研人员,但资料库所用底本主要是大陆学者的整理研究成果,如《二十五史》所选用的录入底本是台湾鼎文公司翻印的大陆中华书局点校本,多名台湾学者参与了校订工作。资料库所收录的先秦诸子,底本也多选用了中华书局今年整理出版的“新编诸子集成”本,部分古籍还录入了多种的整理版本,如《文心雕龙》就有三种版本之多。

数字化古籍的功能不仅在于一般的信息查询和信息保存,更重要的是古籍文献中的知识发现。就目前我国的古籍数字化现状而言,其成果层次有别,有的进行了一系列的深入挖掘,具有很强的学术价值,而大多数则停留在原典籍的简单复制过程。笔者在此强调数字化过程中对知识的挖掘,不仅是对原典而言,另一方面也是强调古籍数字化过程中还要注重与后人的学术研究成果(主要包括专著、期刊论文、会议文献以及其他相关研究资料)相结合,并且将原典与当前的学术研究成果建立相关参见档,使“古籍”不再“古”,不再令人望而生畏,从而也可吸引更多的读者,不仅可实现数字化成果的最大利用价值,也可使我国博大精深的古代文明在网络时代能够得到更好的流传。同时,对研究者而言,在查询某一范围的原典资料时,如已有后人研究资料,系统就能主动出示,便于清楚掌握研究的动态,从而避免重复研究。

3.5 重视相关人才的培养

古籍整理专门人才的缺乏同样是古籍数字化过程中很突出的一个问题。古籍数字化是传统古籍整理与现代计算机技术相结合的产物,通晓计算机技术的人才并不难找,而精通古籍文献知识的人才却不是太多,既懂古籍又精通计算机的人才更是少之又少。古籍数字化的关键之一是需要有能够利用技术来驾驭古籍并具有很好理解能力的“专业”人才。在这方面台湾地区无疑做了榜样,在其古籍数字化的初期,主要依靠信息技术人才的同时也开始培养研究助理以协助数字化进程。特别是1998年“数位博物馆专案先导计划”开始后,台湾北、中、南、东部地区开设了一系列“数位博物馆素养培训班”,而台北大学等更是设立专门的专业,培养古籍数字化人才。北京大学、南京大学等也有与古籍关系很密切的专业方向来培养专业人才。笔者在此强调这一点,就是为了突出“人”的因素,强调不能为了形式上的古籍数字化去简单地数字化古籍。

标签:;  ;  ;  ;  ;  ;  

港台古籍数字化现状分析及启示_中央研究院论文
下载Doc文档

猜你喜欢