我国古籍数字化的现状及展望,本文主要内容关键词为:古籍论文,现状及论文,我国论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
[中图法分类号]G255.1
[文献标识码]C
[文章编号]1003-2797(2000)04-0050-02
所谓古籍数字化,就是采用计算机技术,对古籍文献进行加工、处理,制成古籍文献书目数据库和古籍全文数据库,用以揭示古籍文献中所蕴涵的极其丰富的信息资源,为古籍的深度开发打下良好的基础。
1 古籍数字化的现状
近些年来,我国积极进行古籍数字化的尝试,取得了许多成果,主要表现在以下几个方面。
1.1 古籍书目数字化
计算机技术在我国图书馆的应用,是从90年代开始的。国内一些大型图书馆如南京图书馆、辽宁图书馆和浙江图书馆等,先后进行了古籍书目数据库建设的探索和尝试。南京图书馆已率先建立了自己的古籍数据库,初步建立了40多万条中文古籍书目数据库,为读者检索古籍书目信息提供极大方便。该库设有书名目录、著者目录、分类目录及索引目录等,读者只需用模糊检索的方法,以繁体字输入某书书名的关键词,就能找到该馆所藏该书的不同版本;如果在著者目录下输入某著者的名字,那么该馆所藏该著者的所有作品目录都会在计算机屏幕上显现。此外,辽宁、浙江等省馆也正在研制自己的书目数据库。在此基础上,图书馆界开展了建立古籍书目数据库的讨论,李致忠所撰《再论建立中国古籍书目数据库》是具有代表性的文章。1998年6月,在北京召开了“古籍机读目录的统一格式及其使用说明”研讨会,就诸多技术问题作了相应的规范。目前,《中国古籍机读格式》正在论证,即将出台。在具体的实践中,四川大学图书馆摸索出一套较有特色的古籍目录的计算机处理方法——古籍机读目录格式GJMARC的设计,对一些古籍文献目录的著录条款作了比较详细的说明,可供正在制作自己书目数据库的图书馆参考。
1.2 古籍善本数字化
1996年上海图书馆与长江计算机集团合作,采用引进与开发并举的方式,建立了一套“古籍影像光盘制作及检索系统”。该系统将古籍善本以图像形式扫描,全文录入,并研制了古籍善本的查阅系统。该工程于1997年10月正式立项,到1999年4月,已完成古籍善本1000多种60万页的扫描与标引任务,从而使古籍数字化,特别是善本古籍数字化从计算机的书目服务走向了全文服务,开了古籍善本全文光盘制作与服务的先河。
上海图书馆收藏包括古籍图书、碑贴、拓片、名人手扎、专人档案资料等在内的170余万册古籍文献,其数量之多、藏品之精,在海内外图书馆中名列前茅。在古籍善本数字化处理方面,该馆研制了古籍影像光盘制作及检索系统,揭开了古籍善本的神秘面纱。当读者置身于该馆古籍善本阅览室时,在它的4台IBM计算机上,就可以看到世上罕见的古籍善本,有的黑白相间,有的五彩互映,文字清晰,图像逼真。读者调阅一种古籍善本,从书目检索到全文阅览,整个过程不到1分钟;且阅读方便自如,可前后翻阅,也可跳跃查找;或整幅显示,或局部放大,或黑白反转,或位置颠倒,只要按动鼠标,即可马上实现;如果需要有关资料,可随即原样打印。该馆计划用5~10年时间,将馆藏善本全部录入光盘,逐步实现古籍善本的全文数字化。目前,该馆已有20种善本进入国际互联网,为中国典籍走向世界、让世界了解中国开了一个好头。上海人民出版社与香港迪志文化有限公司合作,完成了“国家‘九五’光盘重点项目——文渊阁《四库全书》电子版”的制作任务,这是中华典籍数字化的重大突破。此外,据《光明日报》1998年1月13日报道,“中国基本数据库光盘工程”已经启动,计划从传世的大约13万种古籍中,筛选出1万多种,每种确定一个通行版本和一至三个重要版本,制成光盘。
我国台湾历史语言研究所在1984年开发出了“汉籍文献电子数据库”,将历史正史中的《食货志》数字化,制成数据库。此后,又将《二十五史》、《十三经》、《文心雕龙》等制成数据库。
2 古籍数字化的展望
在古籍数字化的过程中,以下几项技术和目标将会逐步采用和实现。
(1)超文本技术将得到广泛应用。超文本系统为组织知识信息提供了非线性的表达方式,它利用计算机将文件分成文件单元,并建立相关文件单元的内部链接,读者使用时,可“点击”超链接,查询相关信息。古籍文献的正文、校勘、参考文献等部分之间的关系是典型的非线性结构,超文本系统可以很好地表达它们之间的关系。古籍文献的超文本标注可分为三个步骤。第一步,进行古籍文献超文本文件的结构设计。这部分工作主要是将古籍文献原文分解成有意义的知识信息单元,并确定它们的关系及链接。第二步,将古籍文献原文及知识信息单元变成计算机文件。第三步,按超文本结构建立各文件的超链接。
(2)实现古籍数字化的标准化和规范化。可由中国图书馆学会古籍整理专业委员会牵头,以国家图书馆、上海图书馆、南京图书馆为龙头,在深入研究的基础上,确立古籍数字化的统一著录格式和标引方法。古籍数字化后,要研制与用户要求相匹配的系统,以确保数据库的使用性能。
(3)网络化是古籍数字化,特别是古籍善本数字化的发展趋势。当古籍数字化在全国各主要图书馆实现后,就可以以网络为纽带,建立古籍数字化地区联合数据库和全国性数据库。随着网络的发展,中国丰富的古籍资源将会在网上传输,供国际互联网的用户共享。
(4)普本古籍数字化将最终实现。古籍数字化在我国已开始了书目数字化和古籍善本数字化的尝试,将来,随着这两项工程在全国各主要图书馆的完成及数字化技术的进一步发展,将会有古籍普本数字化之举。
(5)制作善本古籍数字化的辅助软件和电子工具书。在古籍数字化的过程中,需要制作利用善本古籍专门软件,如有学术价值的书目解题、古籍专家对善本书的简短评介等导读鉴赏资料;此外,还需要阅读古籍的各种工具书,如《汉语大词典》、人物生卒年考证等书。只有解决阅读中的“拦路虎”,才能增加读者阅读古籍的兴趣,从而达到对读者进行传统文化教育的目的。
(6)数字式照相将成为古籍数字化的主要方式。由于扫描速度较慢,且受幅面的限制,采用A4幅面的扫描仪,往往扫不下一些古籍完整的幅面,只得把两个半面单独扫描再拼接成整页,而拼接和调整的工程量太大,半页单独成页又使页码的标识只能以“一上”“一下”或“一左”“一右”的方式来表示,因而不能保持古籍的原貌。A3扫描仪售价要比一般数字照相机贵,且只能解决约90%古籍善本的录入;一些特殊规格的古籍,如特大开本或卷轴装的古籍,只能通过其他技术处理后再转换扫描。而数字照相机的拍摄不受幅面限制,1280、960像素的数字照相机,将能满足古籍拍摄的要求。所以,古籍数字化将会以数字照相为主。
(收稿日期:2000-09-25)