中医药古籍数字化与知识服务模式研究与实践1论文_郁鸿吉1,申刚磊2,童思木2

中医药古籍数字化与知识服务模式研究与实践1论文_郁鸿吉1,申刚磊2,童思木2

郁鸿吉1 申刚磊2 童思木2

1无锡市中医医院教育处;2无锡市中医医院信息统计中心 江苏无锡 214071

摘要:中医药的传承和发展离不开对中医药古籍的学习挖掘,借助信息技术对中医药古籍进行数字化转换,并结合知识挖掘创新知识服务模式,构建中医药古籍信息存储、研究、知识挖掘、知识服务于一体的数字化信息平台,为中医药古籍的保护与利用提供新的方法和新思路。

关键词:中医药传承;古籍保护;古籍数字化;互联网技术

[Abstract] The inheritance and development of traditional Chinese medicine cannot do without the learning of ancient Chinese medicine mining,digital conversion of ancient books of TCM by information technology,and combining the knowledge mining innovation knowledge service mode,setting up the digital information platform of ancient Chinese medicine research,information storage,knowledge mining,knowledge service,to provide a new method and new ideas for the protection and utilization of ancient TCM books.

[Keywords] inheritance of traditional Chinese medicine;protection of ancient books;digitalization of ancient books;Internet technology

引言

古籍记录着中华民族数千年发展过程中传承下来的文化,见证着中华文明延续发展的历史,具有珍贵的史料价值、文物价值和艺术价值,是中华民族的精神财富,人类文明的瑰宝,经过几千年的辗转流传至今,往往具有唯一性并且不可再生性。目前中医古籍数字化建设大多仍停留在对古籍显性信息的数字化建设上,未深入开展古籍隐性信息的数字化建设,制约了数字化中医古籍的有效利用1。

随着《中华人民共和国中医药法》的颁布和实施,为继承和弘扬中医药,保障和促进中医药事业发展,中医医疗界越来越重视中医药古籍的挖掘保护和利用。对中医药古籍进行数字化处理。借助信息化技术将中医药古籍数字化,基于知识挖掘与知识服务构建中医药古籍知识管理平台,将中医药古籍里的隐性知识显性化,构建集中医古籍信息存储、阅读、研究、知识挖掘、知识服务于一体的数字化信息平台,可有效解决古籍文献藏与用的矛盾2,有效促进深入挖掘中医药古籍中的知识3。

1 研究背景与意义

无锡市中医医院目前古籍种类达1966种,共6864册,其中最早是明宣德六年(1431年)刻本,最晚的是1955年的石印本。这些历史悠久的古籍,虽然可以通过现代化的环境保护手段来延长保存周期,但也避免不了在使用过程中产生损毁、字体渐变模糊等一系列问题。此类书籍如果考虑保管问题而无法借阅,对于古籍文化的发扬光大就没有任何意义,图书管理室就变成了一个“仓库”。借助信息技术,对中医药古籍进行数字化转换,基于知识挖掘与知识服务构建中医药古籍知识管理平台,将隐性知识显性化处理,使读者可以实时进行在线的无损化阅读,对中医药文化传承,促进中医药古籍的挖掘与利用有着重要的意义。

2 中医药古籍数字化

用数字化手段对中医古籍进行处理,既可以使中医古籍的原貌永久保存,又可以通过数据库和网络广泛利用,特别是利用数据库等现代技术手段,挖掘中医古籍的内涵知识尤为重要4。

2.1 中医药古籍分类与编码

根据国家相关标准制定中医药古籍元数据著录标准,根据确定的书目,参照《中国中医籍书目提要》、《中国医籍大辞典》、《全国中医总目》等工具书完成所有书目的元数据著录,并对我院现存的中医药古籍进行分类与编码。

2.2 中医药古籍数字化扫描与全文本编辑

按照中医药古籍的分类,对书目及版本进行有计划的扫描成PDF文件,扫描仪设置需不低于300DPI分辨率灰度的像素进行扫描。

期刊文章分类查询,尽在期刊图书馆中医药古籍扫描过程中会涉及古籍图书的拆书、重新装订过程,需要建立一个专门的书目和破损情况的档案记录,以备检查校验。

为便于后期的全文本检索,需要借助OCR软件将扫描生成PDF文件,转换成可编辑的文本。繁体转换成简体文字难免会出现错误文字,转换完成后还需要进行人工校验,以确保转换后的文字准确无误,为后续建立全文本检索数据库,实现内容全文数字化,字字可查、句句可检的全文检索功能奠定基础。

3 中医药古籍知识服务模式探讨

(1)中医药古籍知识管理平台。平台提供知识检索服务,支持用户采用关键词、主题词等方法检索相关知识。该平台在提供知识检索服务的基础上,还能辅助用户加深对知识的理解。系统对知识内容进行分析处理,将知识重构为更易理解的形式,并提供基于知识内容的搜索、浏览和关联发现等服务。如可用文本分类技术,将知识资源按主题分类以利于用户检索;或可按照过程模型对知识资源归类,支持用户按照业务发展阶段获取相关知识。这些措施使学习者更易理解知识的相关性和潜在用途,促进知识内化。

(2)中医古籍数字化多功能知识服务模式。古籍数字化建设最重要的目标在于促使古 籍服务模式从资源服务向知识服务转变,然而,如何才能实现多功能、多层次的知识服务目的和效果。故需切合实际,对古籍数字化知识服务模式,包括个性化信息检索、基于超文本链接阅读环境、智能辅助支持功能、知识发现服务的方式、实现方法与方案。具体可包括:

个性化信息检索功能的设计与研究,即利用计算机技术实现中医古籍数据库的全文检索、条件检索、关联检索、超链接反馈检索等;基于超文本链接阅读模式的设计与研究,即通过超文本链接技术实现原本中相关内容的信息单元之间链接,以一个信息需求点为中心,汇聚出所有相关信息单元,建立多功能阅读环境,改变传统读书方式的线性顺序,为读者提供信息的非线性表达方式;智能辅助支持功能设计与研究,即利用计算机技术,为读者提供有关中医古籍内容本身的、科学准确的统计与计量信息,并提供与中医古籍内容相关的参考资料和辅助工具,如字数、字频、词频的统计数据,异体字的汇聚显示等。

(3)中医古籍数字化知识挖掘。中医古籍数字化的目的不仅在于全面展现古籍的显性信息,更重要的是实现隐性信息的可视化、显性化、扩展化,因此须在中医古籍关联知识库构建基础上进行知识挖掘,提取潜藏的有用知识和规律。该部分研究包括文本知识挖掘研究、语义关联挖掘研究、知识规律的提取研究,以及挖掘结果的可视化研究。可在古籍知识库构建的基础上,将每种中医古籍作为一个知识整体,根据古籍知识的特点,选用分类、聚类或关联分析类等数据挖掘方法进行中医古籍知识的提取、挖掘,如方剂类古籍可采用关联规则提取方剂配伍规律,病案类古籍可采用聚类方法提取疾病治疗规律,针灸类古籍可采用复杂网络方法提取腧穴配伍规律,等等。同时采用图表方式实现挖掘结果的可视化。但由于中医古籍信息年代悠久,又都是文本型数据,具有明显模糊性、不确定性和非线性等特征,如何进行深入的知识挖掘和知识发现。挖掘过程和方法如何才能体现中医思维特征、如何才能进行深层次的相关性与规律性处理。因此中医古籍信息的文本知识挖掘、语义关联挖掘、知识规律的提取也是研究的重点和难点。

(4)基于知识挖掘与服务的中医古籍数字化平台的构建。通过对古籍图像和文本发布、浏览、显示和输出方案以及网络支持平台等技术方案,构建基于知识挖掘与知识服务的中医古籍全文数据库,实现中医古籍数字化多功能知识服务模式,包括个性化信息检索、基于超文本链接阅读环境、智能辅助支持功能、知识发现与服务,为中医古籍显性和隐性信息的多层次、多环境的有效利用提供一个数字化信息平台,为中医药特色优势的发挥、客观规律的把握以及传承抢救、创新发展提供支撑和服务。

小结

中医药古籍是传承中医药学术和思想的重要知识载体,更是现代中医药科技创新和学术进步的源头和根基。古籍数字化建设既为解决古籍文献保存和利用之间的矛盾提供了有效的途径,更为中医药古籍的保护和利用带来了新的机遇,而将知识挖掘融入中医古籍数字化建设,促使中医古籍服务模式从资源服务向知识服务转变,既是古籍数字化保护和利用的方向和趋势,也是中医药事业发展所需。

参考文献:

[1]任玉兰,李政,梁红,江蓉星.中医古籍数字化建设与知识服务模式的构建[J].世界科学技术-中医药现代化,2013,15(01):45-48.

[2]刘汉强.中医药院校图书馆应加强中医药古籍数字化建设[J].农业图书情报学刊,2009,21(07):72-74.

[3]李兵.中医古籍数字化整理方案研究[D].中国中医科学院,2009.

[4]刘毅.中医古籍数字化与知识挖掘[J].图书馆工作与研究,2010(12):92-94.

作者简介:郁鸿吉,医学学士,教育处科长。研究方向:医院管理,医疗大数据。

基金项目:江苏省中医药局科技项目:LZ11126;无锡市卫生局智慧医疗项目:YGZXH1407。

论文作者:郁鸿吉1,申刚磊2,童思木2

论文发表刊物:《健康世界》2018年4期

论文发表时间:2018/5/3

标签:;  ;  ;  ;  ;  ;  ;  ;  

中医药古籍数字化与知识服务模式研究与实践1论文_郁鸿吉1,申刚磊2,童思木2
下载Doc文档

猜你喜欢