信息资源数字化建设与应用技术论文_夏有志

信息资源数字化建设与应用技术论文_夏有志

夏有志

齐齐哈尔市人防指挥信息保障中心

摘要:信息资源数字化建设和应用在目前的时代发展中越来越重要,信息建设结合数字化,对数据库的理解需要进行扩展,其能够将信息资源数字化建设和应用进行集成系统的开发,使社会各个行业的信息资料得到结合,建立庞大的数据库,对信息资源数字化建设进行有效的加强,使其能够提供更多的资源。

关键词:数字化建设与应用;数字图书馆;数据库建设

随着时代的发展,网络信息技术的应用使社会发生了一定的变化,信息资源数字化建设的范围逐渐扩大,也作为一种学科在目前得到发展。信息产业在技术的引导下得到了快速的进步。其中包含的资源特点主要为人类的历史发展中没有出现过像这样信息资源得到快速的发展和扩张,同时信息资源重要性也逐渐加大,信息资源的生产和传播等都受到了极大的关注。在大学和企业等组织中信息资源对实力有着较大的决定作用,所以网络信息成为了重要的发展动力。

1 信息资源数字化建设面临的问题

(1)对信息资源数字化建设的理解片面。大部分人将信息资源数字化建设理解为文献等资料的数字化形式,其实这个范围涉及的内容比较多,包括印刷型文献和电子文档、数据库以及网络资源等不同的部分,信息资源数字化建设可以将资源进行有效的分配,使其能够发挥作用,根据用户的需求进行个性化的服务,使人们获得解决问题的方法,在各个部门机构建立数据库进行便捷实用,这是其作用。

(2)信息资源数字化建设没有完整规划。目前的数字化建设项目中缺少完善的规划,建设的目标和思路没有创新概念,在建设方面多为外语和计算机等的资料。

(3)学科不均衡,建设缺少连接性。信息化建设的资源分布的不均匀,同时在体系上比较混乱,应该在广度和深度上有集中性的特点,否则会使资源的分布散乱,市场状况不佳。

2 信息资源数字化建设和应用的分析

2.1 信息资源数字化建设的特点

信息资源建设结合科学进行规划,使资源能够具有连续性,将不同的资料和光盘资源、电子文档和文献,还包括视频和图像、图书和报纸等都汇合在一起,便于使用。

根据数据库的功能,结合挖掘和人工智能技术对信息进行提取,通过检索技术和全文搜索引擎对信息进行整理,使其大量获取。还可以采取语言理解技术将文本的存储和检索的效果增强,使用网络技术将系统进行扩充,使信息的加工和使用更加的具有智能化和自动化。

2.2 数字化信息资源的标准规定

信息资源数字化建设与应用系统应在一定的标准基础上开发 ,遗憾的是我们目前还没有相应的信息资源数字化制作标准。目前可行的措施是采用国际标准的数据格式 ,至少是开放的标准 ,如

文本: 纯文本、 XML 、 HTM L 、 PDF ;

图片: TIFF、 JPEG、 GIF;

图像: JPEG 、 JPEG 2000;

声音: M PEG、 AC3、 M P3;

视频: M PEG- Ⅱ 、Ⅳ。

2.3 数字化信息资源建设的工程项目化管理

数字化信息资源建设是一项长期而且细致的工作 ,如何有序、高效的进行信息资源建设是每一个信息资源建设者都要面临的问题。可考虑引进工程项目管理的方法 ,组织数字化信息资源建设的各项任务与环节 ,保证数字化信息资源建设有序的进行 ,同时协调各环节使其能够协同工作、并行处理 ,最大限度地发挥各环节的作用。 管理中心对信息资源流和工作流进行同步管理 ,可以实时监控各项目和各环节 ,根据工作进度和强度来有效配置人力资源 ,对各项目中完成的待发布的资源可以抽样检查和审阅 ,发现问题可以及时提醒相关的环节进行完善和修改。

期刊文章分类查询,尽在期刊图书馆

2.4 数字化资源的检索与应用

数字图书馆发布内容不断增多 ,用户迫切需要对海量数据进行压缩存储管理 ,对内容实施快捷、全面、准确的检索 ,实现智能化、个性化、自动化服务。针对这种情况 ,必须考虑高性能、高可用性的、面向 Internet 和 Intranet 的全文检索解决方案。

( 1) 全面的检索方式

系统应全面支持流行的 XM L格式数据 ,能够索引到 XM L文本的内部 ,从语义上更精确地对文献进行索引与检索。 不仅支持普通的全文检索 (布尔检索、相关度检索 ) ,而且还支持字段一级的检索。提供多种检索运算符以及组合检索 (检索表达式中混用全文和字段模式 )、位置检索、英文词根检索。基于可维护的知识辞典 ,系统可提供能够满足专业检索用户的特别需要 ,可提供跨多个库的联合检索 ,从而方便用户的精确定位信息。

( 2) 使用中文自动词切分技术

使用中文自动词切分及索引技术、中文词性判断 ,使分词更为准确。有效结合字、词索引的优点,支持 GB、 BIG5、日文等各类字符集内码 ,使信息定位更为准确。高效检索算法保证系统良好的并发性。采用“线程 并行计算”、 “多层混 合计算模式”、关键 词索引条目 加载CACHE 、 LIFO 快速排序等技术 ,使海量数字化信息的查询时间达到毫秒级。如清华同方的 TPI检索速度可达 100GB/秒以上 ,杭州某公司公司的 DL对 122. 3万篇文档(约 11. 67亿个汉字 )分类检索,时间在 0.1~ 0. 8秒之间。

( 3) 设计分布形式的结构

分布式的系统结构可通过网络文件系统对分布在不同服务器上 ,不同目录下的发布文件进行读取、设置 ,建立索引。也允许通过消息队列请求方式,来实现索引的自动建立、更新、合并等操作 ,实现系统数字化信息资源的分布式存放,从而对用户提供统一的查询入口。

2.5 数字化信息资源的使用

单机光盘版: 专题库存放在光盘上 (也可以存放到硬盘上 ),可以直接使用光盘 (硬盘 )上的数据库 ,但只能单机使用。Intranet光盘版: 专题库存放在光盘存储设备 (也可以存放到硬盘存储设备上 ) ,可以直接使用光盘存储设备 (硬盘存储设备 )上的数据库 ,只能在 Intranet 里的终端上使用。 Inter-net镜像站点: 镜像站点服务器及数据存储设备由设站单位提供 ,将软件系统和数据库托管到服务器和磁盘阵列上。设站单位交纳会员费后 ,单位内部的终端可免费使用数字化信息资源。 根据有关规定 , Internet 镜像站点还可对外提供服务。包库用户: 不具备建立镜像站点的用户 ,根据规定交纳会员费后 ,可以通过拨号或专线到中心站点或 Internet镜像站点使用数字化信息资源。

实际上 ,数字化信息资源库群会分布在政府机构网站、企业 ERP系统、研究机构信息中心、高校文献信息中心和电子商务网站等处。 网站许可并付费使用 ,企事业单位以 IP地址段登录 ,个人以用户名登录使用将是最为常见的方式。人们通过 Internet 拓宽使用信息资源的广度 ,通过 Intranet 发掘信息资源使用的深度。 公益性信息可免费获取 ,而专业性、商业性、教育性信息通过有偿使用得以生存和持续发展。

3 结语

信息资源数字化建设和应用技术作为一项庞大的工程,数字化图书馆的仅是片面的理解,数字化信息资源库的建立需要根据社会的发展特点进行,包括对网络资源和文献资料等的汇合,具有较大的范围,在社会形成的信息资源数字化建设的系统中包括电子政务、企业信息以及科研信息和教育资源、医疗信息等内容,所以信息资源数字化建设具有广泛的应用,利用信息资源数字化建设建立数据库结合网络进行使用,可以使工作生活更加的便捷。

参考文献:

[1]周京艳, 杨萍, 王世雯. 我国中医药信息资源数字化建设的现状[J]. 中华医学图书情报杂志, 2016, 25(7):49-52.

[2]张玲. 高校档案信息资源数字化建设探析——以重庆科技学院为例[J]. 重庆科技学院学报(社会科学版), 2016(3):95-97.

[3]曹雷. 信息资源数字化建设与应用技术[J]. 数字通信世界, 2016(6).

论文作者:夏有志

论文发表刊物:《防护工程》2018年第11期

论文发表时间:2018/10/10

标签:;  ;  ;  ;  ;  ;  ;  ;  

信息资源数字化建设与应用技术论文_夏有志
下载Doc文档

猜你喜欢