大数据背景下的应用情报学研究——教学有效性的“催化剂”,本文主要内容关键词为:情报学论文,催化剂论文,有效性论文,数据论文,背景下论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1 应用情报学的概念与发展
1.1 应用情报学的概念
应用情报学就是将情报学发现、认识的规律应用于社会情报实践,是情报实践技术和方法的科学总结与概括,或者说是情报科学技术与方法在情报实践中的具体应用。它主要研究情报有效地交流、传递和利用过程所采取的方法与手段,包括情报的获取、加工、检索、研究、报道、传递、存储以及整个提供服务过程的最佳化。
严怡民将情报学分为理论情报学、情报技术科学和应用情报学三部分,应用情报学主要研究的是情报学基础理论在不同社会领域、不同学科、不同部门的应用和发展[1]。根据马克思主义理论,实践是认识发展的基本来源,所以随着实践环境和内容的不断变化,指导实践的理论也会随之改变。随着当今社会逐渐步入大数据时代,情报服务产业的发展和情报活动对经济增长和社会发展的影响越来越大,应用情报学也面临着一个全新的挑战,需要不断通过理论和实践的创新来适应新的环境。
1.2 应用情报学的发展
随着时代的发展,应用情报学也在不断地发展,其研究内涵也在不断发生变化,见图1。互联网出现之前,通常意义上的情报学研究对象主要是普通的文本文献,如各种印刷品、出版物等,随着研究的深入,目录学、分类法、索引法等逐渐发展起来。而到了互联网时代,计算机和互联网高度普及,解决了信息的机器可读化和数据的可计算化以及信息传递和信息服务问题,情报学在原有的研究内容基础之上把各种电子信息资源也纳入了应用情报学的研究范畴,并且随着信息技术的发展,电子信息等非文本信息资源渐渐超越了传统的情报资源成为应用情报学研究的主体。随着以云计算技术为标志的大数据时代的到来,应用情报学也进入了一个崭新的阶段,其内涵得到了无限的扩充,除了普通文本文献和电子信息等非文本信息资源之外,社会各个方面的数据将都成为应用情报学研究的内容。例如,通过对某一区域内人口的所有健康数据进行采集并进行深度分析和挖掘,得到的结论可被用于重大疾病的跟踪和预防。
2 大数据时代应用情报学发展的新机遇和挑战
大数据是指需要通过快速获取、处理、分析以从中提取价值的海量、多样化的交易数据、交互数据与传感数据。从内涵上讲,大数据不仅指数据量大,还有另一层意思就是数据的复杂性“大”。根据2011年大数据世界论坛认为,大数据表现为数据体量巨大、数据类型繁多、价值密度低、处理速度快的4V特征。
随着互联网、物联网、云计算等技术的快速发展和各种社会应用的不断推广和扩大,当今社会已经具备了明显的大数据特征,全社会正逐渐走进大数据时代。2011年7月,世界大数据论坛在北京成功举行;2012年3月,奥巴马政府发布了美国政府的大数据计划,希望“通过提高从大型复杂的数字数据集中提取知识和观点的能力”。在中国,目前政府层面虽然没有关于大数据的规划,但社会上尤其是产业界对大数据却十分关注。
毫无疑问,随着大数据时代的到来,原来以数据、信息等为研究对象的应用情报学将面临全新的发展环境和一个千载难逢的好机遇,同时在研究环境、研究对象、研究方法等方面也面临着全新的考验和挑战。
2.1 新的研究环境
总体上来看,应用情报学的研究和实践面临着一个全新的环境,我们必须在新的环境下进行应用情报学的研究才有意义。主要表现在以下三个方面。
(1)数据来源和数据量的爆炸性增长。我们正处于一个信息大爆炸的时代:宽带普及带来的巨量日志和通讯记录,社交网络每天不断更新的个人信息,视频通讯、医疗影像、地理信息、监控录像等视频记录,传感器、导航设备等非传统IT设备产生的数据信息,以及持续增加的各种智能终端产生的图片及信息,这些爆炸性增长的数据正在充斥整个网络。据权威市场调查机构IDC预测,未来每隔18个月,整个世界的数据总量就会翻倍;到2020年,整个世界的数据总量将会增长44倍,达到35.2ZB(1ZB=10亿TB)。
(2)数据的重要性得到了社会的认可。据欧洲最大的咨询公司凯捷咨询公司(Capgemini)统计,76%的能源和自然资源行业的高管相信他们的公司是数据驱动的,而这一比例在医疗、医药行业和生物科技企业中为75%,在金融行业中为73%。54%的管理人员表示基于冲动或经验做出的战略决定被认为是值得怀疑的,65%同意越来越多的商业决策是基于分析性数据,数据逐渐成为各行业与职能领域的重要生产因素。在海量数据面前,处理数据的效率就是企业的生命。
(3)技术上的可能性得以实现。物联网技术、互联网技术、大规模存储技术、海量数据挖掘技术以及云计算技术等逐渐成熟,使对海量数据进行搜集、传输、处理和分析成为可能,也从另一方面进一步推动了这些技术在各个领域的应用,促进了数据源和数据量进一步增长。
2.2 新的研究对象
传统应用情报学的研究对象主要是数据和信息,而大数据背景下的研究对象则是“海量”的数据和信息。新的社会需求大大拓宽了应用情报的研究视野,仅仅局限在文献、网站等载体上的局部信息已经不能满足人们的实际需求,大数据与传统的研究对象相比,主要新在以下几个方面:
(1)数据更大。并不仅仅是“量”的巨大,包括数据来源多样化、数据变化形式多样化等,其复杂程度已经远远超越了传统的数据和信息。
(2)非结构化程度更高。大数据背景下,任何信息和数据都被视为有价值的,结构化数据的比例越来越小,非结构化数据成为情报研究的主要对象。
大数据时代情报学的研究对象与传统的情报研究对象相比有了质的飞跃,并且出现了许多新的领域,很多原有的研究方法和工具已经不适合在新的背景下进行研究,情报工作者需要通过思路、工具和方法不断地创新来满足新背景下的研究需求。
2.3 新的研究方法和工具
大数据背景下应用情报学研究面临着新的挑战,这些挑战主要表现在:(1)数据获取和搜集的范围更广,渠道更多。如何获取所有可用的数据,需要处理大量低密度、形式复杂的数据,无论是入库还是查询,现有的方法和工具都会出现性能瓶颈。(2)数据组织更复杂,组织方式高度并行。如何将高度复杂的数据转化为易于分析的数据是大数据时代必须解决的问题。(3)数据分析更抽象,需要快速响应分析所有的数据,对实时性和响应时间要求越来越高,使用的分析模型越来越复杂,计算量呈指数级上升。在上述情况下,传统的情报学研究方法和工具已经不能满足实际需要。客观情况的变化要求新的工具和方法的出现。互联网技术、传感技术、移动互联技术、大规模存储技术、云计算技术的快速发展为大数据背景下的应用情报研究提供了从数据搜集、组织、存储、分析到数据挖掘的工具,从技术上实现了研究的可能性,同时,逐渐发展起来的数据挖掘技术、Hadoop框架技术、NoSQL及其他分布式数据库技术、社会网络分析技术以及复杂网络技术逐渐得到了人们的重视,成为大数据背景下情报研究的主流技术[3]。
3 大数据时代下的应用情报学
3.1 大数据背景下应用情报学的研究框架
应用情报学主要研究的是情报有效地交流传递过程中所采取的方法与手段,实现情报的获取、加工、传递、存储以及整个提供服务过程的最佳化。著名情报学学者符福峘认为,应用情报学的构成要素主要有情报资源、情报检索技术、情报研究方法、情报交流、情报应用技术和情报经营服务[2]。这六要素是应用情报学研究的主要内容,而在大数据背景下,这六要素没有变,但每个要素的内涵却发生了本质的变化(见表1)。
(1)情报资源——非结构化。情报资源其实就是情报学的研究对象,社会上流通的情报资源基本上分为物质载体型和非物质载体型两种。传统的情报学研究对象主要是以物质为载体的情报资源,而在大数据背景下,非物质载体的情报资源成了应用情报学研究的重点。尤其随着信息技术、移动终端技术等技术的快速发展,如快速、准确地获取有用的信息和数据,并运用科学的方法和现代化信息技术手段,以优化的形式向各层次用户提供其所需的情报资源,成为应用情报学需要深入探讨和不断实践的一个基本课题。
(2)情报检索技术——逐渐弱化。检索的本质意义就是查询。传统的情报检索技术主要包括两部分:工具的选择和工具的使用,即如何使用最合适的工具达到检索目的。在传统应用情报学中,情报检索是非常重要的环节,检索的对象往往是单条信息,或某一类具有共同属性的数据集,检索结果的质量直接影响到用户的满意度,准确度是检索工作必须考虑的因素。而在大数据背景下,情报检索的对象呈现出非结构化特征,传统的精确定位检索已经无法满足要求,所以情报检索的重要性在大数据背景下显得不再那么重要。
(3)情报研究方法——不断强化。情报研究是整个应用情报学的核心和主体,主要是指通过对情报资源进行识别、整理、分析、综合、判断、推理而加工出新的情报的过程,本身是一种高度综合性的科学研究活动。而在大数据背景下,要想从复杂、海量和无序的信息中获得有用情报,各种集高度综合和深度挖掘为一体的情报研究方法成了最佳的选择,所以该环节在大数据背景下受到前所未有的重视,逐渐成为最重要的环节。
(4)情报交流——复杂化。在传统情报科学中,情报交流往往表现为局部范围内的个人与个人、个人与部门、部门与部门之间的情报交换。而在大数据背景下,由于情报资源的内涵发生了较大的变化,情报交流也变得更加复杂和频繁,社会网络中的所有信息交流都可以视之为情报交流,包括人员的流动信息、货物的运输信息等。
(5)情报应用技术——信息化、数字化。情报应用是应用情报学的最终目的,主要是通过各种情报应用技术实现情报从搜集到实现其价值的过程。情报应用技术在人类知识系统中占据着十分重要的位置,它的发展与变革影响到人们最普遍、最基本的行为方式[2]。随着信息技术的快速发展,情报应用技术也实现了从原来的手工处理向计算机化的转变,进而朝着智能化的方向发展,物联网技术、云计算技术以及数据挖掘技术为情报学发展提供了广阔的空间。
(6)情报经营服务——商业化、市场化。情报经营服务主要探讨市场环境下情报经营服务模式,价值规律在情报经营服务中的应用等问题。传统情况下,情报经营服务的对象主要是科研机构、政府机关以及个人等。随着大数据时代的到来,社会尤其是企业越来越意识到社会上海量的数据中蕴藏的巨大的商业价值,他们也都积极投入到情报经营服务中来,情报经营服务呈现出明显的商业化和市场化趋势。
3.2 大数据背景下应用情报学发展面临的问题和对策
大数据的核心组成部分是由政府机构所拥有的社会管理和公共生活数据,以及主要是由政府机构直接拥有或间接支持下可获得的物理世界和生物世界的数据。同政府数据资源相比,无论个人、企业或社会组织如何努力,所能获取和利用的数据资源都是简单、片面和利用价值极其有限的,非严格意义上的大数据。所以说大数据的开发和利用与政府行为是密不可分的,如何使政府从垄断和保密的历史惯性思维方式中解脱出来,在确保隐私、机密和国家安全的前提下带头开放数据,降低公众获取和利用政府数据资源的难度和成本,是大数据时代所面临的主要瓶颈。由于对大数据的开发和利用行为与应用情报学的发展在本质上是一致的,所以上述问题也是大数据时代应用情报学发展所面临的主要问题。
从应用情报学发展的角度来看,要解决上述问题需要从观念和行动两个方面入手:
首先要做的就是要从观念上提升应用情报学的学科地位和重要性,认识到大数据时代下的应用情报学不仅仅是一门普通的社会学科,而且是一门有必要从国家战略的高度进行布局、规划和实施的学科。其次,要在实际行动上做到以下几点:(1)通过法律的形式将政府管理信息公开,使数量庞大、结构复杂的社会数据公开化和机器可读取化,开放政府信息资源可以先易后难,从气象、地震、交通、公安、社保、医疗卫生、教育等公共数据资源的开放入手;(2)由政府牵头和主导,以产业为单位对本产业的海量数据和信息进行搜集、存储、加工和不断更新,并对这些数据进行深度挖掘,包括投资、生产、消费、统计、审计等经济领域;(3)相关的法律法规需要随着人们认识和社会环境的变化而不断调整,将数据资源作为一种最重要的国家战略资源,通过政策支持等手段扶持大数据产业链的发展。
4 大数据时代应用情报学的发展前景
通过上面的分析,可以很清楚地认识到:在大数据背景下,应用情报学在原有积累的基础上有了更为广阔的应用和发展空间。新的领域主要包括公共管理领域、商业领域、医疗领域以及环保领域等。大数据技术的不断发展将给这些领域的发展带来质的飞跃。
公共管理领域应用情报研究是受大数据技术改造最为明显的领域,也是与公众最密切相关的领域。公共管理一般包括城市管理、教育管理、人口管理等内容,可以通过对城市生活的海量数据进行深度挖掘,从而为城市管理提供决策支持。以北京的城市管理为例,北京市大概有50万个摄像头,每天产生3个PB以上的数据,北京公交一卡通每天大概产生4000万条的刷卡记录,记录了人们的出行情况,如此庞大的数据量为北京解决交通问题提供了非常好的基础。通过对海量交通数据的挖掘可以掌握最为客观和真实的公众出行需求,从而制定更加合理的交通路径规划。另外,通过对某一地区所有的教育信息进行汇总和跟踪,可以不断改进区域的教育状况;通过对区域常住人口的个人基本信息、动态进行记录、分析和挖掘,可以用于人口流动管理、治安管理等。
商业情报领域的大数据应用是目前比较成熟的领域。企业通过对海量的客户行为信息进行汇总、分析和挖掘,可以对市场情况进行准确的判断,通过对某些大型电子商务网站某一时期客户行为信息进行分析甚至可以推断出未来一段时期的社会经济趋势。例如,通过对某一电子商务网站网民上传的照片进行分析,可能发现某一种风格衣服在一定时间内可能呈现上升趋势,企业就可以预测这一季会流行某种颜色、款式,通过这样的数据挖掘解读其中蕴含的商业信息,包括收入结构、性别结构、职业结构,包括人和人之间的关系等,把有价值的数据抽取出来从而形成对商业、对经济的重要判断。
大数据技术在医疗情报领域的大规模应用将给医疗水平的提高、医患关系的改善、医疗信息管理、公众健康管理等方面带来质的飞跃。可以通过对重大疑难疾病进行长期跟踪、建立全国乃至全球的病例库和样本库,为重大疾病攻关提供强有力的情报支持,甚至还可以通过建立全民健康档案并通过跟踪健康信息不断保持更新,从而了解社会总体的健康状况。利用大数据技术将医疗情况、电子病历,甚至包括职业、行为等数据汇总并进行挖掘,通过一些渠道把各个环节的数据放在一起共同构建一个模型,那么针对这个健康状况的模型,就完全可以获得更加专业化的健康指导。
环保领域也是未来应用情报学发挥作用的主要领域。人们可以通过对全球的气象和环境信息进行汇总、处理并进行深度挖掘,从而发现气候变化的规律和异常的原因。另外,通过对全球生物和地理信息进行无差别的搜集,构建涵盖全球环境信息和情报的数据库,并建立稳定的跟踪和更新机制。利用大数据技术通过对海量的环境信息进行跟踪和挖掘,甚至可以解决全球变暖等世界性难题。除了上述的一些领域外,大数据背景下应用情报学还有可能在其他领域得到广泛应用,这有待于应用情报学实践和大数据技术的不断发展。作为应用情报研究人员,要做到以下两点:(1)积极进行应用情报学理论研究和探索,结合大数据背景的时代特征,对大数据背景的特征和内涵进行深入研究,不断实现理论创新,用新的理论指导实践。(2)不断探索大数据技术与应用情报学研究的新的切入点和结合点,积极探索大数据背景下应用情报学的应用范围,不断开拓新的应用领域,使应用情报学的社会价值发挥最大化。
相比其他国家,中国在大数据时代拥有不可比拟的优势:中国的政府体系在社会中的地位、能力和影响力要强过大多数国家,同样,中国拥有的公共数据资源以及获取数据资源的能力也都优于其他国家,但到目前为止,我国政府在社会数据的开放程度上则相对较低,所以一旦政府下决心实施开放数据战略,其推进力度和综合社会经济效益将会非常显著[6]。