地方社科院新型智库建构路径研究,本文主要内容关键词为:社科院论文,路径论文,地方论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1 “基于互联网+大数据的新型智库联盟平台”构想的提出 1.1 利用大数据开展科研活动是新型智库的重要特征 所谓智库是指以公共政策为研究对象,以服务政府决策为研究目标,以公共利益为研究导向,以社会责任为研究准则的专业研究机构。智库是国家“软实力”和“话语权”的重要组成部分,对政府决策、企业发展、社会舆论与公共知识传播具有深刻影响[1]。在新常态下,传统的社会科学研究观察方法已经不能适应瞬息万变的国际局势和复杂多变的国内形势,从客观上要求传统智库向基于大数据的新型智库转型,从总结过去经验为主向利用互联网与物联网工具实时监测现实动态、预测未来发展为主转变,以适应与社会的同步发展,为决策层提供情报先决、政策咨询和宏观预测服务;从主观上要求新型智库在科学决策、制度设计、国家软实力等方面充分发挥专业化、思想库的作用,形成聚集民智、万众创新、科学引领咨询与决策的局面。 大数据时代对新型智库提出了新的要求,需要智库研究以数据说话,其中,基于大数据的信息化平台建设显得尤为关键。智库与大数据的融合需要借鉴应用场景的创新,建立信息采集分析系统平台,通过明确需求、关联、整合关系,统一规划技术架构和数据标准,打通政府各部门信息数据孤岛,借助智能获取、数据挖掘、深度学习等技术,对数据进行采集、管理、分析与展示。从中提取大数据的核心价值,为需求者提供精准行为分析、在线知识共享、实时舆情监控、社会网格化管理、经济社会预测、公共政策咨询等服务。同时,建立信息安全制度、开放获取规则、个人隐私和相关国家安全的数据安全保护技术及措施,为使用者提供一个安全的使用环境。 1.2 地方社科院智库平台的创新构想 地方社科院作为各级党委、政府的“思想库”、“智囊团”,需要紧紧抓住中央提出加强中国特色新型智库建设的机遇,深化改革,借助新技术和互联网发展以及智库资源相互整合的机会,积极应对时代挑战。 一方面,囿于时间、空间乃至政策等客观因素的制约,地方社科院在区域决策研究、人才交流沟通和信息资源建设上往往限于局部地区、独立发展,无法开展跨区域的协同研究与信息情报采集协作和规模集群优势,逐渐背离了大数据、云共享的客观趋势;另一方面,地方社科院的图书情报机构作为社会科学知识资源的储备者、提供者与管理者,由于规模小,特别缺少懂得数据挖掘和分析的人才,其有限的馆藏能力、服务能力与科研人员广泛的知识需求之间的矛盾越来越突出,传统的纸质情报已无法满足以科研人员为主体的科研需要,亟待借助信息化手段,从物理实体结构向网络虚拟结构的线上线下结合的O2O方式转型。 本研究认为,创新性地构建“基于互联网+大数据的新型智库联盟平台”,可以打破地方社科院的各种隔阂,实现跨地域联结,开展在线科研协同与知识定制平台共享,协同开发、共享成果,创新图书馆、信息中心服务模式,探索Web 3.0时代泛公众云资源的开放获取与采集挖掘策略,建立大型综合数据库、自有馆藏资源库、成果库、专家库的分享机制,增进社科院知识资源与相关业务模块的紧密联系,营造良好的协同运作环境,实现地方智库的数据资源和人才、业务资源的优势互补的“强连接”,更有利于充分发挥社科院之间在咨政建言、理论创新、舆论引导、社会服务、公共外交等方面的合作与大数据形成、利用和整合。 2 智库的研究现状 据考证,智库雏形早在春秋战国时期就已出现,幕僚、军师、门客等组织成为国家治理不可或缺的组成部分。1884年,英国“费边社”被认为是现代智库的“始祖”,而自1916年美国成立“政府研究所”后,现代智库组织逐步迈向成熟,世界主要国家相继设立各种智库以应对复杂多变的国际国内形势。经过半个多世纪的发展,关于智库的相关理论问题研究在20纪70年代开始引起学者的重视。Paul Dickson[2]的著作Think Tanks详细介绍了美国智库的形成与发展,被认为是最早研究智库的专著。Kent Weaver[3]所撰写的The Changing World of Think Tanks一文成为早期智库研究的重要文章。20世纪90年代以后,随着全球化、冷战结束和跨国经济一体化的出现,有关智库的研究成果迅速增加,重点突出智库在公共政策咨询和决策中发挥的作用。 我国的智库研究起步于改革开放,伴随我国在国际事务与国际政治中的地位提升而逐步升温。吴天佑、傅曦[4]对美国60个主要智库机构进行了介绍,开创了研究这一领域的先河:朱锋、王月[5]出版《领导者的外脑——当代西方思想库》一书,被认为是我国第一部系统介绍西方智库的专著。进入21世纪后,国内的智库研究开始向深度与广度延拓,一批专业智库成果问世,其中,《国家智库》、《中国智库》、《中国智库发展报告》等成为记录我国智库发展进程的重要文献资料。目前,国内学者主要关注的领域包括:世界主要国家智库的发展现状研究,智库的类型、角色与功能的探讨,中国特色智库建设,智库对公共政策的影响机制及西方智库对华决策研究等。 近年来,随着大数据、云计算等技术的成熟运用,以社科院、高校系统中图书馆、信息管理部门为代表的专家学者,开始关注信息技术作为重要生产力与生产工具对于智库发展的颠覆式革新。 中国科学院计算机网络信息中心率先自主研发出基于Web的科研协同平台Duckling[6]。王世伟[7]基于上海社会科学院信息研究的具体经验,论证了现代信息情报工作在智库中的前端作用。浙江省社会科学院吴育良等[8]从信息资源采集、信息服务模式、智库及成果的推广与评价三个方面阐述了基于智库理念的社会科学院图书馆信息服务创新。河南省社会科学院曹明等[9]认为,加快智库行业的信息化建设,推动智库信息化发展,提高智库信息化水平,成为智库现代化转型发展迫切需要解决的问题,并提出了社科型智库信息化建设评价指标体系。殷志华、兰宗敏[10]认为,应充分借助信息网络平台提升新型智库社会影响,并就如何建好智库门户网站提出了建议。山东社会科学院尹春梅[11]阐明了面向智库整合政府信息资源的必要性,并提出了具体方案。浙江省社会科学院吴育良[12]对国外知名智库信息资源建设、信息服务内容、信息服务策略等方面进行了介绍和分析,并提出构建智库决策研究支持信息服务的集成策略。黄如花、李白杨[13]基于对美国著名智库——中央情报局信息管理调研的实践,提出我国智库信息管理的思路与策略。 刘庆麟[14]提出云环境下属地高校数字图书馆联盟智库服务平台的构建。彭宜斌、田玉鹏[15]提出高校应建设出具有中国特色的高水平智库信息模型。李玲、李中国[16]就高校智库建设中平台开发的缺失与完善展开了探讨。吕长红等[17]基于上海海事大学的实践,提出高校图书馆信息智库的构建策略。 但是,国内关于新型智库下信息化平台的研究还局限于重要性的探讨阐述、国外经验的引入以及具体功能模块开发的理论探索阶段,局限性较大,缺乏关于智库信息化平台理论框架、模块规划、功能设计、核心技术遴选、实现路径等宏观层面的探讨和可行性的试验。因此,如何在“大数据”、“大连接”的时代背景下,结合数据仓库、数据挖掘、知识管理、e-Science科研信息化、云服务、Web2.0等相关理论进行可行性的平台建设,是传统智库向新型智库转型不可逾越的选择。 3 基于互联网+大数据的新型智库联盟平台的实现路径假设 3.1 平台架构 “基于互联网+大数据的新型智库联盟平台”(下简称“智库平台”)包含了专家管理系统、智库连接系统、大数据联盟系统、科研协同系统和成果转化系统五大功能模块的构建,如图1所示。这样的构建思想将能有效改变社科院数据资源采集分析利用的“短板”问题,有效提升科研效率。通过合作协调、联合作战的服务方式,将各社科院各具特点的图书馆数字化资源和特色数据库资源整合,形成国情数据库及省情数据库资源,将跨区域的协同科研分工,填补各社科院人才不足的“短板”,知识定制服务从根本上提升知识配送的效率,扭转传统的知识供求滞后或不足的问题,优化社科院系统中图书馆“为科研服务、为科研铺路”的服务职能,激发图书馆、信息中心的综合研究活力与智慧服务能力。 该平台以专家数据库为资源基础,以实现智库大连接为根本目的。在此基础上,通过实现大数据联盟的采集、加工、共享职能,并借此发挥跨地域的科研协同和成果转化的优势,如图2所示。 图1 基于互联网+大数据的新型智库联盟平台总体架构 图2 模块互动关系图 3.2 模块分析 3.2.1 基础构件:专家数据库 专家数据库旨在仓储科研专家信息与科研成果,为文献检索提供更丰富的拓展信息,实现科研动态的及时更新与跟踪,逐步建立健全科研专业人才管理、选人、用人和评价体系,为研究人才能力建设的发展趋势、中长期规划和政策法规等提供数据支持。 (1)基本信息库。专家数据库以“人”为中心,围绕社会科学专家,根据预设规则和信息源,由网络爬虫自动从公众云和私有云中抓取建立涵盖专家姓名、研究领域、教育培训经历、研究成果、突出业绩、在研项目等关键字段的信息数据库。 (2)学术成果库。学术成果库归属于专家数据库内,按照专家进行分类存储。用户可借助条件组合检索,查询到某专家学者的学术成果动态列表,并通过授权访问下载该专家的研究报告、蓝皮书、论文专著、媒体文章等成果。 (3)学术关系网。通过从专家的学术成果库中提取课题组成员、合作者等关键字段信息,可建立各专家的社会学术的“六度人脉”关系网,分析“三度强连接”关系,并将其可视化呈现。 3.2.2 基础构件:智库大连接 遴选国际、国内的官方与民间著名智库,设计专题页面,编制高端智库名录矩阵,以网站交换链接(链接联盟)的方式,外链至不同智库机构的官方网站。利用可视化,呈现不同智库的简要介绍、优势领域、学科专长及知名学者,形成智库间的关系拓扑图,与国际高端智库、国内高端智库和民间智库实现“大连接”。 3.2.3 前端构件:大数据联盟 该模块立足于各地方社科院所形成的共有云存储和建立起的协作关系,具体包括情报采集、知识加工、资源共享三个子模块。 (1)情报采集系统(见图3)。面向互联网及社科院、政府、企业系统的公共云、行业云与私有云数据库中,抓取各类结构化与非结构化数据,构筑智库联盟系统的数据云存储资源系统。各个地方社科院利用联盟的云存储资源,进一步根据自身实际开发各类特色专题库、省情数据库、研究成果库及社会科学预测、仿真和可视化平台。 图3 情报采集与协作 (2)知识加工系统。知识定制工场是由全国地方社科院图书馆信息中心机构人员联合创办的基于互联网的虚拟知识加工场所。通过建立知识定制流程系统,信息情报得到有序和高效、深度的加工。流程首先通过科研人员根据需求(文献情报)在线下单,然后通过平台组织团队开展知识加工与创新,完成后输出科研人员所需要的服务包。具体过程如图4。 图4 知识加工流程 ①门径输入(下单接单)。委托方登入联盟平台的门径输入模块,在线预约登记。联盟依据委托方需求,下单给联盟内特定的社科院科研团队。 ②知识需求分析(分析)。通过知识库、人才库,自动匹配项目的主要研究方向与内容,对委托方的知识需求进行分析,开展课题的前期调研与论证工作。 ③知识分类加工(处理)。对已有资源深度挖掘、加工,开展科研创新,建立新的知识模型,通过实践检验和计算机仿真,开发出新的理论模型或预测模型,得到新的研究结论,形成研究报告初稿。 ④成果审查通过(评审)。遴选联盟内特定领域资深的高级研究员和科研专家对可研报告进行审查,经过反馈、修改,得到研究报告终稿。 ⑤门径输出(验收)。将科研项目承接方形成的最终成果输出给项目委托方,由委托方验收通过。 (3)资源共享系统。依托各社科院的集体力量,创新智库的开放获取、有偿获取数据资源服务范式。将各地收录的年鉴、大事记、方志及时政、经济、文化、社会、自然等省情、国情数据;来自政府、行业、企业、组织机构的统计数据;自有馆藏数字文献:包括CNKI、维普、万方、超星等国内主流数据库和ISI、EBSCO、世界银行等国际知名数据库通过云技术实现互通共享。 3.2.4 核心构件:科研协同 为知识联盟科研人员所搭建的、可提供在线个人科研管理、项目监理流程支持、项目团队协同、科研支持等服务的协作平台,具体包括项目信息的检索服务、课题监理的全过程管理、“虚拟课题组”等,并支持手机、平板电脑等移动设备APP,使不同机构、不同部门的科研人员实现跨地域、跨时间的移动化科研创作。 其中,虚拟课题组为科研团队(课题组)提供在线研讨的多媒体环境,团队成员凭账号、密码登录讨论(其他团队不可见),能够实现数据共享、在线交流,实现科研文档版本控制、在线撰写、创作素材积累等功能,各功能区的日志和记录全部留在云端,可根据项目团队需求,在研究的前、中、后期导出阶段性或总结性纪要,集思广益,启迪创意,并完整保留协同创新成果;创新的知识募集功能,可让团队就攻关中的疑难问题发求助帖,亦可发布合作招募信息,吸纳新成员,从而打破以往智库间的简单外部协同。 3.2.5 后端构件:成果转化 当前国内社科智库系统的成果,往往以专报、论文、专著、研究报告等形式呈现,以专业化渠道为主,而在社会化传播方面,范围与时效仍存在较大局限,多数研究成果影响力不大,甚至不为人知。成果转化模块旨在借助新闻传媒与网络营销手段,推广成果的社会化传播,达到提升智库公信力与影响力的目的,见图5。 图5 大数据联盟平台成果转化路径 (1)自建全媒体:指各社会科学院自主建设的全媒体传播载体,具体包括院报、院刊、院网、综合门户、(在线)广播与视频、博客、微网站、微博、微信、移动应用等,其中既涵盖传统媒体的数字化,也包括数字媒体与智库平台的联结。同时,通过向注册用户推送订阅短信、邮件等形式,点对点地满足公众个性化政策研究信息需求[18],占领移动互联网终端的智库宣传阵地。 (2)主流媒体协同:与社科院系统外部、掌控大众舆论话语权的数字媒体无缝对接,延伸触角,以观点引用、成果转载、人物专访、研究动态与学术活动报道等形式,扩大与媒体间的“强连接”,增强成果推广的广度与深度。 (3)营销渠道:形成成果转化的市场运作机制。通过建立平台注册会员制,用共享积分、在线充值等方式,对成果库收录学术成果中的非保密部分开展开放阅读、有偿阅读、购买服务等多种形式服务,将具有推动社会变革的重要知识产品向消费市场推广。 4 核心技术 4.1 情报采集与抓取 该技术主要用于对人才的文献成果进行自动采集,在国内三大文献资源权威网站进行站内人才的文献采集,同时,使用人工参与和智能信息采集结合的方式,按不同业务需求向Internet发出情报采集要求,全网络覆盖的情报采集并进行跟踪。系统对采集到的情报进行排重、计算、归类、初级判断等,根据网络路径、内容要素进行传播分析和趋势分析,从海量情报预测发现热点。目前,主要依托Heritrix框架来予以具体实现,其最出色之处在于它良好的可扩展性,方便用户实现自己的抓取逻辑,并且可加入一些可互换的组件,现在已经成为一个成熟的开源爬虫,被广泛使用。 4.2 数据库相关技术 4.2.1 管理系统选择 在数据库类型的选择上,以关系型数据库管理系统MySQL为宜,其数据仓库体系结构如图6所示。作为一种在Web应用方面较具优势的关联数据库管理系统,MySQL可运行在不同的操作系统下,便于移植。它将数据保存于不同的表中,具有体积小、速度快、总体拥有成本低、查询功能强大、灵活性高的特点,支持正规的SQL查询语言和采用多种数据类型,能对数据进行各种详细的查询等,且兼具开放源码的优势,可搭配PHP和Apache可组成良好的开发环境。 图6 数据仓库体系结构 4.2.2 数据清洗 数据清洗在数据仓库系统中占据十分重要的地位,其通过发现并纠正数据文件中可识别的错误、检查数据一致性、处理无效与缺失值、滤除无效冗余数据等方式[19],保障数据仓库数据的高质量,提升数据应用与决策的精准度。数据清洗主要包括人工清洗与计算机应用程序清洗两大类型。目前主流的清洗系统包括Trillinm Software、System Match Maketr、Data Cleanser Data Blade Module、Integrity等,面向中文数据的清理系统较少,效果较差。许多数据清理工具提供了描述性语言实现对用户的友好性,降低用户编程的复杂度,如XADL语言、SADL语言。数据清理一般建议采用交互式方案,即系统将错误检测与清理紧密结合起来,用户能通过直观的图形化界面一步步地指定清理操作,可以克服单一人工或自动清洗耗时久、精度低等不足。 在智库平台的具体应用中,数据清洗主要应用于两个方面: (1)各地方社科院系统所采用的数据结构不同,因此在实现资源共享时,需要对数据进行统一清洗。 (2)情报采集系统面向公共云、行业云与私有云采集基于统计年鉴、统计调查、普查资料等数据的过程中,数据存储格式与结构各不相同,必须通过清洗实现标准化后,才能实现查询、可视化、运算分析等功能。 4.2.3 数据检索 该技术主要为智库平台提供面向三种类型的检索支持:(1)面向人才库的检索:提供关键字检索和高级检索两种方式实现人才检索;(2)面向文献库的检索:为网站用户提供文献题录、全文内容的检索查询服务,注册用户允许授权获取全文;(3)面向统计数据的检索:提供多条件组合查询方式实现统计数据的检索。 目前数据检索应用工具较为丰富,如全文检索引擎工具包Apache开源搜索服务器Lucene、Apache Solr、基于开源与分布式的云计算搜索引擎Elastic Search、SQL全文搜索引擎Sphinx以及Xapian、Nutch等。此外,Google公司开发的平行检索与MapReduce技术,可以快速有效检索大量数据,打破了传统数据处理系统在处理大数据时捉襟见肘的情况。 4.2.4 数据可视化 数据可视化技术是指运用计算机图形学和图像处理技术,将数据转换为图形或图像在屏幕上显示出来,并利用数据分析和开发工具发现其中未知信息的交互处理的理论、方法和技术[20]。 要对智库平台中存储的大量统计数据和非数值型信息资源进行开发,达到帮助理解与分析社会、验证假设与发现相关关系的目标,就需要利用原位交互分析、数据存储、可视分析算法和用户界面与交互设计等多种技术对采集的数据进行分析、推理和决策[21],以图形化的直观方式激发研究学者的形象思维,揭示数据隐匿奥秘,提升数据理解的维度、层次、动态和关系。 数据可视化主要包括思维导图、新闻的显示、数据的显示、连接的显示、文章与资源、工具与服务7个方面[22]。常用的数据可视化工具包括Tableau、VisualEyes、Google Fushion Tables、Google Trends和Many Eyes等。 4.3 云数据中心与云存储 由于大数据联盟的成员分属不同省、市地区,各本地服务器呈现分布式特征,因此需要构建虚拟数据中心平台,将分散的多种物理资源(云与非云、异构云、跨地域)池化后,灵活构建的一个逻辑的数据中心(即智库平台云数据中心),通过主动式智能化管理使物理分散的数据情报资源可以用于分享与业务协作。智库云数据中心设立在智库联盟主席单位,并实施片区负责制,负责管理地区分中心云节点,通过多地云数据中心,互为异地灾备,保障单点数据安全。具体的云架构规划如图7所示。 图7 智厍平台的云架构规划 在架构体系中,云节点主要承载整个数据中心的统一管理、备份及全局数据共享,负责承载在线业务应用(Online Carrier Applications)以及在线内部IT办公自动化及ERP/CRM/SCM/PLM/HRM类等应用,支撑应用的各类中间件(数据库、Web框架、SDP等)及上述应用所需读写访问的系统配置数据、用户签约数据以及用户媒体类数据(如个人邮箱、电子书、相片、视频、博客内容等)。 在项目开发与执行上,关键技术主要包括云并行计算、HPC高性能计算以及基于HADOOP、SPARK的大数据架构,而在云存储分布式文件系统方案,可供选择的包括GFS、HDFS、Lustre、FastDFS、PVFS、GPFS、PFS、Ceph和TFS等。 4.4 在线协作 在线科研协作起源于英国在2000年提出的e-Science概念,即利用新一代网络技术(Internet)和广域分布式高性能计算环境(Grid)建立的一种全新科学研究模式,实现在线科研协同,完成科研攻关。 智库平台的在线协作技术主要应用于科研协同模块,使知识联盟成员可以在该平台上共同创新,隶属于组织知识管理范畴,是由科研管理系统、在线课题讨论组及知识社区三大子模块集成的综合式办公套件。 (1)科研管理系统。是一套以科研全动态过程为核心的信息管理综合系统,囊括了基于Web的学术专家管理系统、网络通讯评审、课题委托监理(项目管理)等多个子系统。科研管理系统开发主要包括后台数据库的建立和维护以及前端应用程序的开发两个方面,过程复杂,涉及技术繁多,目前主流的开发方案主要依托ASP.NET、HTML5、JavaScript和MySQL展开。 (2)在线课题讨论组。满足团队会议谈论、协作的沟通需求,课题组聊天室功能可采用XMPP、Hipmob、JabbR进行开发,服务器端保留通讯消息的历史记录,提供导出选项供课题组成员下载与备份。而远程视频会议等拓展功能则可采用BigBlueButton、Mconf、OpenMeetings等进行实现。 (3)知识社区。全开放式的知识交流平台。基本按照一般BBS论坛所使用的ASP、CGI、PHP以及MvSQL等核心技术进行架设,方便注册的用户发帖求助、在线发布,满足咨询建议、征集创意、招募成员等实际需求。 4.5 互换链接 互换链接又称为友情链接,具有一定资源协同、互补优势的,且关联性较强的在不同网站之间简单易行的一种合作方式,交换双方网站(往往是主页)超链接地址实现互相推介的目的。 作为连接地方社科院的智库平台,开展互换链接主要面向两类对象,一是社科院系统内部的互换链接,形成地方智库链接矩阵;二是社科院系统外部智库的互换链接,包括国内其他政府智库、高校智库、民间智库等以及国外各顶级智库,建立良好的外部协作关系。在互换链接的设计上,采用专题页面形式,分板块、栏目规划进行,采用“Logo+图片/Flash+文字说明+简要介绍”的方式,以便于SEO蜘蛛了解网站信息,对搜索数据库进行更有效的排序整理。 通过互换链接,可以建立智库平台对于不同智库机构展示、互访的整合机制,增强智库网站的相关性,增加用户访问的便捷性,同时,提升搜索引擎可见性,整体提升智库网站在搜索引擎排名中的优势地位。 5 发展趋势与展望 大数据视野下应用场景给新型智库创新注入了强大的生命力。本文立足地方智库联盟平台构建这一背景,提出了建立国际视野的情报大数据群及提供深度智能挖掘检索的预研究团队与平台,为研究提供事前准备;建立跨地域、跨学科、跨组织的科研协同联盟,为研究报告提供人才保障;建立全媒体成果传播中心,为成果转化提供全天候服务等应用场景架构的搭建与技术实现的初步路径。 从发展趋势看,“量化决策”和“数据治国”客观上推动着政府社会的管理从“经验治理”向“科学治理”转型,这对社会科学研究方式方法的创新提出了更高的要求。新型智库离不开大数据的支持,搭建基于大数据的新型智库创新平台是时代发展的需要。 作为智库生产的重要载体,信息平台开发是新型智库建设成功与否的重要因素,这就需要信息、情报工作者们创造更多前沿的应用平台,整合更先进的生产工具。未来,数据库聚合与全景式样本、知识发现(KDD)与社科研究创新、社会与经济运行仿真预测等课题,都值得予以深入研究与探讨。地方社会科学院新型智囊团建设路径研究_大数据论文
地方社会科学院新型智囊团建设路径研究_大数据论文
下载Doc文档