·专 题·
人文社科专题数据库建设规范化管理的若干问题
李 阳 孙建军
(南京大学信息管理学院,江苏 南京 210023)
摘 要: [目的/意义]随着数字化转型的深入,人文社科领域的专题数据库建设不断发展。本文立足大数据、智慧数据等思维,对人文社科专题数据库建设规范化管理的若干问题进行忖思,为数据驱动环境下的人文社科繁荣发展提供指导和借鉴。[方法/过程]阐释了人文社科专题数据库建设规范化管理的基本内涵,从标准规范、质量控制、开放协同、知识产权、安全管控等方面分析了人文社科专题数据库建设规范化管理的主要问题及相关发展策略。[结果/结论]对人文社科专题数据库建设实施规范化管理,有利于推进不同领域、不同类型人文社科专题数据库的规范建设、深层次知识开发与智慧服务,对支持建构具有国际视野和中国特色的人文社科话语体系有深远意义。
关键词: 人文社科;专题数据库;规范化管理;数据资源;大数据;智慧数据
1 问题的提出
随着数字化转型的深入,数字人文、社会计算等领域蓬勃发展,人文社科数据资源建设与管理逐渐兴起。在此背景下,人文社科进入了学理分析与应用的纵深化发展阶段,数据资源开发力度不断加大[1]。专题数据库是人文社科领域的重要数据资源,是面向特定领域、特定主题、特定行业等特定对象的知识型数据总汇。由于专题数据库更注重层次化、关联化的“标识性”知识体系,因此,建设具有特色化、高质量的人文社科专题数据库,对于支持深层次的人文社科数据探究、内容挖掘和智慧服务具有重要意义。
2.1 弥补了医院人才培养的先天不足 医学是一门经验科学,一名刚毕业的医学生,仅具备初级的知识积累和职业技能,需要不断接受医学实践教育,才能实现个人能力的进一步提升[8]。作为基层妇幼保健的专科医院,长期以来,我院的住院医师招聘到医院就进入了亚专科科室,通科规范化培训难以保障。通科技能是临床技能的重要组成部分,是基础工程。作为基层的专科医院,我院的科室、病种单一,无法独立完成二级学科通科性轮转培训。通过将住院医师外送到综合医院去接受内科、外科的培训,保障了我院住院医师规范化培训中的通科轮转,完成二级学科通科性轮转培训。
完善的食品安全检验检测体系对于确保食品安全和推动市场经济的发展有着重要的意义。因此,相关的管理部门必须要对食品安全检查监督制度中的问题进行纠正,构建完善的、符合我国国情的食品安全检查监督体系。
党和政府也高度重视人文社科专题数据库建设,对我国人文社科领域的数据资源保障与信息技术运用等提出了新要求。习近平总书记于2016年在哲学社会科学工作座谈会上就明确指出:“要运用互联网和大数据技术,加强哲学社会科学图书文献、网络、数据库等基础设施和信息化建设。”在一些专有领域,人文社科专题数据库建设也被提上日程,如教育部印发的《中国特色新型高校智库建设推进计划》中强调,要“实施社科专题数据库和实验室建设计划,促进智库研究手段和方法创新。围绕内政外交重大问题,重点建设一批社会调查、统计分析、案例集成等专题数据库。”在科研项目上,全国哲学社会科学规划办、教育部等以项目为依托,目前已经支持和投入了非常多的人文社科专题数据库或数据平台建设,一些重大、重点项目在特色化数据库价值评估、资料整理与调查、平台服务等方面取得了显著成绩。同时,在应用驱动下,越来越多的图书馆、博物馆、文化机构以及大学科研机构等也开始重视人文社科资料的数字化和网络化,建立了大量的人文主题网站或特色专题数据库,并积极向大众开放[2],等等。
可见,在全新的数据环境、政策导向和应用需求下,人文社科专题数据库建设稳步推进并得到了充分发展。然而,由于受传统人文社科研究独立性、人文价值偏向、技术性因素缺乏等因素影响,与自然科学领域相比,我国人文社科领域的专题数据库建设水平与服务能力一直相对薄弱。一方面,各类主体在建设人文社科专题数据库时常常是各行其是、各自为政,信息孤岛与碎片化现象比较严重,导致专题数据库建设标准不一、质量欠佳、协同共享难度大、安全意识缺失等问题与缺陷长期存在。另一方面,以人文社科核心概念和情境特点为指导的专题数据库建库逻辑和范式体系尚处于起步阶段,人文社科专题数据库建设的数据规范、知识塑造、技术体系、开放机制等问题目前缺乏普遍性共识。这些问题的存在不仅仅制约了人文社科专题数据库建设的质量与效率,也阻碍了不同领域、不同类型人文社科专题数据库之间的知识交流乃至文化层面的深度融合。
从目标导向角度看,人文社科专题数据库建设规范化管理实际上承载着双向任务,它既是一个历史遗留问题,即需要对过去积累的各类专题数据库资源进行协调、改进与规范,以实现对已有专题数据库的充分利用;同时它还是一个新兴的时代命题,因为在面向大数据、面向智慧数据的新环境下,人文社科专题数据库建设需要更加强调技术与人文的融合,语义化、互联化、协同化、自推理等将是其新代名词和标签。当然,这种双向任务的解决并不是要“另起炉灶”,而是强调在已有规范化基础上的提升与优化,因此,如何实现“旧”与“新”的综合平衡以及循序渐进的现代化发展就显得尤为重要。
2 规范化管理的内涵阐释
任何事物的发展都离不开规范性与科学性。实际上,过去人文社科领域的专题数据库建设也强调规范化,但相关研究与领域实践主要集中于强调专题数据库本身的收录范围、收录类型、基本数据标准等,缺乏关于专题数据库建设系统性、连续性、动态性、发展性、交互性等体系视域层面的考量。换句话说,如果我们将人文社科专题数据库建设视作一个庞大的知识塑造体系,那么就必须有高屋建瓴的视角,即需要对人文社科专题数据库建设进行整体层面的统筹规划与管理,以发挥其整体作用和效能。随着数据技术的不断发展,人文知识需求愈加强烈,对人文社科专题数据库建设实施规范化管理已经成为客观需要。当然,与此同时,其规范化管理内涵也发生了根本性的变化。在新环境下,我们需要对这一理论命题进行新的阐释和意义建构。
从总体定位来看,人文社科专题数据库建设规范化管理是人文社科数据资源建设与管理的重要内容,同时也是人文社科实施数字化战略、推进数字化转型的关键基础工程。作为一种特殊的数据资源集成,专题数据库更强调关联化、系统化的专题知识汇聚与智慧凝练,是人文社科数据驱动研究的重要支撑、人文知识传承的主要载体,在人文社科数据资源建设与管理体系中占据着重要地位。专题数据库建设可以展现人文社科的数字化能力,对其实施规范化管理是顺应数字化时代人文社科对高质特色数据资源开发利用需求的必然选择。
为了更好地引导数字化时代人文社科专题数据库建设,构建与之匹配的规范化管理体系显得尤为必要。如今,人文社科领域面对的新场景与情境日益复杂[3],跨学科式的具有人文特性的大科学、大工程成为时代新需。尤其是智慧数据理念的提出[4],数据资源特别是优质专题数据库资源在人文社会科学研究与服务中的重要性日益凸显,人文社科专题数据库建设规范化管理面临全新的挑战与机遇。有鉴于此,本文从规范化管理角度入手,对人文社科专题数据库建设的若干问题进行思考,寄期望于为人文社科专题数据库的规范建设、统筹协调与深度开发利用等提供理论指导和实践参考。
武成龙剑如银龙飞舞,在强劲的内劲攻击下借巧劲腾升而起,紧跟着如天际游龙向下俯冲。郑成川看出了危机,因为武成龙不再是一个人,而是一把快如游龙的狂剑。他双手叠起上下翻卷,无数的掌影宛如悬空浮莲。
随着大数据、智慧数据等新思维和新范式的涌现,构建适应新时代人文社科特点的层次化、完整可用的专题数据库建设质量控制体系显得尤为重要。从总体上看,需要立足人文社科研究和服务的特征,从统建方的战略导向、建库方的质量控制能力以及用户方的(数据资源)需求等角度综合出发,不断强化质量控制意识,拓展质量控制手段,狠抓质量控制行动,形成全面化、工程化的人文社科专题数据库质量治理格局。从具体内容层面出发,应考虑建库前、建库中、建库后的质量控制节点和目标,从质量控制主体、质量控制机制、质量控制流程、质量控制技术、质量跟踪评估等方面出发,构建贯穿于专题数据库全生命周期的多层次的质量控制体系。比如,在质量控制主体方面,可以根据不同领域、联盟等特点,设置专门的专题数据库选题规划组织、审批备案机构、质量管理部门、质量监督机构等,支持人文社科专题数据库建设质量控制的制度化、正规化、规范化等;还可以通过激励、约束等方式促进建库主体投入业务熟练、技术精湛的人员开展专题数据库建设质量控制工作,保障专题数据库质量控制的常态化、专业化、长效化等。在质量控制技术方面,需要针对人文社科专题数据库建设质量控制体系的实际应用需求,通过数据技术创新和推广,满足人文社科专题数据库建设在不同情境下对于质量控制关键技术的需求。具体涉及数据质量自动识别技术、数据状态分析技术、数据清洗技术、数据关联修复技术、数据持续性检查技术、内容挖掘技术、信息美学技术等。在质量跟踪评估方面,可以开展针对人文社科专题数据库的评估和定级活动,基于不同领域和方向设定不同层次的标准,定期进行考核检验,有效掌握专题数据库的建设情况,通过问题反馈和能力诊断不断提高专题数据库建库质量。实践中尚缺少较具代表性的人文社科专题数据库质量评估体系,因此,需要从数字化能力、科研能力、服务能力等角度入手,基于人文社科专题数据库建设规划、资源应用情境、平台系统设计、数据资源情况、维护更新、投入效益等内容,构建基于全生命周期的人文社科专题数据库建设质量评估体系,等等。
从内容结构角度看,人文社科专题数据库建设规范化管理强调建立一个全方位的管理体系,使人文社科专题数据库建设的各项内容要素(如主体、流程、工具、机制等)都处于一个体系的规范之中。比如,从微观数据资源层面出发,人文社科专题数据库建设规范化管理主要考量的是数据库本身的数据采集、分析、汇交、开放等一系列标准、质量等问题。而从整体规划和体制管理角度来看,人文社科专题数据库建设则是一个共建、共治、共享的知识系统工程,需要充分协调和利用好规划(资助)方、建库方、数据用户等参与主体的集体力量与智慧,实现人文社科专题数据库建设“点、线、面、体”的全面拓展。
质量控制是人文社科专题数据库建设的核心内容,既关系到专题数据库本身的竞争力和生命力,也会影响知识服务层面的专题数据库深度开发利用的效果。与一般类数据库相比,专题数据库建设更强调“专题”性,表现为主题层面的特色性、内容层面的专指性、知识层面的关联性等特征的综合,这就对其质量提出了要求。尤其是在人文社科领域,专题数据库建设具有连续性强、年代跨度长、人文气息浓厚、后世利用价值更高等特点,因此对质量的要求更高。需要指出,关于人文社科专题数据库建设的质量控制问题,虽然也涉及前面的标准规范层面的内容,但质量控制更多地强调可用性、服务性、效益性层面的考量。
正如前文所述,从战略角度看,人文社科专题数据库建设应是一个共建、共治、共享的系统性的知识工程,它不仅涉及相关标准规范、质量控制问题,还涉及多类资源链接、语义知识关联、跨域知识流动等内容,而这依赖于相关部门和组织之间的资源共享与统筹协作。换句话说,人文社科专题数据库建设规范化管理不是建库主体单域性质的资源建设及扩展服务,而是要从整个大知识体系出发,将不同主体的资源、用户、机制、制度等各类要素统一起来,通过跨界合作实现知识增值和价值共创。在人文社科知识服务创新变革的当下,开放协同已经成为人文社科专题数据库规范化管理绕不开的核心问题之一。目前来看,急需从宏观上的统筹规划、体制保障、机制创新等方面着力,提高人文社科专题数据库建设的开放共享与协同开发能力。
3 规范化管理关键问题之一:标准规范
标准规范是人文社科专题数据库建设的首要问题,也是人文社科专题数据库深度开发利用的前提和基础。人文社科专题数据库建设涉及系统平台搭建、数据导入、数据加工、数据著录和标引、数据存储、数据备份等多个方面,但长期以来,人文社科领域专题数据库建设存在各自为政、条块分割的现象,各类专题数据库结构散乱、数据格式不同、数据标准不一等现实问题持续存在。为此,有必要构建系统化的人文社科专题数据库建设标准和技术规范,以支持人文社科专题数据库的规范建设、集成共享与开发利用。
跨区取件一般都是出现在加盟制快递企业中。有网点老板为了多挣钱,只能打扩大业务地区的办法,多收件。尽管公司内部规定不许跨区取件,但偷偷摸摸地搞大有人在。即使被发现,但从快递企业总部考虑来看,肉烂在锅里,只要是自家网点收,你收和他收没有区别,最终都是进了企业内部。但对各网点来说,自己的客户被抢走,区域内的市场被打乱,可能会导致网点亏损,危及到自身生存状况。
具体来说,从系统平台本身来看,很多人文社科专题数据库的建设过程和平台可用性缺少标准化规范。在人文社科领域,受经费支持、学理为“核”等因素影响,很多专题数据库建设多以项目结题、利益协调等作为主要考量因素,大多数专题数据库系统选型落后混乱,数据服务平台功能单一,检索效率低下,很多都不支持机器读取和原始下载,整体系统平台可用性较差[5]。为此,有必要根据不同领域、不同方向或相关建库联盟等需要,对人文社科专题数据库的系统选型标准、系统架构标准、专题数据库门户建设规范、功能规范等问题进行统一。如统一系统运行环境和建设原则、选择技术较为成熟且稳定适用的数据库系统和平台、确立统一的专题数据库建设方法和模式、规范本地系统集成接口、提供网站基本服务指南、完善专题数据库的审批和建设流程等。在具体实施层面,由于实际情况可能比较复杂,因此,可以通过项目管理的方式对专题数据库建库方进行建库平台上的“干预”,如先由建库方根据自身需求和情况提出基本框架体系、模块内容、页面风格、管理与服务功能等,再由主管方综合总体导向和实际情况进行统筹、指导和对接。需要指出,基于目前现状,要想在系统平台层面推动全面“大一统”难度很大,这既要充分考虑技术变革与系统高成本升级的客观现实,还需要考虑不同建库方的资金承受能力、数据技术水平、人员配置等条件,因此,仍然需要在循序渐进的原则下不断促进统一建库平台的实现。
从统筹规划层面看,鉴于不同类型人文社科专题数据库的数据资源拥有量、专题建库方向、知识分工等存在差异和不同,专题知识内容之间存在知识缺口,因此,首先需要对不同领域、不同方向的人文社科专题数据库建设的现实运行状态、数据资源情况、服务功能、协同需求等进行系统性的摸底、评估、分析与整理,了解专题数据库资源的整体结构与分布。以此为基础,通过收集线索、清楚情况、刻画需求,制定人文社科专题数据库建设整体开放协同的发展政策和规划,开发人文社科专题数据库索引系统,做到专题数据库汇编“一张图”,为后续有计划、有步骤地调整、改造、整合和挖潜各级各类人文社科专题数据库资源提供支持。在协同保障体制层面,需要积极推动人文社科专题数据库建设的保障体制构架,从组织管理层面落实人文社科专题数据库建设的共建共享与整合开发。目前可以借鉴(区域跨系统)图书馆联盟[7]、中国高等教育文献保障系统(CALIS)等相关领域相对成熟的操作模式,探寻从更广义的人文社科视角搭建专题数据库保障体制框架的方法和路径。如在高校科研领域,就可以针对性地设置人文社科数据资源整合和汇交的管理机构,尤其是很多国家社科基金重大、重点项目等资助的专题数据库,应促进其统一归口和协调管理。在协同保障机制方面,应积极通过具体的运行机制构建推动不同建库主体间的数据资源互补和整合,达到“1+1>2”的效果。比如,在激励与约束机制方面,可从政策激励、物质激励、资质鉴定激励等方面入手,对数据资源建设主体开放协同展开多样化激励;同时配套相关法律约束、内部约束等约束方式。在合作与竞争机制方面,探索诸如学术机构、出版机构、图书馆、数据服务公司等联合运营与维护的长效合作与服务机制的可行性;同时搭建开放、透明、高效的竞争机制。在宣传与传播机制方面,探索面向新环境的人文社科专题数据库数字化推广和宣传的途径、方法和内容,涉及宣传形式、合作模式、市场运作、数据培训和应用等方面,等等。
总体来看,人文社科专题数据库建设的标准规范问题是一个非常复杂的历史问题和战略发展问题。虽然部分领域(如数字图书馆领域)在人文社科专题数据库建设上从系统平台、数据著录标准、元数据规范等方面作了一些区域或联盟的标准规范研究与实践,但总体来看仍然缺乏统一有效的标准规范体系,人文社科专题数据库建设的标准规范尚处于无“章”可循的分散自我建构阶段。从目标上看,必须构建起集专题数据库系统平台、元数据标准、数据内容规范、数据管理规范等一整套人文社科专题数据库标准规范体系,从底层支持人文社科专题数据库的智慧化建设、管理与服务。
“翻转课堂”作为一种全新的授课模式,不仅需要师生双方做出努力,而且需要良好的学习和教学环境的支撑。这里所说的环境既包括支持学习的“软”环境,又包括学习发生的“硬”环境。学校对于“翻转课堂”的态度对教师是否愿意尝试“翻转课堂”有着重要的影响。有的高校积极推动教育信息化进程,不仅给教师开展各类讲座和培训,还帮助搭建学习平台,老师的创新热情自然提高;有的高校对新的教学模式持怀疑态度,并且对教师的教学质量评估过于单一(比如仅仅依赖学生评教的分数这个定量指标来判断一个教师的教学水平),致使教师抱着求稳心理,不敢大胆创新。可见,学校积极营造良好的“软”环境,对“翻转课堂”的成功实施起着至关重要的作用。
4 规范化管理关键问题之二:质量控制
从系统生态角度来看,人文社科专题数据库建设规范化管理不是一个单纯的管理学命题,更强调基于管理功能的整体价值实现。规范化管理的最终目的是打破人文社科专题数据库建设在数据协同不畅、信息不对称、供需不平衡、片面“报团取暖”等方面的弊端,充分实现专题数据资源的开发利用。因此,人文社科专题数据库建设规范化管理尽管是以“管理”为核心主轴,但实际上仍然是围绕人文社科专题数据库的“建、管、服”的整体逻辑范式来系统展开,以此推动人文社科专题数据库建设的生态化发展。
一段时间以来,在各项政策与项目的支持下,各个领域、各个方向的统建、自建、共建等专题数据库不断涌现,但实体数量的增长并不意味着我国人文社科领域的专题数据库建设就走向了良性发展之道,反而带来了新的专题数据库内容质量、投入产出与有效利用方面的争论。现实中,人文社科专题数据库的质量问题主要表现在利用需求不明确、建设周期长、建库流程混乱、数据不完整、数据更新慢[6]、数据冗余、数据共享不给力、系统运行效率低等方面,各类专题数据库质量良莠不齐,一些专题数据库投入衮衮但用户寥寥,甚至成为“无用库”、“死库”、“僵尸库”等,这些症结和问题已经成为当前人文社科专题数据库建设的“负面标签”。因此,如何对专题数据库建设内容进行综合控制与质量干预,以最大化发挥人文社科专题数据库的知识价值与应用效益,是其核心和关键。
宋代皇帝出于猜疑心理,甚至觉得台谏官也“未足取信”,便“差于内臣”,甚至“差一台官以讯劾之,遣四内臣以监视之”。[4]82宋仁宗时,多次出内降委派台官审查张怀恩、李仲昌等修河之事。相对而言,宰执与台谏可以不受职守所拘:
总之,人文社科专题数据库建设的质量控制是一个需要深入且持续研究的现实问题,全面的质量控制需要有整体意识、竞争意识、创新意识、品质意识,因此需要从政策、制度、技术、评估等多个方向入手,保障专题数据库的高质量建设与运营,促进人文社科数据资产管理文化的形成。
5 规范化管理关键问题之三:开放协同
随着知识共享、开放数据氛围的逐步形成,开放协同成为人文社科专题数据库建设的重要抓手,也是面向未来的人文社科专题数据库建设的发展动力和发展趋势。然而,从现实来看,人文社科领域的专题数据库建设尚存在资源建设各自为政、数据开放共享程度低、互联互通机制缺失、资源闲散并利用低下等问题,很多专题数据库由于各种原因成为“封闭式”资源并最终沦为“死库”,总体开放协同力度和效能不足。实际上,人文社科专题数据库建设的开放协同,对于降低资源建设与管理成本、避免重复建设和分散投入、提高特色资源整合创新、弥补专题知识缺口、满足用户多样性需求等具有积极的促进意义。而当前在顶层设计层面,缺少专门针对人文社科专题数据库建设的开放协同体制和机制,严重阻碍了人文社科专题数据库的协同化培育与综合化发展。
总而言之,人文社科专题数据库建设规范化管理是一个多维主题,强调从治理角度实现专题数据库在建库规范、业务运作、协同共享、机构权责等方面的制度化、流程化、标准化,最终促进人文社科专题数据库建设的可知、可用与可享。而回归现实理性,围绕规范化管理内涵式发展的新需求,人文社科专题数据库建设尚有多个问题有待解决。
从数据资源角度来看,缺少完善的专题数据库数据标准与规范体系。目前,很多人文社科专题数据库建设大多出自各自需要建立了相关数据标准与规范,但整体呈模糊化特点且具有领域局限性。实际上,数据资源层面的标准化应该具有规划性、统一性、细化性、普适性等特点,即建设标准的制定和实施应该是面向整个人文社科领域来统筹,其内容是针对整个数据资源处理流程的规范化管理,涉及从数据采存、数据处理、数据组织到资源服务的全部过程。比如,在总体层面,与系统平台类似,需要充分协调好不同领域、不同方向数据标准规范体系的兼容性,推进数据的衔接配套、一致化、互通性等。在流程层面,如数据采集标准化方面,随着数字人文和社会计算的发展,人文社科数据来源分散、类型多样,需要针对不同的资源渠道和不同类型的数据来源构建相应的标准化采集流程、采集方法、采集手段、采集工具,并对数据的分类和筛选进行规范化管理。在数据语义化组织方面,目前大量人文社科专题数据库数据资源处于无序状态,缺乏语义关联,尚不能达到知识融合的要求。因此,需要以知识单元和知识结构为基准,制定便于机器读取和交互操作的数据格式标准,对跨学科、跨平台的异构数据及各类数据集进行碎片化重组和聚合,以构建专题本体知识库为途径,利用关联数据、简单知识组织系统等技术和标准对数据进行语义化组织。在数据利用层面,由于专题数据库的分散建设,很多数据资源自由发布,标准不一。为了实现人文社科专题数据库数据资源的有效利用和价值创新,需要制定数据分析、数据挖掘、数据交换、资源交互、资源发布和共享等方面的各类规范化标准,等等。
状态要素采集是指监测和获取环境中的重要数据或元素,其本质是对所需信息的采集。信息的获取是电力通信设备自动巡检系统的重要基础。传统巡检过程由人工进行纸质采集数据,这样会带来许多问题。为此,本文采用一套基于移动通信设备的电力通信设备数据采集方案,充分利用当前移动终端设备具有良好的便携性与普及性等特点,结合二维码扫描技术、GPS定位等技术,构建了新型的网络移动软件架构智能巡检体系[4],图1为本移动巡检系统状态要素采集流程。
咀棒车间以技术分中心制定的咀棒工艺标准(BOM)为生产标准,以生产设备科下达的月度生产计划和卷包车间实时生产进度为排产依据,组织辅料备料和咀棒生产。生产过程中由车间在线质检员负责在线质量抽检,生产结束后成品没有质量问题后配送仓储辅料仓库,在仓储辅料仓库入库前,由质量管理部门做入库成品质量抽检,合格后入库。
总体来看,人文社科专题数据库建设的开放协同本质上是一个整体性、空间性的人文社科知识建构、知识发现、知识开发和知识应用过程。在更加开放的新时代环境下,需要立足产学研用深度融合,进一步探索基于服务互联的人文社科专题数据库建设价值链体系,构建开放协作式专题数据资源价值链网,推动人文社科基础知识工程建设。
6 规范化管理的其它问题
除了以上我们惯常意义上提及较多的3个主要问题外,实际上,人文社科专题数据库建设规范化管理还涉及很多其它方面的问题,如知识产权问题、安全管控问题等。
对建库主体而言,数据(库)资源就是其重要资产。很多人文社科专题数据库建设都投入和耗费了大量的资金、人力、物力,一旦对其进行宣传推广、开放协同、统一汇交,难免涉及知识产权问题。尤其在网络化和大数据条件下,数据资源的复制性、嫁接性等增强,如何平衡数据利用率与知识产权之间的关系是一个难题。现实中,一方面,很多专题数据库自身的知识产权问题尚未明晰,总体弹性较高,对购置数字化资源产品、网络数据资源等界定不清;另一方面,专题数据库本身就是智力创造性极高的知识集成,若要推动统筹管理,理应对不同建库主体专题数据库的知识产权进行保护。
目前来看,从建库主体角度看,应要求其在专题数据库内容建设的过程中,通过整体规划和论证、数据来源甄别、传播权益界定、技术保护方案、关键资料备案、征求法制专家意见等措施处理好自身专题数据库的知识产权问题;从整体规范化管理角度看,应处理好分散的建库主体在数据资源汇交、开放共享等方面的知识产权问题,如综合考量专题数据库结构和内容,通过建立专题数据库特殊保护制度提供法律保护,如基于主体权限、投入成本、多样化许可方式等综合考虑专题数据库的利益分配问题,等等。
另外,安全管控也是人文社科专题数据库建设规范化管理面临的重要问题之一。从数据库和数据防护角度来看,主要是应用软件漏洞、计算机病毒、数据备份等方面的安全管理忽视问题[8]。从数据服务角度看,主要是指数据内容牵扯的安全管理问题。一般而言,专题数据库的数据资源应是那些不侵犯个人隐私、不危害国家安全的数据资源。对于人文社科而言,很多数据资源涉及国民经济、意识形态、法治理念、社会文化、历史界定等关键领域和内容,加之大数据环境下人文社科专题数据库建设在社交媒体数据、智能感知数据等方面的尝试,一些新兴数据源存在数据安全层面的不确定性。这种安全问题表现在多个方面,比如,在跨域安全层面,经济全球化和社会信息化促使人文社科数据资源的跨境传输更加频繁,但很多敏感数据的跨域流动会给国家信息安全和社会治理体系带来风险。在隐性安全层面,例如,过去人文社科专题数据库主要是以分散式和联盟式为主导,一旦推动广义层面的开放共享,原本未被关注、非关联的一般性专题数据资源在一定的分析手段下,可能会演变成对战略发展有影响的特殊信息和情报,给国家安全带来不确定影响。
当前,亟需建立人文社科数据安全管理制度,可以考虑以专题数据库为突破点,实行专题数据库资源的分类分级安全管理,加强相关数据资源在采集、存储、分析、共享和应用等环节的安全评估与保护,保障人文社科专题数据库建设的安全高效并可信应用。在特定数据资源方面,应强化建库主体的数据保密意识,建立相关“关键数据资源”管控机制。如对哲学、政治、经济、历史、法律等领域的特定主题数据建立分类、公示、审批与审读制度;对“关键数据资源”的流通实施白名单管理,严格控制“关键数据资源”的跨境流通[5],等等。
7 结 语
人文社科专题数据库建设规范化管理意义重大,是推动人文社科数据驱动研究与服务的基础工程和关键力量。尤其是在当下人文社科数据资源建设与管理兴起的大背景下,需要对人文社科专题数据库建设提出更高的要求,以适应新时代人文社科繁荣发展。本文对人文社科专题数据库建设规范化管理的若干问题进行了探讨,包括其内涵定位、标准规范、质量控制、开放协同、知识产权、安全管控等问题和内容。可以说,对人文社科专题数据库建设实施规范化管理,有利于推进不同领域、不同类型人文社科专题数据库的规范建设、深层次知识开发与智慧服务,对支持建构具有国际视野和中国特色的人文社科话语体系有深远意义。我们希望更多的学者、业务工作者参与到这个方向的研究与实践探索中来,推动人文社科专题数据库建设从规范化管理到智慧化管理,打造人文社科视域下数字中国建设的一个“名片”,提升人文社科“数据”话语权。
参考文献
[1]李阳,孙建军.人文社科大数据研究的价值追寻[J].图书与情报,2019,(1):1-7.
[2]刘炜,叶鹰.数字人文的技术体系与理论结构探讨[J].中国图书馆学报,2017,43(5):32-41.
[3]马费成.推进大数据、人工智能等信息技术与人文社会科学研究深度融合[N].光明日报,2018-07-29,(6).
[4]曾蕾,王晓光,范炜.图档博领域的智慧数据及其在数字人文研究中的角色[J].中国图书馆学报,2018,44(1):17-34.
[5]王晓光.加强人文社科数据资源建设与管理[N].光明日报,2018-07-05,(11).
[6]喻丽.我国高校特色文献资源建设与共享:现状、问题及对策[J].图书情报工作,2014,58(14):63-70.
[7]孙红蕾,刘博涵,郑建明.基于关联数据的跨系统区域图书馆联盟资源整合研究[J].图书馆学研究,2017,(6):83-88.
[8]袁琳蓉.高校图书馆自建特色数据库后续建设存在的主要问题及对策[J].图书情报工作,2012,56(19):52-55.
Some Basic Problems of the Standardized Management of Humanities and Social Sciences Thematic Database Construction
Li Yang Sun Jianjun
(School of Information Management,Nanjing University,Nanjing 210023,China)
Abstract :[Purpose/Significance]With the deepening of digital transformation,the construction of thematic database in the field of Humanities and Social Sciences has been developing.Based on the thinking of big data and smart data,this paper explored some issues in the standardized management of Humanities and Social Sciences thematic database construction,which provided important guidance and reference for the prosperity and development of Humanities and Social Sciences under the>Key words :Humanities and Social Sciences;thematic database;standardized management;data resources;big data;smart data
DOI: 10.3969/j.issn.1008-0821.2019.12.001
〔中图分类号〕 G250. 74
〔文献标识码〕 A
〔文章编号〕 1008-0821( 2019) 12-0004-07
收稿日期: 2019-10-14
基金项目: 国家社会科学基金重大项目“人文社科专题数据库建设规范化管理研究”(项目编号: 18ZDA326)。
作者简介: 李阳 (1989-),男,助理研究员,研究方向:竞争情报与信息资源管理。孙建军 (1962-),男,教授,博士生导师,研究方向:网络信息资源管理与大数据分析。
(责任编辑: 马 卓)
标签:人文社科论文; 专题数据库论文; 规范化管理论文; 数据资源论文; 大数据论文; 智慧数据论文; 南京大学信息管理学院论文;