基于众包模式的档案馆信息资源协同共建研究,本文主要内容关键词为:档案馆论文,信息资源论文,模式论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
在当下的数字时代,新的参与和协作形式正在全球范围内改变着商品或服务的发明、生产、销售及分配方式,组织实体相对弱化,且开源与协作成为劳动的新形式,而网络架构的开放性正是这种优势的根源[1]。Terry Cook曾提出档案第四范式,即档案工作者与社会/社区(既有城市和乡村的真实社会/社区,又有网络空间社会连接的虚拟社会/社区)共建档案,由专业档案员鼓励和指导大众参与建档[2]。众包模式通过移动互联端到端的连接方式开启了微观个体参与价值创造的形式,为档案馆与用户协同共建档案信息资源、充分提高档案信息资源与用户需求的契合度提供了机会。 1 众包的含义、要素及特征 1.1 众包的含义 Jeff Howe在2006年6月首次提出“众包”(crowd-sourcing)概念,并将其定义为“将传统上由指定代理(通常是一个员工)负责的工作以一种开放的形式外包给不确定的一大群人的做法”[3]。Gregory D.Saxton对现有的众包模型进行综合研究,为众包提炼出了一个实用而严格的定义,即众包是一个组织利用先进的互联网技术和虚拟人群的努力来执行特定组织任务的资源聚集模式[4]。 1.2 众包的要素 众包是“人群、外包、先进的网络技术”三个关键要素的十字路口,其本质是开放式的大众创新,以网络为载体将大众与外包结合起来。众包所面对的人群是未定义、非专业、规模性、异构的在线人群,由网络团体作为生产者、创新者以及问题解决者扮演“服务供应者”的角色;先进的网络技术(特别是web2.0应用程序)作为价廉、易用、交互、分散的“富”媒体源,不要求用户具备预定义的知识结构,而是提供一个高度灵活的、互动的、以用户为中心的、可适应人类活动变化的系统或技术平台,吸引了具备最短学习曲线和低成本的大规模用户,促进了用户内容的创建。 1.3 众包的特征 一是自主性协同。众包团队内部高度自治,以自组织的形式进行“模块化”与“整体化”相结合的协作,通过网络技术及时调配众包业务,实现资源重组和最优协同。第二,网络化分布。生产和创新不局限在一个具有固定边界的组织内,而是作为网络节点围绕共同的众包项目组成网络社区[5]。第三,开放式创新。任何人都可以依靠开源生产的形式参与众包,且不围绕传统生产模式中的固定中心进行扩散,在网络社区的每一个网络节点上发挥能动性和创造性。第四,动态型生态。可根据业务需求动态地配置资源和业务,也可根据众包主体意愿的变化实现组织结构深度或广度的变化,众包发起组织实现了从契约式生存到生态化生存的转变。 2 众包模式应用于档案馆信息资源协同共建的内涵 基于众包模式应用于档案信息资源协同共建是指依托于网络技术,将档案馆信息资源建设的相关业务外包给网络大众,通过扩大开放档案信息资源建设主体的方式实现档案信息资源的丰富化、序化和优化。其本质是档案馆实体虚化、用户端口前移以及二者互动方式的强化,即档案馆作为众包活动发起者引导、鼓励和授权用户参与档案信息资源建设,用户成为区别于档案机构的建设主体,最终由档案馆与用户两大主体通过协同方式共同建设档案馆的档案信息资源。其优势是利用网络人力资源开发突破档案信息资源分散保存,档案馆人员、资金、技术的匮乏以及档案信息资源建设难以满足用户需求等瓶颈,促进档案馆自身建设,有效提高档案信息资源建设与用户需求的匹配度。 3 众包模式应用于档案馆信息资源协同共建的案例研究 3.1 典型案例 美国国家档案馆(以下简称NARA)的“Citizen Archivist”(公民档案工作者)项目是档案机构开展众包项目的典型案例,曾获“2012年度政府最佳创新实践奖”。NARA在其网站的一个中间界面设置了该栏目,公民注册后可登录参与标记文件、转录档案、上传图像、优化注释、编辑档案馆的维基百科文章等众包活动[6]。 荷兰的“Velehanden”(众在参与)项目是荷兰阿姆斯特丹档案馆与一家名为PiCture的数字化公司合作发起的,由PiCture根据档案馆需求开发、维护众包网站,网民经过注册后可登录网站对档案进行转录、著录、贴标签、建立索引等,参与者可以获得积分奖励以兑换中意的档案复制品[7]。 苏格兰“档案转录”项目由苏格兰三大国家档案机构(苏格兰国家文件署、苏格兰国家图书馆、苏格兰皇家历史与古迹协会)于2013年发起,将最新数字化的1645年至1880年间18万页有关地理测绘、纳税登记等内容的档案信息发布在网站上,网民经过注册并接受培训后,即可参与转录与发掘档案中的苏格兰地名、人名等工作。参与者可免费浏览、下载和拷贝原本需要付费的档案图片[8]。 瑞典“Living Archives”项目由瑞典美狄亚·马尔默大学于2012年发起,旨在通过众包整活档案资源。公众可在城市环境中通过移动终端和社交媒体查看、修改、注释或共享档案资料,也可将为特定原创目的创作的档案内容建档归库,或者将公众收集的信息加入数据库[9]。 3.2 案例分析 结合上述案例,可总结出以档案信息资源建设为主体的众包活动主要包含以下四方面内容: 3.2.1 众包活动模型:由档案机构作为发包方,以网络为载体,通过档案网站的主页或者专设网站发布众包业务,网民通过注册和登录成为接包方,根据自身兴趣和能力完成众包业务,并在审核通过后获得一定回报。 3.2.2 众包活动参与角色:三个重要主体扮演不同角色,即档案机构扮演项目发布者、业务指导者、成果验收者以及隐形管理者角色;网络用户扮演项目执行者和成果过滤者角色;后台专家扮演系统平台维护者、映射词源构建者以及成果验收者角色。可以看出网络公众是众包活动的主体,而档案机构和后台专家则退至台后为网络公众搭建环境和提供服务。 3.2.3 众包活动协同模式:美国社会学家Alvin Toffler指出“第三次浪潮使人类回到以微观个体分散经营为主要经济形式的社会”,强调微观个体从资源、运营和价值三个维度构建协同创新模式”[10]。笔者结合上述档案类众包活动,将档案类众包协同模式梳理为资源、平台、运营、价值四个层面的协同,并与众包效果呈正相关。资源协同即档案信息资源挖掘、流通和整合,平台协同即网络平台各端口的自组织协作,运营协同即网络业务渠道、互联技术及运营机制的运行,价值协同即组织者与参与者关于众包理念、价值驱动的认同。 3.2.4 众包活动类型:在已有的众包实践中,可归结出众包活动类型主要包含特色档案信息资源的创建、已有信息资源的组织两方面,以及部分源代码的修缮。 4 众包模式应用于档案馆信息资源共建的模型构建 根据众包活动的普遍特点及相关理论指导,笔者构建出基于众包的档案馆信息资源协同共建模式,如下图。 4.1 软件架构和界面设计 网络众包创新系统/平台本质上是一个大型的分布式计算系统,每一个众包参与者并行完成基于人工智能的工作[11]。在众包系统平台的顶层设计、内部架构构建和接口处理过程中,需要强调体现“编码化和模块化”的设计理念。 首先,网络众包系统应该是一个面向大众的开放性交流平台,可采用Media Wiki Vl.24.2最新版开源软件,提供必要的开放式接口(Open API),在PHP+Mysql软件架构的基础上构建LAMP或者WAMP等网络运行环境,使用简便、开放且支持群体协作式超文本编辑和协作,搭建一个良好的互动平台以供多人编写、上载和发布内容[12]。 其次,在软件架构的构建过程中,也可借鉴Google公司为了实现大规模数据集并行运算提出的Map Reduce架构。“映射”(Map)是指把关键词分别进行处理生成一整套中间性关键词,而“化简”(Reduce)是指合并具有相同关键词的内容[13]。笔者认为可主要应用众包参与者所提交成果的系统审核阶段,先运用前者功能对所提交内容进行处理,生成一整套中间性关键词,再运用后者功能合并具有中间关键词的信息内容,借助竞争或合作机制,实现档案信息资源的优化配置,在保证质量最优的同时抑制信息增量扩大化。 众包模型的界面设计与众包个体参与众包的兴趣度和完成度直接相关,应做到以下几点:一是层次性。界面设计应当层次分明,通常包括一级分类页面、二级众包入口页面、三级命中数据页面、四级全记录页面,从网站登录到资源创建完成形成清晰、流畅、完整的流程。二是友好性。友好性即便捷性,要尽可能地方便用户操作,如使用简单的登录方法、简化登录注册过程等。三是趣味性。应在界面设计中添加趣味元素调动网络公众参与众包的热情,如瑞典“Living Archives”项目在Open Data的创建过程中就采用了游戏化的方法,取得了较好效果。 4.2 众包主题设计 档案馆开展基于档案信息资源建设众包活动需要根据四方面因素来设定项目主题。一是档案馆数字馆藏发展政策。项目目标设定时以数字馆藏总体发展政策为纲,主要包括数字馆藏总体建设目标、数字馆藏组织、存储、利用政策、数字馆藏分时性、地域性发展政策等。二是档案馆当前馆藏评估概况。只有明晰当前馆藏的数量、内容及类型,才能明确有哪些档案信息资源需要众包、可以众包、应优先众包或者独立于众包。三是用户需求。以用户需求的调查分析为基础,主要包括档案资源内容需求、档案资源利用需求以及档案馆在线服务需求以及各项需求的迫切程度等。 4.3 共建内容设计 笔者基于现有档案机构众包活动的调研以及众包发展趋势的理论分析,结合档案馆信息资源建设的特殊性,认为网络公众可从以下几项内容参与档案馆信息资源的协同共建。 4.3.1 意见征询类 网络公众兼具众包项目参与者和档案信息资源利用者双重性,因此网民的意见和建议对档案信息资源建设有重要影响。笔者认为档案信息资源建设意见征询主要包括两方面内容,即对缺位资源的用户需求以及对已有或新建资源的用户体验。征询方式可包括主动邀请众包用户参与在线访谈、问卷渊查、情景行为分析等。 4.3.2 档案资源内容贡献类 档案馆馆藏的日益丰富和多样化是档案信息资源建设的重要目标,在已有档案类众包活动类型构成中,内容贡献类众包是主要组成部分,也是较为简单易行和富于趣味性的活动,主要表现为档案信息资源的征集、转录、纠错等。 档案信息资源内容征集、转录多指分布在社交网络上的众包个体基于众包项目主题,利用网络技术将原生数字资源或者将物理资源数字化后提交到档案馆数据库,对档案馆数字资源的丰富化有直接作用。如美国纽约公共图书馆开展的众包活动“菜单上有什么”,由众包个体将1840年至今的菜单数字化上传,至今已完成17145份菜单的三分之二内容;路易思维尔大学档案和特殊遗产收集部开展的报纸转录活动,利用公众力量转录《路易斯维尔领袖》—— 一个历史性的非洲裔美国报纸[14];较为典型的还有澳大利亚图书馆开展的“Picture Australia”(图说澳大利亚)活动,图书馆不仅从海内外50多家文化遗产机构收集图片,还鼓励公众将自己的数字图片上传,在四年内实现了55664条的图片纪录增幅[15]。 档案信息资源内容纠错是为了避免由于OCR识别、网络资源URL失效等技术问题或者档案信息资源建设者疏忽造成的内容问题,吸引用户对内容进行基于人工智能型的挑错和改错活动。芬兰国家图书馆报纸数字化项目专门请公司设计原始扫描图片和OCR识别图片限时比较纠错的游戏软件,以吸引用户参与查找OCR技术的识别错误[16]。 4.3.3 信息资源组织类 档案信息资源组织类活动是指通过对档案信息资源的表征和有序化,促进档案信息资源从无序化向有序化转换,促进档案信息资源的有效流通和优化配置[17]。笔者结合众包实践将该类活动归结为对档案信息资源进行筛选、编目性描述、评论型描述、用户导向型分类等。 档案信息资源的筛选。多限定在专门学科,要求众包个体有一定的专业知识储备,结合自己的学科背景知识帮助档案馆遴选和整理出优质资源,以充分完善档案信息资源建设。如美国卡耐基大学聘请专家来遴选和整理图书馆科学史方面的馆藏资源,北京大学历史地理数据库则聘请本校历史地理研究所的专家进行数字资源的选择[18]。 档案信息资源编目性描述。通过具体描述每份文件或案卷的特征,揭示其主题内容、价值及出处,以便档案人员和利用者了解、管理和利用档案。在数字环境的方法选择上,除了元数据、XML、EAD、RDF等,还可引入本体论等方法,提高著录结果的语意延伸性,加强著录结果间的联系。如上文中提到的美国“Citizen Archivist”项目,该项目鼓励网民登录网站对感兴趣的档案进行著录、添加标签、建立索引等,极大地提高了档案信息资源的被检率。 档案信息资源社会评论型描述。在档案信息资源组织类众包活动中,信息描述也呈现出了社会化的趋势,可通过两条途径展开:其一是利用本地平台提供的评论、标签、评级、排序和关联功能参与进来;其二是利用第三方社交网络,即档案馆将开放范围内的档案资源在本地网站发布的同时,也在某社交网络发布,由活跃度更高的网络群体进行tag、评论、打分等活动,其参与成果会在本地数据库存储,如美国国会图书馆与Flicker合作,让用户为照片添加标注和评论,在24小时内就收到了500多条评论[19]。 档案信息资源的用户导向型分类。在传统的档案信息组织方式中,其惯有的分类组织体系主要是服务于档案馆工作人员查找定位档案资源。而数字环境下,用户多是自助查询所需档案资源,对于传统档案分类组织体系的不了解或不适应阻碍了档案的利用。因此档案馆将档案信息资源分类活动众包,由用户作为分类主体,在科学分类、知识分类的基础上,以用户需求和利用模式为导向,利用信息技术进行二次分类,构建层次清晰、布局合理、重点突出的分类组织体系,在原有档案馆导航体系之外建立新的导航体系。 4.3.4 系统开发与维护类 档案信息资源开发与维护类众包活动的本质是“以开放源代码的形式鼓励大众参与”[20],吸引众包个体中具备一定专业学科背景或经验的技术开发用户参与服务系统的设计、开发与维护,构建出能够最大限度满足用户需求的信息系统。其次,还可邀请用户参与写档案信息资源的检索帮助、软件使用帮助、导航系统使用说明等。此外,档案信息资源信息系统的日常维护也可利用公众的力量来进行,既可将用户需求体现在系统建设中,又可弥补档案馆技术人员和技术能力上的不足。 4.3.5 参考咨询类 档案馆把原本应由参考咨询部完成、但因能力或时间不足而难以完成的任务发布在互联网上,外包给网络大众来完成。可以充分发挥众包的人力资源优势,由用户为用户提供参考咨询,可更容易理解用户的问题咨询用意,给出符合用户需求的解答以供参考。 5 众包模式应用于档案信息资源协同共建的管理机制 网络众包社区的自组织型协作并不等于无组织型协作,尽管高度自治,但为了保证项目成果具备较高的信度和效度,发包方多会在“盲”协作的环境中予以必要的、有效的管理,加之档案信息资源自身的保密性,更需要作为发包方的档案馆形成良好的管理机制。Namhissan和Sawhney提出了两种网络管理范式:由主导者决策创新的过程、定义工作的本质和选择参与者;将领导力分散在网络公众中[21]。笔者认为档案馆应以第一种范式为主,即由档案馆从风险管控、资源纳入、众包群体等方面予协渊和适度的控制,可在众包工作发展成熟后复议第二范式,从而形成混合式管理体制。 5.1 风险管控机制 有效维护档案资料的完整性、保密性,确保档案信息资源不流失,是促进档案工作规范化、标准化的基础。由于众包个体是网络分布的虚拟个体,档案馆无法确保其保密素质的完备,便需要从本地系统着手进行风险管控。首先,要以当前馆藏为基础,根据档案资源开放范围设置有效、可信、明确、分级的访问权限,划分出允许公众访问、允许制定用户访问、不允许访问的档案信息资源,并要强化众包个体身份认证和访问控制,要求用户进行身份注册,并在每次执行众包业务时进行用户识别。其次,应该通过数据库加密、虚拟机加密、虚拟机残余消息消除、交换加密、Web应用防火墙等技术手段促进档案保护,从流程上构筑信任机制,为档案资源保驾护航。此外,可使用“版本控制”功能,帮助建立或找回之前的正确版本,以避免恶意修改和删除网页现象发生。 5.2 资源过滤机制 新建资源的有限纳入。根据上述档案类众包项目的类型,基本可归结为两大类:内容开放式众包和源代码开放式众包,项目提交成果为新建(首创或改造的)的档案信息资源和档案信息系统。新建资源能否被纳入档案馆需要经过三重漏斗,即档案信息系统根据之前设置好的映射词汇对新建资源进行合并,以及通过系统监测剔除有安全威胁的信息;专家基于专业学科背景对新建资源进行审核;大众以评论和打分情况对新建资源进行漏斗式过滤,以筛选出最优资源。此外,档案信息系统的速度、可靠性和可用性至关重要,正式纳入本地系统前必须进行负载与可用性测试,并根据用户体验作出修正和完善。 5.3 众包群体调控机制 激励机制。主要有物质激励和精神激励两种方式:物质激励是最常见的,但形式多样,如真实货币,虚拟货币、纸支票、礼品卡等,也可将付费馆藏作为回报免费向用户开放,或者提供档案馆纪念品等;精神型激励主要是增强众包个体的荣誉感,可通过用户评级的形式展开,参考群决策中赋权重评分的方法,分为专家、管理员、资深用户和一般用户等不同级别,确定所创建资源的最终评价分值并定级排序,排序高的参与者可提高等级、扩展权限,以资鼓励。 保护机制。作为发包方的档案馆为了保证信息资源的效度和信度,应对接包群体进行有限调控,最典型的是知识产权的保护,即对众包成果提供及时的保护,保护新建信息资源的安全和用户权益。信任机制。建立良好的信任机制是发包方和接包方合作与交互的基础。首先,通过档案馆众包项目审批书、众包目标的申明以及申请众包者的身份确认,建立起初步信任。其次,通过第三方平台即强化众包中介(如借助具有法律约束力的托管系统作为中介)的作用建立信任机制。再者,建立信任等级。根据用户评级确定用户权限,包括用户可享受的资源、权利以及所执行业务的核心程度。标签:众包论文; 众包模式论文; 协同软件论文; 用户研究论文; 项目组织论文; 档案分类论文; 档案管理员论文; 协同设计论文;