基于工作流的快速情报生产线系统研究
● 谭 晓,吴晨生
(北京市科学技术情报研究所,北京 100044)
摘 要: [目的/意义]在科研范式转变、跨学科交流频繁、信息技术迅猛发展的背景下,科技情报研究机构面临着机遇和挑战。文章提出情报生产线系统研究,应对在大数据时代科技情报工作遇到的问题及新时代提出的需求。[方法/过程]文章提出了情报生产线思想,首先分析了当前环境下情报生产线平台解决的问题,其次对情报研究任务做了总结分析,最后提出了统一的逻辑框架下生产线服务系统的业务流程和架构思路。[结果/结论]分析总结了情报研究流程、任务、内容,面向情报生产线欲解决的问题,提出了统一的逻辑框架下生产线服务系统的业务流程和建设思路。以期能为促进科研机构提高情报分析质量和效率提供新支撑。
关键词: 面向服务的体系结构;情报生产线;情报研究;工作流
信息资源与新材料、新能源成为并列的人类未来利用的三大重要战略资源。信息资源的生产及应用,使得数字世界与现实世界逐步耦合、共同发展。同时,科学研究向数据密集型科学第四范式的转变,越来越强调智能在分析中的作用,学科领域的深入交叉融合及社会发展、经济发展与科技发展一体化程度的增强,科技创新从单一领域向全领域分析的方向发展[1],需要从多视角分析:空间信息分析、技术、方法上的融合,同时将情报及研究内容置于更大的情境下考虑。业务问题呈现出复杂化、多维化、关联化、实时化的特点。在科研范式转变、跨学科交流频繁、信息技术发展等因素的影响下,量化现象日渐突出。如何把握住自身的优势,并抓住机会有所拓展,是科技情报研究机构在大数据时代需要思考的问题。
1 科技情报工作发展中的问题及情报生产线的提出
目前科技情报工作在发展过程中面临着以下几个问题:数据陈旧单一,大多数科技情报“最新动态”报告,都是根据历史数据进行撰写,而科技情报的价值在于通过获取多维科技发展前沿的动态而体现的;情报生产的时效性不强,如果情报生产速度与时效性需求严重“脱节”,则会导致用户与情报生产者“脱节”;科技领域覆盖能力与情报需求有差距,随着学科领域交叉汇聚的增强,用户要求情报工作者提供的科技情报产品会覆盖一个乃至几个领域,目前科技工作者及科技数据覆盖的领域范围与需求之间存在很大的差距[2]。
式中:xw,yw分别为终端执行器x轴和y轴坐标;L1和L2为机械手连杆长度;Ox和Oy分别为第1个关节x轴和y轴方向的偏移量.
为了更好地提高情报分析质量和效率,北京市科学技术情报研究所引入工业界和软件业中“生产线”的基本思想,改进覆盖范围,提高工作效率,使情报生产从个体智慧向体系智慧以及高端能力转变,在技术发展及需求迅速变化的新时代,提出情报产品响应时间的概念,在大数据及大数据工具的支撑下,面向用户的不同需求,在精准地获取所需数据、动态信息及最新情报,跟踪科技前沿,梳理发展脉络,把握关键问题,分析竞争格局与发展态势,发现科学技术突破点及新机会,进行决策预警及支持,战略布局,占领竞争优势等分析内容中,动态构建工作流,生产信息情报产品。使信息情报产品像工业产品一样通过科学化、标准化、规范化的方式,面向不同客户的需求,进行情报产品生产。
在本文中,工作流(Workflow)是指数据分析的算法/规则,传统的程序语言中,需要应用一系列的指令和函数,在情报生产线平台上,应用已经封装好的插件作为功能,工作流作为支配功能步骤或顺序的分析过程。一个复杂的问题可以被分解为简单的部分,这些部分被组织进一个执行工作流中,并为某个确切任务以适当方式进行融合,以加快任务的完成。
情报生产线平台构建的依据是以情报生产线为基础的情报生产体系,主要解决以下几个问题:
局部现浇桥墩实际上是拼装桥墩与现浇桥墩两种形式的结合,墩身主体采用预制节段桥墩,在接缝连接处采用现浇混凝土进行连接.本文选取了普通连接、现浇素混凝土、耗能钢筋连接及带耗能钢筋的现浇混凝土连接4种构造形式.结构形式如图2所示.
1) 解决随着当前问题复杂指数的提高导致的个体不能完成情报任务的窘境。情报战略问题的解决本身需要学科交叉融合,一人之力不能覆盖所需领域学科知识,同时,知识环境的迅速发展,使得情报内容走向富媒体,知识内容走向关联数据化,情报产品走向智能化[3]。
3)解决跨部门之间的工作流转接问题。情报生产线覆盖情报生产的全流程(从情报采集到情报产品产出),情报产品由各部门协同创作完成,作为复杂情报产品,具有解决问题的复杂性、探讨性、不可替代性,参与任务的各部门需要有效且实时共享数据、知识、结果,强调对多领域学科的情报获取效率、功能复用、知识共享,这是情报生产线构建的难点。
窗宽自适应形心修正算法兼容了饱和波形和非饱和波形的处理,在处理非饱和波形时,其发挥传统形心算法的优势获取形心位置,在处理饱和波形时,能够根据回波波形的饱和程度进行窗宽自调整以及中位数修正,提高算法精度.
2)解决传统情报分析中的异种孤立工具、方法、数据的离散、孤岛现象,以及人工将各部分结果进行集成的问题。情报问题的复杂性,要求从全源情报进行多角度分析,并在工作流程中对多个步骤、多个环节、多个结果形成动态交互,进行自动综合融汇,最终形成决策依据,这是情报生产线的基础。
4)解决前期机构积累与后期创新的集成性、复用性问题。科研工作工程中,累积的工具、方法的异构性,使得集成性较差,为避免重复建设、促进复用和共享,需要一个统一的集成分析流程及服务调用框架。
2 基于工作流快速情报生产线的建设思路
情报采集:针对互联网、学术论文、专利、标准、商业数据等的结构化、半结构化、非结构化数据,依据需求进行智能采集跟踪;构建战略性新兴产业若干具体领域的中外文语料库;研发文本和语音信息中外文自助互译系统;研发网络图像/音视频内容识别跟踪系统,等等。
科技情报研究出现数据为中心、以数据为驱动的特征:科研情境与范式的演进变革促使为科技发展提供决策支撑的科技情报研究工作发生变化,面向全息数据的数据挖掘计算以及建设科技发展态势监测分析与研究系统的计算型情报研究,在以大数据驱动、以“云服务”为手段的科学范式的驱动下,科技创新情报研究将围绕在更为海量、零散、原始、复杂数据中高效提取高质量信息进行快速关联、重构、组织、分析,得出满足用户决策需求的解决方案。
监督对象的复杂性和多变性在加大。纪检监督是对人的监督,单究农商行而言,受原有体制、机制等历史因素制约,人员结构相对复杂,思想观念相对保守,合规意识相对欠缺,纪检监察部门在履行监督职责过程中受到的干扰和阻力明显,由此也增加了监督难度。
2 .1 情报研究流程及分析内容
1)情报从侧重技术领域兼顾政府决策走向战略技术领域与战略决策两大分支。情报研究包含了几个关键因素:历史—科技发展规律、现状—态势、未来—趋势、预测预警,这些都成为决策的依据。战略技术是通过采集、分析、发布的方式,提供战略决策环境事实及趋势的有关情报,其重点包括技术热点、技术前沿、技术空白点、替代技术、颠覆性技术、新兴技术、技术影响等[5];情报研究在战略决策中的作用是揭示与决策对象关联的事实、机理、事实间的关系以及对战略决策的影响,识别出机会和风险。战略决策基于情报研究的成果,综合决策需求、目标及资源条件,做出选择,形成实施战略。
情报研究面对错综复杂的决策任务,那种依赖孤立的方法、工具、数据难以适应科技决策本身对应的复杂性和集成性。张志强研究员指出:科学情报机构需要构建适应数据密集型科学范式需求的新型范式,着力开展专业型、计算型、战略型、政策型和方法型“五型融合”的科技情报研究新范式[6]。
2)情报研究是一个流程性的工作,后一步工作的准确性依赖于前一步工作的数据的完备性、权威性以及方法的科学性,每一个步骤都伴随着评价、校正的过程。
如图1所示,情报研究流程包括情报需求的明确、情报采集、情报加工存储、情报检索及分析、情报判读以及情报共享、展示和应用等多个环节在内的价值链条,这一链条与科技情报工作相吻合;大数据、云计算、移动互联的蓬勃发展为近20年来备受挑战的情报学带来了新的发展机遇,为情报工作提供了新的技术手段。
弥漫的酒香与现代科技气息在泸州交织生长,也让这座城市焕然一新。更令人惊喜的是,在泸州聚集了一批“隐形产业冠军”企业。
大数据时代,情报服务的个性化、快速化对情报分析平台提出了更高的要求,情报生产与人工智能的关联越来越紧密。①融合人工智能的方法是时代必然,也是实现情报学研究跨越式发展的有效途径。②实现情报处理全过程的自动化和智能化是以提供技术支持为基础。③人工智能的应用拓宽情报分析的深度和广度。④拓宽情报服务范围,完善情报服务的内容和形式,大大提高服务的主动性和质量。情报3.0(情报智能服务)的提出[4],是为了让情报工作能够适应大数据环境,从“信息服务”“知识服务”过渡到“智能服务”。大数据背景下,在情报3.0情报工作体系中,情报来源从传统数据库情报源(论文、专利、标准等数据库)变为互联网,对于海量数据的存储变为高效能的云存储;多源、多维数据复杂的处理、分析和运算由云计算平台并行分析计算的框架提供;算法、工具及工作流提供了计算的步骤和模型,将情报工作者从重复性工作中脱离出来,投入到规律发现、规则制定、专业解读、决策验证等更为有意义的工作中。我们已进入数据决策时代。
情报加工存储环节:智能信息识别与标引系统;面向多结构数据的数据库及其管理;构建面向全源数据的信息资源管理与应用研究平台。
1.本刊现已采用网上投稿,请登录http://glgz.chinajournal.net.cn注册投稿。
情报检索及分析挖掘:综合运用深度学习、神经网络、图计算等技术手段,深入进行大数据挖掘;进行行业企业专利分析与预警;基于人文计算、信息融合、认知计算等的可视化信息研究;构建简报、报告智能生成系统,面向领域人员的知识发现系统;研发面向国家和地区发展战略的决策支持平台。
系统利用工作流,将情报研究中的流程以及各步骤操作间的规则进行归纳和描述,以优化工作流程、业务过程控制以及业务流程的柔性。如图2所示,在情报研究流程中,各流程及服务间的消息、文档以及任务交互都依赖工作流。系统中工作流模块主要完成工作流程定义、工作流程实例化及执行过程模型、过程的启动和终止、与外部资源的交互、工作流相关数据的维护。
情报判读:面向已有信息,洞察和发现隐藏在信息背后的规律、关联、影响等,研究基于专家经验进行决策的智能系统。
情报共享、发布和应用环节:研发基于新媒体、移动互联、虚拟现实技术的情报发布系统;研发国际高新技术转移服务平台;研发面向用户的智能需求分析与任务部署系统,构建科技情报一站式服务平台。
图1 情报研究流程
翻转后的课堂教学要在课堂上完成习惯的反馈.学生可以在小组内部分享解题思路,也可以由小组选出代表给全班同学分享解题思路,也可以师生之间进行交流.
图2 流程执行过程
3)面向领域的情报分析研究,以解决关键问题和突出矛盾为导向,如表1所示,情报分析研究内容包括动态研究、技术预见/预测、热点研究、预警研究、预测研究、态势研究、评价研究以及对策研究,研究方法和技术包括科学计量、社会网络分析、专利计算分析、文本挖掘、可视化等方法技术。
在上述情报研究内容中,各种分析方法所依赖的底层技术(如图3所示,分句、分词、词性标注、词形还原、特征识别、特征提取、关系抽取、相似度计算、模型计算)以及不同分析内容可能共用相同的分析方法,存在大量的可重用性问题,重用的内涵包括了提高质量和效率两个方面。这些共性技术的要求是情报生产体系的底层技术支撑,也是方法工具的主攻方向。
用户是图书馆阅读推广活动的主要对象,对用户阅读的目的、行为、需求进行分析是提高阅读推广活动实际效果的基本条件。只有真正将“以用户为中心”的理念贯穿在阅读推广活动中,通过多种方式分析充分了解用户的阅读诉求,策划阅读推广活动才能得到用户的支持与积极响应[2]。大数据等信息技术的发展为掌握用户阅读行为与需求提供了技术保障。
2 .2 情报生产线中服务集成思路
在解决不同问题的分析或者同一问题的不同环节中,这些分析因其目的不同、研究选择的路径不同、依赖方法和工具的不同,产生不同的结果数据,通过不同方式进行组织和展示。目前存在着多种方法和工具,对应于不同的研究内容和环节的问题、数据、指标、结果以及表现形式,具有不同的处理方式,需要在统一的逻辑框架中进行组织和表达。
基于情报本质的交互与协同是核心,快速情报生产线平台将向研究人员和用户提供一个无缝、关联的信息空间。希望向用户提供一步检索、统一存储、透明计算,更大范围内发现和使用情报资源,有一个可移植、互操作的框架。
面向服务的体系结构(Service-Oriented Architecture,SOA)于1996年由Garter团队明确提出,认为:新一代信息系统关键在于支持灵活、快速的业务变化。SOA涵盖服务的整个生命周期:建模、开发、整合、部署、运行和管理[10]。基于SOA构建系统一方面适应变化的灵活性,另一方面,由于其松耦合的理念,在一个服务内部结构发生变化时不影响其他的服务。但是SOA缺少模块化开发过程标准化的实现机制、缺少环境间的互操作性、缺乏将SOA技术部署于嵌入式系统之上的能力[11-12]。SOA是宏观角度上的程序模块化架构描述,开放服务网关协议实现了SOA理念,从可操作的层面执行了SOA的思想。
表1 情报分析研究的内容
图3 情报研究内容分析工作流程
开放服务网关协议(Open Service Gateway Initiative,OSGi)是面向java的动态模块化系统,提供了一种面向服务的组件开发框架,用来拆分复杂业务逻辑、功能插件动态热插拔等问题[13]。OSGi具有面向服务的组件模型(Service-oriented Component Model)的核心设计思想,体现在Bundle(服务插件对应一个Bundle),这是OSGi系统部署的唯一形式,Bundle是包含jar包的文件,包含了Class文件及其他资源文件,在文件中声明自己包含了哪些jar包,包含相同jar包的Bundle具有依赖关系并可进行jar包共享。Bundle的构建决定着业务的实现、平台开发代码的规范及整体业务需求模型的构建[14]。目前,随着研究的不断深入,OSGi框架应用到军事、物联网、医疗、智慧城市建设等系统及平台。本文利用OSGi规范及框架进行业务逻辑拆分、工作流转接配置、工具方法集成。
图4 统一的逻辑框架下的工作流程
在工作流、任务流、资源与成本分配的驱动下,搭建基于标准、分布式、灵活的架构,解决机构现有系统间的整合、开发复用、提供不同类型有针对性的服务,适应需求的灵活多变且与新技术同步。基于此,在SOA理念下,引入OSGi开放标准及框架,设计基于Web服务、支持异构、动态模块化、柔性工作流,实现情报生产的集约化、智能化及服务的无缝链接。
情报研究全领域分析所需全源化、跨媒体数据,已经达到体量的规模化,要求孤岛数据、探究困难数据的集中、融汇;分析内容由外部特征统计深入到内容、语义、情感等深度解析,是以计算密集型为基础的AI密集型任务。大数据架构的分布式计算与存储能力仅是解决这个问题的基本条件。
在统一的逻辑框架下生产线服务系统的基本业务流程如图4所述。
以用户需求为导向,将需求分解,确定研究内容,针对研究内容,明确数据源(如果数据存在,则直接在基础数据库中进行下一步的分析操作;若数据不存在,则需要进行数据的收集和存储),依据确定的服务内容建立数据分析的指标体系,分析数据(对文本进行知识单元、关系、属性的抽取,并进行初步类似相似性等的计算,形成中间结果),在此基础上进行深入分析(基于初步计算形成的中间结果,以及研究内容进行进一步的深度分析,包括知识单元关系的叠加融合、知识单元/关系类型的识别、重要性的排序、语义计算等),为了更形象直观地进行分析,可进行可视化分析场景(分析结果进行可视化),增加交互分析(可进行依据某维度的统计分析、热点关注、主题识别及解读等);将分析结果进行存储嵌入,对结果的解读分析可以利用专家的领域经验进行验证。这些流程的流转均在各类数据库的支撑下进行的,包括流程库、组件库、知识库、算法模型库、案例库、专家库等。
工业4.0、智能制造等概念在行业内掀起了很大的热潮,未来的市场将以消费者为主,定制化、智能化和专业化将成为发展趋势,企业如果不能持续创新,便难逃被淘汰的命运。当前智能制造成为行业热点词,面对如此的发展趋势,有人大胆创新,有人望而止步。而台达作为一家历史悠久的企业,能够做到从外部趋势来审视企业的发展规划,不断的研发创新,逐步打造出成功的企业品牌。2018年11月12日,由全球电源管理与散热解决方案提供商台达组织,以“打造智慧城市样本,助力企业转型升级”为主题的案例探访活动在武汉正式启动,跟随台达的脚步,体会企业的成功之道。
3 结束语
科学研究范式的转变,学科领域的深入交叉融合及社会发展、经济发展与科技发展一体化程度的增强,使得科技创新从单一领域向全领域分析的方向发展,在情报研究中越来越强调智能化的作用。本文提出了情报生产线思想,分析总结了情报研究流程、任务、内容,面向情报生产线欲解决的问题,提出了统一的逻辑框架下生产线服务系统的业务流程和建设思路。以期能为促进科研机构提高情报分析质量和效率提供新支撑。
参考文献
[1] 李广建,杨林.大数据视角下的情报研究与情报研究技术[J].图书与情报,2012(6):1-8.
[2] 吴琼,吴晨生,刘如,刘彦君.情报3.0思路下的情报工作体系建设研究[J].情报理论与实践,2018,41(11):34-37.
[3] 张晓林.颠覆性变革与后图书馆时代——推动知识服务的供给侧结构改革[J].中国图书馆学报,2018,44(1):4-16.
[4] 吴晨生,李辉,付宏,张惠娜,侯元元.情报服务迈向3.0时代[J].情报理论与实践,2015,38(9):1-7.
[5] 郑彦宁,郑佳.战略语境下企业情报服务工作的探讨[J].情报学报,2017,36(12):1211-1215.
[6] 张志强.论科技情报研究新范式[J].情报学报,2012,31(8):788-797.
[7] 金俣昕.突发事件预警的情报监测与分析[D].南京:南京大学,2011.
[8] 李泽霞,刘小平,黄龙光,等.基于领域态势分析法的技术研发分析——以核材料技术为例[J].图书情报工作,2013,57(24):90-94.
[9] 谭宗颖.学科战略情报研究方法与实践[J].图书情报工作,2006,50(5):14-18.
[10] 毛新生.SOA原理、方法、实践[M].北京:电子工业出版社.
[11] 白浩平.基于OSGI的SOA服务集成技术研究与实现[D].北京:北京邮电大学,2009.
[12] 佘俊,钟保强,高鹏.基于OSGi的SOA应用架构构建模块化的企业应用平台研究与实现[J].自动化与仪器仪表,2016(6):156-157,160.
[13] 方安,吴思竹,洪娜,钱力,王颖,胡佳慧.科技知识组织体系(STKOS)相关工具集成服务系统的设计与实现[J].现代图书情报技术,2015(3):92-100.
[14] 钱力,张晓林,李春旺,王小梅,杨立英,陈挺,张智雄.利用OSGi的科技情报分析集成服务架构研究与应用[J].现代图书情报技术,2014(12):62-70.
Research on Rapid Intelligence Production Line System Based on Workflow
Abstract :[Purpose /significance] In the context of paradigm change,frequent interdisciplinary communication and rapid development of information technology,sci-tech intelligence research institutions are faced with opportunities and challenges.This paper puts forward the research on the intelligence production line system to deal with the problems of scientific and technological intelligence work in the era of big data and the requirements of the new era.[Method/process] This paper puts forward the idea of intelligence production line.Firstly,it analyzes the problems solved by the intelligence production line platform under the current environment.Secondly,it summarizes and analyzes the intelligence research tasks.Finally,the business process and architecture of the production line service system under the unified logic framework are proposed.[Result/conclusion] This paper analyzes and summarizes the process,task and content of the intelligence research,and puts forward the business process and construction idea of the service system of the production line under the unified logic framework.It is expected to provide new support for scientific research institutions to improve the quality and efficiency of intelligence analysis.
Keywords : SOA;intelligent production line;intelligence research;workflow
DOI: 10.16353/j.cnki.1000-7490.2019.11.007
作者简介: 谭晓 (通讯作者),女,1983年生,博士,助理研究员。研究方向:战略情报、科学计量、文本挖掘。吴晨生 ,男,1967年生,博士,研究员。研究方向:情报学,计算机技术。
作者贡献声明: 谭晓 ,提出文章思路,统筹文章框架,文章撰写。吴晨生 ,修改思路及框架。
录用日期: 2019-05-07
标签:面向服务的体系结构论文; 情报生产线论文; 情报研究论文; 工作流论文; 北京市科学技术情报研究所论文;