吉林省科技决策信息服务平台建设研究论文

吉林省科技决策信息服务平台建设研究

刘 杨 吉林省科学技术信息研究所

摘要: 当前,随着政府职能由管理向服务转变,各级政府都迫切地需要提升服务绩效,提高科学决策能力和水平。吉林省科技厅在科研管理与科学决策过程中,客观上需要科学方法、科技数据作为支撑和保障,并且,如何协调海量基础数据和省厅有限的人力资源之间的矛盾,也是当前亟待解决的问题。吉林省科技决策信息服务平台的建设,旨在能够更加有效的实现为我省科技厅各处室及相关领导提供即时而有力的决策支撑。平台将对基础数据资源进行整合、分析及运用,形成动态及时的科技决策支持,促进决策科学化。

关键词: 科技决策;数据分析;数据分类;个性化推送

前言

当前,随着政府职能由管理向服务转变,各级政府都迫切地需要提升服务绩效,提高科学决策能力和水平。吉林省科技厅在科研管理与科学决策过程中,客观上需要科学方法、科技数据作为支撑和保障,并且,如何协调海量基础数据和吉林省科技厅有限的人力资源之间的矛盾,也是当前亟待解决的问题。

例如,教师在给学生讲解《鲸》的课文内容时,教师可以为学生制作多媒体动画,让学生欣赏鲸鱼的进化过程,了解更多的科学知识。教师再引导学生学习鲸鱼不是鱼的原因,启发学生进行学习和思考。然后,教师可以让学生简单概括鲸鱼的特点,然后再为学生拟定标题,让学生练习写科普类的作文,从而发展学生的科学修养,锻炼学生的写作能力。

一、吉林省科技决策信息服务平台建设的总体目标

现如今,随着社会经济的发展与科学技术的进步,在制定政策与战略的过程中政府会面临许多复杂而重大的决策,在各级政府的议事日程中越来越重视决策的民主化、科学化。然而,政府部门只有有限的精力与人力,单靠自身的力量很难做出正确的决策,为此必须依赖专业信息化系统的支持。通常情况下,人们为达到某一目的会开展有意识、有选择的行动,这就是所谓的决策,也是领导者所具有的基本职能,决策过程主要是收集、汇总分析信息的过程,为此决策支持信息服务能够在组织中对所提供的相关信息进行描述,以此便于就某个特定问题或需求来帮助决策者做出科学的决定,以此能够促进决策规范性、科学性活动的显著提高。政府决策信息支撑体系的存在可以提供多领域智力支持咨询系统来便于政府做出正确的决策,可保证政府对多学科知识进行广泛的利用,将其本身所具有的智慧作用充分发挥出来,然后根据合理程序、先进技术手段来进行更好的决策。在研究面向政府所做出的决策时,实现了对集体智慧的充分利用,可将组织智商充分发挥出来,以此可提供一定科学的依据来更好的开展组织管理,在具体决策过程中可对决策信息支持体系的研究成果进行充分吸收,以此可获得一定科学依据,在此基础上可保证评估的科学性,从而有助于决策失误的极大减少。

吉林省科技决策信息服务平台,对互联网非结构化数据及吉林省科技厅关注的重点领域基础数据进行抓取和抽取,统一管理,并进行文本分析和数据挖掘。从海量的科技信息及其他基础信息中获取科技发展相关走势及机构人才策略,为吉林省科技厅相关部门的科技发展战略决策提供支撑。

决策支持系统在一定程度上可帮助决策者实现对现有数据、模型、知识的充分应用,在应用计算机系统时可采用人机交互方式做出非结构化决策。

二、吉林省科技决策信息服务平台的架构设计

1.平台的框架开发步骤

由于我们所采集的数据,主要是文本数据,这里只采用文本数据的分析方法。

2.平台构建规划示意图(见图1)

三、吉林省科技决策信息服务平台的主要研究方法和技术路线

1.用户分析模块

图1 吉林省科技决策信息服务平台架构设计图

数据分析。这里采用基于内容的分析法[6],对文本数据进行分析。采用TF-IDF[7]方法提取文本数据的关键词信息并计算每篇文本的各个关键词对应的权重。TF-IDF 是一种统计方法,用以评估一个字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。通过TF-IDF 算法可以提取出每篇文本对应的关键词以及权重,便于后续使用。

2.信息抓取和抽取模块

互联网科技资讯数据抓取。通过爬虫工具,抓取新闻网页地址,即统一资源定位符URL。下载新闻标题及新闻内容,并将新闻存储到数据库新闻表中。我们自有的吉林省区域创新采集系统及目前流行的八爪鱼等开源抓取软件,均可以为信息抓取工作做有力的技术支撑。

分词处理。对于爬取和抽取的数据,经过数据清洗和转换后,若进行进一步的分析,需首先进行分词处理。分词就是将连续的字序列按照一定的规范重新组合成词序列的过程。分词之后,去掉动词、介词、形容词等停用词,只保留名词进行后续的数据分析。目前比较常用的开源分词系统有jieba[3]、SnowNLP[4]、NLPIR[5]

3.数据清洗和转换模块

公司制改造后,维护和谐稳定任务严峻,主要体现在3个方面:一是社区事务虽然已经移交,但是农场失地职工长期以来生活在这块土地上,他们对农场有很深的情结,形成了“一有事情就找农场”的思维定势。二是社区管理人员认为是农场把他们推给地方,但是地方又迟迟未给他们合理的编制,因而心有不满。三是要在规定时间内完成下属亏损企业混凝土公司的关停,涉及到60多名在职国有企业员工的解聘与清退。

数据转换。对于数据转换工作,需进行数据一致性检验及进一步的数据清洗。根据实现方式的不同,可以区分为使用数据库存储过程转换和使用高级语言转换。具体情况具体分析。

目前,各种类型的编码器广泛用于测控、机床、工业机器人及其他许多技术领域。对编码器测量精度和分辨率的要求不断提高,促进了编码器设计技术的改进和发展。本文阐述了编码器的原理和分类,并分析了编码器在机床、自动化控制、新能源开发等领域的应用现状,最后探讨了编码器小型化、智能化的发展趋势。未来,将不断研制出更多的新型编码器,编码器的应用领域将更加广泛,其工作的可靠性和精度也将不断提高。本文对编码器的工作原理以及应用现状等进行具体论述,并对其未来发展趋势进行了展望。

数据清洗。从互联网中爬取的数据以及从已有数据库中抽取的数据,都存在数据残缺、数据错误和数据重复的问题,需进行数据一致性检验及清洗工作。数据清洗工作,可通过定义一定的规则在数据源建立之初,将脏数据过滤掉。

4.数据分析模块

首先从分析用户需求入手,建立逻辑框架,然后形成物理框架的思路和方法。可以将吉林省科技决策信息服务平台的开发步骤归结为6 步:(1)确定系统的服务主体;(2)明确系统的用户需求;(3)根据用户需求确定系统设计方案;(4)构建系统逻辑框架;(5)构建系统的物理框架。

项目、机构、专家人才、政策法规、专利、成果等信息抽取将在我所的吉林省科技资源数据库以及维普的智立方知识服务平台基础上进行。同时,采用ETL(Extract-Transform-Load)[2]工具,批量抽取数据。

建立用户兴趣图谱[1]。通过走访调查和资料搜集的方式,了解吉林省科技厅各个处室的职责职能,了解其所关注的重点领域和重点方向,按各个处室的实际需求,建立各个处室的兴趣图谱。建立吉林省科技厅各处室兴趣关键字列表。针对不同处室感兴趣的信息不同,首先要对各个处室感兴趣的信息进行自定义,并按关注程度不同赋予一定的权值。

5.数据分类模块

对于所采集到的海量数据,进行数据清洗、转换及分析处理后,将进一步按照我省科技厅各个处室的实际需要对数据进行分类。

造模第12周处死大鼠时,A、B、C组大鼠肝脏湿重、肝脏指数低于模型组,差异有统计学意义(P <0.05),见表2。

6.数据个性化推送模块

针对我省科技厅不同处室,设置不同的角色,根据各个处室角色对应的数据分类模块的个性化分类结果,来推送相关的数据信息。

师:三到五自然段写生命力,老师数了一下,全文一共645个字,他花300多字来写它旺盛的生命力。看得到的略写,不易看到的详写。这就是作者的高明之处,这里通过这个“更”来有所侧重。我们再读读这句话。

四、结语

吉林省科技决策信息服务平台的建设,将自动对科技信息、政策法规、机构、专家人才等基础科技数据进行抓取及智能分析,并将分析结果进行展现。这将极大地节约人力资源成本,提升数据分析准确率和效率,并解决科技信息数据更新不及时问题。进而为吉林省科技厅相关部门的科技发展战略决策提供支撑。

参考文献:

[1]国琳,左万利.基于兴趣图谱的用户兴趣分布分析及专家发现[J].电子学报,2015(8):1561-1567-38.

[2]https://baike.baidu.com/item/ETL/1251949?fr=aladdin.

[3]邢彪,根绒切机多吉.基于jieba 分词搜索与SSM 框架的电子商城购物系统[J].信息与电脑:理论版,2018(7):104-108.

[4]https://pypi.org/project/snownlp/.

[5]http://ictclas.nlpir.org/.

[6]刘秀玲,谢富纪,王海花.中央政府层面的区域创新发展政策分析——基于内容分析法[J].2019(5):87-97.

[7]陈栋.基于改进TFIDF 的混合模型文本分类方法研究[D].华中师范大学,2016.

中图分类号: F224

文献识别码: A

文章编号: 1001-828X(2019)027-0485-02

作者简介: 刘 杨(1982-),女,汉族,吉林长春人,硕士研究生,研究实习员,主要从事数据分析及应用研究。

标签:;  ;  ;  ;  ;  

吉林省科技决策信息服务平台建设研究论文
下载Doc文档

猜你喜欢