推行ECIP计划,实现中文图书“自动编目”,本文主要内容关键词为:编目论文,中文论文,计划论文,图书论文,ECIP论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1 “自动编目”研究现状
1.1 国内学者的探索
高文等著《数字图书馆——原理与技术实现》一书的“数字图书馆和传统图书馆主要业务活动的比较”表中,列出了“自动编目”和“自动标引”两个内容,但只是说“分类和编目这样的技术服务工作将迅速减少”,至于怎样减少以及如何做到自动处理,则语焉不详。此表引自汪冰所著《电子图书馆理论与实践研究》,汪的解释是“在以用户为中心的电子图书馆中,并且在传统馆藏已完全实现数字化或图书馆不再收藏印刷型资源的情况下,传统的分类业务工作和分类法也就失去其存在的基础。因为此时用户完全可以联机浏览目录,方便地使用各种机读索引从各个角度进行资源检索,甚至还可以浏览全文或进行全文检索,分类号似乎就没有存在的必要了。”“电子图书馆中的印本文献编目工作将在很大程度上实现网络化联机编目,由联机编目中心等机构统一完成,其他图书馆主要通过计算机网络查检所需书目记录,再通过拷贝编目的方式达到避免重复,共享编目成果的目的。”这里,第一段话讲的是分类工作可以不做了,第二段话讲的是统一编目,并不涉及“自动编目”与“自动标引”。
刘炜等著《数字图书馆引论》倒是论及“人工建立索引既慢又贵,数字图书馆中快速变化的海量信息需要另外的方法。有些元数据应该自动生成,有些可以来自专家,也可由经验较少的人士提供,也可以要求数字对象的创作者编制适当的描述性元数据,这些元数据最后提交给自动索引程序。”这里的思路是清楚的,即“自动编目”要在信息资源创作过程中实现,图书馆自身是解决不了的。但未提出具体的操作方法。
南京农业大学信息科学系利用新华社电讯稿进行“自动标引”试验,取得一定进展。此前同类工作均由试验者自行录入数据,这次试验利用原始电子文本是一特色。
1.2 美国学者的论述
WilliamY.Arms著《数字图书馆概论》一书对“自动编目”有较多论述。
首先,作者说明了建立索引的必要性。“信息检索的任务就是在馆藏中找到符合查询请求的对象。因为计算机没有足够的时间为每一个查询去扫描所有馆藏,进行足够的比较,因此计算机必须有某种形式的索引,便利系统通过查找索引条目不定期检索信息。”“很多信息发现的方法并不检索馆藏中的实际对象,而是检索对象的描述性元数据。”这里回答了分类、编目工作可以减少,甚至不做的说法。
作者接着说明:“描述性元数据通常由专业人员制作。图书馆的目录和科学索引代表着专业人士持续数十年乃至于几个世纪以来投入的巨大工作量。这一经济因素对理解当前的发展趋势至关重要。一方面,必须在上述资金投入和专门技术的基础上建立元数据;另一方面,发明既便宜又快捷的元数据制作方法具有很大的诱惑力,这可通过自动标引或提高工作水平的计算机不定期实现。”“自动标引生成的记录一般质量很差,但它们非常便宜。一个功能强大的检索系统,对补偿低质量的个体记录大有帮助。这一点可以通过万维网检索程序来证明,因为它就是自动建立的索引。虽然记录质量不高,但检索服务的成功表明索引是有用的,至少比没有好。”
作者进一步说明:“SGML和XML这样的标记语言的一个潜在用途,就是自动标引程序可利用结构标签来建立信息检索的记录。--根据结构标签,字符串可以被识别出并标注出它是什么。这样,标签提供的信息可用于区分特定类型的信息,如作者、标题或日期。”这里已清楚地说明了实现“自动编目”的做法。
1.3 美国国会图书馆的试验
美国国会图书馆从1995年实施ECIP计划,其内容即是利用结构标签方法进行“自动编目”的尝试。他们要求出版商提交按下列结构形式加注结构标签的电子文本。
〈tp〉 begiinning of title pape
〈/tp〉 end of title pape
〈sp〉 begiinning of series pape
〈/sp〉 end of series pape
〈cp〉 begiinning of copyright pape
〈/cp〉 end of copyright pape
〈toc〉 begiinning of table of contants
〈/toc〉 end of table of contants
〈ch1〉 beginning chapter 1
〈ch1〉 beginning chapter 2
〈ch1〉 beSjnning chapter 3
etc
〈/ch〉 end of last chapter
这里只是标明了书名页、丛书页、版权页、目次页和章节,在每一页的内部,当有更细致的标识。
1.4 我们所做的工作
在相当长的一段时间内,非数字与数字的信息资源将共同存在,且非数字的信息资源仍将居主流地位。“较为明智的方法是除少数的专门领域外,让数字图书馆与图书馆的传统馆藏继续共存下去,--作为社会公共机构的图书馆继续维护大量的传统馆藏资料,同时提供数字化服务。--在某些特殊领域,数字图书馆可以完全代替传统图书馆的馆藏。”
“图书馆的读者(用户)既可从书目数据库查找书刊资料线索而获得原书、原刊,也可以直接检索数字对象库,获得多媒体资料。”
因此,在数字图书馆工程建设中,需要研究的既有数字资源的“自动编目”与“自动标引”,又有非数字信息资源的“自动编目”与“自动标引”。2000年以来,我们深入分析了我国中文图书在版编目和联合编目的现状,取得的成绩与存在的问题,结合《图书书名页》和《图书在版编目数据》两项国家标准的修订,提出了在我国推进ECIP计划的构思,进而对中文图书“自动编目”的实现,进行了一系列研究与模拟操作,取得了比较可行的方法。
2 中文图书“自动编目”构想
2.1 利用“一次录入,两种产品”的原理
计算机录入排版所产生的电子数据,本来可产生两种产品。但即使在信息技术高度发展的美国,“印刷业已经使用了多年的计算机排版,但是它们的系统完全是为了印刷品的生产而组织的,--它们在应用于数字图书馆之前还需做大量的工作。”这里有历史的与技术的因素,最早较好地解决这一难题的是美国图书馆自动化专家阿弗拉姆。她设计了可变字段、可变长的数据结构,满足了一次录入,同时产生目录卡片和书目数据库两种产品的要求(当时卡片打印没有图书印刷对字号、字体的要求高)。我们应用其方法编制中文图书机读目录,还出版了一些索引/文摘刊物(同时建库),全文数据库技术基本上也是应用这一原理。
2.2 对线性文件进行结构化处理
“自动编目”的实现,主要是利用中文图书印刷版的印前电子文本,从中直接提取书目记录所需要的描述性元数据。印前电子文本是线性文件,要使之成为数据库文件,就需要进行结构化处理。有两种做法:一种是以数据库方式录入,定稿后转换为线性方式,以产生印前电子文本:一种是以线性方式录入,对有关数据元素加注结构标签,定稿后按其结构标签转换为数据库文件。已有的此类软件多采用第一种方法。
2.3 剖析图书物理结构,确定应标识的元数据
图书馆的书目记录与CIP数据,均包含著录数据与检索数据两部分内容。其中著录数据均取自文献本身,也就是书目已录的著录数据存在于该书的印前电子文本中。为此,我们必须剖析印刷版图书的物理结构,确认需要进行结构化处理的部分。
一般图书由外表、开端、正文与结尾四个部分组成。
外表部分包含:护封(包封、护书纸)、封面(封一、前封面、封皮)、封里(封二)、封底里(封三)、封底(封四、底封)、书脊、勒口。
开端部分包含:衬页、附书名页、扉页、版权页、卷首题词或作者像或其他书影、多作者名单或编辑委员会/组织委员会名单、内容提要/出版说明或编者的话/译者的话、序或作者前言、目录、图版目录、表格一览表、工具书的凡例、使用说明、图例及各类检索表。
正文部分包含:篇、章、节、目或开幕词、讲话、论文、摘录等,工具书则为条目(有时有二级甚至多级条目)。
结尾部分包含:附录、注释或名词解释、英汉词汇对照表、参考文献、索引、跋或后记。
书目记录与CIP数据主要取开端部分的内容。有时涉及结尾部分与外表部分。
2.4 规范电子数据格式,与CNMARC保持一致
印前电子文本结构标签的格式。与目前中文图书的计算机编目格式保持一致,以文化部发布的CNMARC标准为基础,按“自动编目”的特点,作适当调整。
①由于是用计算机自动处理的,关于书目记录著录的范围,一些在手工编目条件下难以做到的事,如内容分析著录,全面反映所有的责任者,增加前言、后记、作者简介等,只要安排适当结构标签,“自动编目”均可做到,而且还可自动生成篇名条目索引记录(见附例)。
附例:
我国科技电子信息资源
的开发和利用研究
中国科技信息研究所
北京大学信息管理系
北京图书馆
清华大学图书馆
中国科学院计算机网络信息中心
北京图书馆出版社
图书在版编目(CIP)数据
我国科技电子信息资源的开发和利用研究/中国科技信
息研究所等编著。-北京:北京图书馆出版社,1999.5
ISBN7-5013-1621-X
Ⅰ.我…Ⅱ.中 Ⅲ.科技情报-调查报告-中国Ⅳ.G359.21
中国版本图书馆CIP数据核字(1999)第01322号
出版发行 北京图书馆出版社(原书目文献出版社)
(100034 北京西城区文津街7号)
经销 新华书店
印刷 北京四季青印刷厂
开本 850×1168毫米 1/32
印张 10.9
字数 274(千字)
版次 1999年5月第1版 1999年5月第1次印刷
印数 1-2000
书号 ISBN 7-5013-1621-X/G·427
定价 25.00
课题组成员
朱 伟 中国科技信息研究所 所长 研究员
梁战平 中国科技信息研究所 副所长 研究员、博士生导师
董小英 北京大学信息管理系 博士、副教授
余向东 中国科学院计算机网络信息中心 博士
孙蓓欣 北京图书馆 副馆长 研究馆员
刘桂林 清华大学图书馆 馆长 教授、博士生导师
郑彦宁 中国科技信息研究所 高级工程师
吴慰慈 北京大学信息管理系 系主任 教授、博士生导师
赖茂生 北京大学信息管理系 系副主任 教授、博士生导师
姜爱蓉 清华大学图书馆 副研究员
安 宁 北京图书馆 馆员
陈昭楠 中国科技信息研究所 研究员
刘兹恒 北京大学信息管理系 副教授
朱 强 北京大学图书馆 副馆长 研究馆员
郑晓惠 清华大学图书馆 馆员
郑登理 中国科技信息研究所 研究员
乔晓东 中国科技信息研究所 高级工程师
总目录
1.课题总报告 ………………………………………………… (1)
2.分报告之一:电子信息资源开发与利用的战略意义
……………………………………………………………… (25)
3.分报告之二:国外开发利用电子信息资源的战略与
现状分析 ………………….-……………………………… (62)
4.分报告之三:我国电子信息资源开发与利用的环境分析
……………………………………………………………… (127)
5.分报告之四:对我国科技电子信息资源开发的评价
…………………………………………………………………(146)
6.分报告之五:对我国科技电子信息资源利用的评价
………………………………………………………………(195)
7.分报告之六:对我国科技电子信息资源开发利用的
实例调查 ………………………………………………… (280)
8.附录一:科技电子信息资源开发情况调查表
………………………………………………………………(337)
9.附录二:科技电子信息资源利用情况调查表
………………………………………………………………(341)
10.附录三:用户问卷调查表 ……………………………… (344)
②同理。凡文献中没有出现的内容,则计算机也不能“无中生有”。如CNMARC的1--编码信息块和6--主题分析块,印前电子文本中都是没有的。1--块除101字段可预置隐含值外,其他则不好处理,请作者和贵编填写这些字段是很难做到的。同时,在实际应用中1--块是为了识别书目记录的惟一性,还是增加检索点,并无有关说明。因此,“自动编目”可暂不产生除101字段以外的编码信息。
③为满足出版界对书目记录的要求,利于出版、发行管理系统的应用,对版权页出现的一些数据,如尺寸、印张、版次、印次、字数,需设置相应的字段;出版方面的责任者也要在7--反映;此外还要增设一些字段与子字段,以著录分析题名的其他题名信息、主题数据与分类数据;并列责任者等。
④计算机“自动编目”要求惟一性处理,难以介入“人工干预”。所以在字段、字段指示符和子字段的设置中,不宜有选择性的操作。为此,有关字段、字段指示符与子字段需作相应调整。
⑤为全面反映图书出版情况,需另行编制丛书/多卷书书目记录。由印前电子文本的有关数据构成,主要包含丛书/多卷书书名、责任者、出版说明等描述性元数据,以及丛书/多卷书的检索数据,一般不作下连。由各专著分别产生的丛书/多卷书书目记录发生重复时,由书目数据库系统控制处理。
⑥自动编目过程中难以处理规范问题,只是按印前电子文本提取,若有不符合规范要求的数据,由联机编目系统处理。
2.5 依靠作者参与,做好主题标引
许多专家进行了“自动标引”试验,尚未达到实用程度。在加强这一课题开发力度的同时,目前只能采用人工赋值方法,即请作者或责任编辑把6-块的数据加到印前电子文本中(注明为不印出字段)。作者对自己的著作是最了解的,因而能准确揭示其主题内容。尽管作者给出的主题词可能不符合图书馆规范化的要求,但从另一方面说,则更接近读者对主题的理解。书目记录审定人员可据以修正,给出规范化的主题概念,即使实现“自动标引”以后,作者提供的主题概念,仍具有参考价值,应在“自由词”字段保留。
3 推行ECIP计划实现“自动编目”
1990年7月,原国家技术监督局为推动中国图书在版编目(CIP)的实现,批准颁布了《图书书名页》国家标准(GB12450-90)和《图书在版编目数据》国家标准(GB12451-90),并由新闻出版署信息中心负责CIP的组织实施和数据审定。到2000年,进行图书在版编目的图书已达87941种,占当年图书出版总数的90%以上,这在世界各国都是少有的。国家图书馆从1986年开始应用计算机进行中文图书编目,到2000年编目量已达到65000种。
经过十多年的计算机编目实践,我国已经有了一支专业队伍,积累了宝贵的经验,在机读格式、著录规则、规范文件、分类与主题工具等方面正逐渐形成统一的文本,联机编目网络已开始运作。这是实现中文图书“自动编目”的最基本条件。
1999年,国家质量技术监督局组织修订《图书书名页》和《图书在版编目数据》两项国家标准,并于年内公布。修订后的《图书书名页》国家标准规范了书名页与附书名页的有关内容。书名页分为扉页(原称正面)和版权页(原称背面)两部分,附书名页载有丛书、多卷书、翻译书、多语种书和会议录的有关信息。修订后的《图书在版编目数据》进一步明确了著录数据和检索数据两部分内容的要求。执行修订后的两项标准,推行ECIP计划,是实现“自动编目”的契机。可请各出版单位在印前电子文本中,对《图书书名页》国家标准所规定的内容加注结构标签。并请他们对多作者专页、内容简介/出版说明、前言/后记、作者简介、目次页、封面/封底(文字部分)等同时加注结构标签。这样,在一种书的印前电子文本成型后,即可从中提取CIP所需的描述性元数据。出版单位将所获得的CIP数据连同有关的印前电子文本,一起从网上传送给新闻出版总署信息中心。信息中心不仅要审定CIP数据的内容,还要对印前电子文本是否符合《图书书名页》国家标准进行认定,从而保证两项国家标准的落实。审定后的CIP数据及印前电子文本返回出版单位,在图书印刷出版时即可产生正式的书目记录。
为使作者及出版单位的责任编辑能正确执行国家标准,使用以CNMARC为基础的结构标签和准确标引分类与主题数据,必须对有关人员进行培训。这就要准备好“ECIP工作手册”。这个手册应在网上公布,并能及时更新,便于作者及责编能随时参考。
实现“自动编目”的计算机处理程序,既可在排版软件中嵌套其功能,也可单独编写一个处理软件,具有双重转换功能(一次录入,分别产生印前电子文本和书目记录)。软件上的问题将在实施过程中不断完善。
“自动编目”的运作,可先在少数出版单位进行试验,取得经验后再全面推广。由于这一工作并不增加出版单位的负担,建成书目网络系统后,还可为出版单位带来一定的经济效益,因而会得到出版单位的支持。关键是要有好的运行体制。
我国应用计算机进行中文图书编目以来,由于条块分割体制的影响和小生产者的习惯势力,以致迄今未能建成完善的联机编目网络系统。此类涉及众多部门的事情,仅用行政协调的方法难以做好。比较可行的做法是以市场体制进行运作,组建类似OCLC(联机编目中心)和BOWKER(可供书目编制中心)一类书目组织的经济实体开展工作。在保证每个具体参与者经济利益的前提下,建成具有中国特色的书目网络系统。
“自动编目”的实现,不仅会推进我国书目网络系统跨越式发展,从落后走向世界先进行列,并且可为EBOOK的大量生产和数字图书馆建设奠定坚实的基础,将产生极大的社会效益和经济效益。因而会引起各方面的重视和投资者的兴趣,从而获得他们对邃一项目的支持。
4 “自动编目”举例
文后列出《我国科技电子信息资源的开发和利用研究》一书的书名页(扉页及版权页),多作者专页和目次页,前言(略,只在书目记录中反映)的书影,及所产生书目记录的样例。ECIP处理所用工作单及数据处理流程从略。附例还列出了由该书目记录内容分析著录派生的所含单篇文献的篇名索引记录,可用以组成“论文集与工具书篇目、条目索引”。
从附例可以看出,如此丰富内容的书目记录及自动派生所含单篇文献索引记录,是人工著录难以做到的,它对文献信息检索所起的作用,更是难以估量的。
001
010##$ a7-5013-1621-x$ dCNY25.00元
021##$ a1999-01322
1010#$ achi
2001#$ a 我国科技电子信息资源的开发和利用研究$ f中国科技信息研究所等编
210##$ a 北京$ b北京西城区文津街7号$ c北京图书馆出版社$d1999.5$ u100034 $c新华书店[经销]$ g北京四季青印刷厂
215##$ a346页$ d850×1168毫米1/32$ p10.9印张$ s274千字
219##$ a1999年5月第一版$ b1999年5月第一次印刷$ c1-2000
330##$ c信息作为与物质、能源并列的资源,其开发利用是国民经济信息化的核心,将是新一轮国际党争的焦点之一。科技信息资源是国家信息资源的重要组成部分,是基础性、战略性资源。在实施“科技兴国”发展战略、知识创新工程的历史时期,大力开发利用我国科技电子信息资源是当务之急。我国蕴藏着丰富的科技信息资源,由于f8息加工层次和水平比较低,信息的附加值没有得到充分的挖掘和利用,造成科技信息资源的严重浪费。在国家信息基础建设中,如何有效地开发利用我国科技电子信息资源,是摆在我们面前的重要课题。
本课题以调查数据为基础,以国际信息资源开发利用的大环境为背景,研究我国科技电子信息资源开发利用的现状、存在的主要问题,分析阻碍我国科技电子信息资源开发利用的主要原因,论述在市场经济和网络环境下,我国科技电子信息资源开发利用的战略方针,提出我国科技电子信息资源开发利用的对策和建议。目的是为我国科技电子信息资源开发利用的战略决策、规划、宏观管理提供决策依据,促进我国科技电子信息资源开发利用的有效发展。
本课题采用问卷调查与统计分析、比较研究和实例研究三种研究方法开展研究。问卷调查对用户、科技电子信息资源开发单位和信息服务中介进行调查。在中国科技信息研究所、北京大学、北京图书馆、清华大学和中国科学院发放印刷版《用户问卷调查表》,同时在中国科技信息研究所、北京图书馆和中国科学院计算机网络信息中心的Web主页上公布联机版《用户问卷调查表》;原国家科委科技信息司发文,对全国54家情报信息单位发放《科技电子信息资源开发情况调查表》和《科技电子信息资源利用情况调查表》,对科技电子信息资源开发单位和信息服务中介进行调查,使用社会科学院统计软件包SPSS对上述调查数据进行统计分析。实阅研究是以相似的模式,对中国科技信息研究所、北京大学图书馆、清华大学图书馆、北京图书馆和中国科学院计算机网络信息中心的科技电子信息资源开发利用情况进行重点调查分析。
通过本课题的定性定量分析研究,很多数据和结论将会对信息产业界、科技界、教育界、企业界、政府决策层有重大启迪和参考价值,对我国信息化进程起到积极的推动作用。
本课题由中国科技信息研究所牵头,北京大学信息管理系、北京图书馆、清华大学图书馆和中国科学院计算机网络信息中心参加。朱伟、梁战平、董小英完成课题总体设计;梁战平、董小英、郑彦宁完成课题总报告;陈昭楠、郑登理完成课题分报告之一;赖茂生、董小英、刘兹恒完成课题分报告之二;余向东完成课题分报告之三;郑彦宁完成课题分报告之四;郑彦宁、董小英完成课题分报告之五;姜爱蓉、安宁、余向东、朱强、郑晓惠、乔晓东完成课题分报告之六;郑彦宁设计《科技电子信息资源开发情况调查表》,董小英设计《科技电子信息资源利用情况调查表》和《用户问卷调查表》;朱伟,梁战平、吴慰慈、孙蓓欣、刘桂林、赖茂生完成所有课题报告的审稿工作。
国家发展计划委员会社会发展研究所张本波同志为本课题调查数据统计做了大量工作,在此表示感谢。
《我国科技电子信息资源的开发和利用研究》课题组
1998年12月
464#0 $ 12001#$ a课题总报告$ f朱伟.梁战早,董小英$ 1215##$ a1-24$16100#$ a科技情报$ a数字信息资源建设$ a调查报告$ a中国$ 1690##$ a G359.21
464#0 $12001#$ a电子信息资源开发与利用的战略意义$ f陈昭楠,郑理登$ v分报告之一#1215##$ a25-61 $ 16100#$ a科技情报$ a数字信息资源建设$ a调查报告$ a中国$ 1690##$ aG359.21
464#0 $ 12001#$ a国外开发利用电子信息资源的战略与现状分析$ f赖茂生,董小英,刘兹恒$ v分报告之二$ 1215##$ a62-126$ 16100#$ a科技情报$ a数字信息资源建设$ a调查报告$ a中国$ 1690##$ aG359.21
464#0 $ 12001#$ a我国电子信息资源开发与利用的环境分析$f余向东$ v分报告之三$ 1215##$ a127-145$ 16100#$ a科技情报$ a数字信息资源建设$ a调查报告$ a中国$ 1690##$ a G359.21
464#0 $ 12001#$ a对我国科技电子信息资源开发的评价$ f郑彦宁 $ v分报告之四$ 1215##$ a146-194 $ 16100#$ a科技情报$ a数字信息资源建设$ a调查报告$ a中国$ 1690##$ aG359.21
464#0 $ 12001#$ a对我国科技电子信息资源利用的评价$ f郑彦宁,董小英$ v分报告之五$ 1215##$ a195-279 $ 16100#$ a科技情报$ a数字信息资源建设$ a调查报告$ a中国$ 1690##$ a G359.21
464#0 $ 12001#$ a对我国科技电子信息资源开发利用的实例调查$ f姜爱蓉,安宁,余向东,朱强,郑晓惠$ v分报告之六$ e6$ 1215##$ a280-336$ 16100#$ a科技情况$ a数字信息资源建设$ a调查报告$ a中国$ 1690##$ aG359.21
464#0 $ 12001#$ a科技电子信息资源开发情况调查表$ f郑彦宁$ v附录一$ 1215##$ a337-340 $ 16100#$ a科技情报$ a数字信息资源建设$ a调查报告$ a中国$ 1690##$ aG359.21
464#$ 12001#S a科技电子信息资源利用情况调查$ f董小英$ v附录二$ 1215##$ a341-343$ 16100#$ a科技情报$ a数字信息资源建设$ a调查报告$ a中国$ 1690##$ aG359.21
464#0$ 12001#$ a用户问卷调查表$ f董小英$ v附录三$ 1215##$ a344-346$ 16100#$ a科技情报$ a数字信息资源建设$ a调查报告$ a中国$ 1690##$ aG359.21
6100#$ a科技情报$ a数字信息资源建设$ a数字图书馆$ a因特网$ a调查报告$ a中国
620##$ b北京
690##$ aG359.21
690##$ aG250.76
690##$ aTP393
701#0$ a朱伟$ c中国科技信息研究所所长$ c研究员$ 4课题组组长
701#0$ a梁战平$ c中国科技信息研究所副所长$ c研究员$ c博士生导师$ 4课题组成员
701#0$ a董小英$ c北京大学信息管理系博士$ c副教授$ 4课题组成员
701#0$ a余向东$ c中国科学院计算机网络信息中心$ c博士$ 4课题组成员
701#0$ a孙蓓欣$ c北京图书馆副馆长$ c研究馆员$ 4课题组成员
701#0$ a刘桂林$ c清华大学图书馆馆长$ c教授$ c博士生导师 $ 4课题组成员
701#0$ a郑彦宁$ c中国科技信息研究所高级工程师$ 4课题组成员
701#0$ a昊慰慈$ c北京大学信息管理系系主任$ c教授$ c博士生导师$ 4课题组成员
701#0$ a赖茂生$ c北京大学信息管理系系副主任$ c教授$ c博士生导师$ 4课题组成员
701#0$ a姜爱蓉$ c清华大学图书馆副研究员$ 4课题组成员
701#0$ a安宁$ c北京图书馆馆员$ 4课题组成员
701#0$ a陈昭楠$ c中国科技信息研究所研究员$ 4课题组成员
701#0$ a刘兹恒$ c北京大学信息管理系副教授$ 4课题组成员
701#0$ a朱强$ c北京大学图书馆副馆长$ c研究馆员$ 4课题组成员
701#0$ a郑晓惠$ c清华大学图书馆馆员$ 4课题组成员701#O$ a郑登理$ c中国科技信息研究所研究员$ 4课题组成员
701#0$ a乔晓东$ c中国科技信息研究所高级工程师$ 4课题组成员
701#0$ a王燕来$ 4责任编辑
701#0$ a边靖$ 4封面设计
71102$ a中国科技信息研究所$ 4编著
71102$ a北京大学信息管理系$ 4编著
71102$ a北京图书馆$ 4编著
71102$ a清华大学图书馆$ 4编著
71102$ a中国科学院计算机网络信息中心$ 4编著
标签:科技论文; 中国科技信息论文; 文本分类论文; 电子信息论文; 文本分析论文; 数据检索论文; 元数据论文; 图书馆论文; 电子论文; 文献检索论文;