探析文献期刊数据库的检索及应用策略
如何运用文献期刊数据库检索出相关文献,正确地利用检索策略是非常重要的。检索策略是计算机文献检索中必要的方法和步骤,目的在于查全、查准数据库中的专题文献。 因此,它是决定检索效果的关键。在明确检索课题和检索目的后,合理选择检索途径和检索项,将检索课题转换为逻辑表达式(提问式),计算机检索系统根据表达式规定的检索词之间的逻辑关系进行匹配检索,命中的输出即为检索结果。通过对近年来计算机科学、人工智能、专利文献加工等领域的发展进行总结,从多语言混合检索、分类检索、语义检索、图像检索以及辅助技术五个方面介绍专利文献计算机检索技术的最新发展。文献期刊数据库具有兼容性好、检索入口多、操作简便、界面友好、检索速度快、功能强等特点,它可通过主题词、分类号、著者、篇名、刊名等途径进行检索,并可利用检索策略进行逻辑组配检索。其辅助功能有:同义词表查询、检索年代限制、浏览(显示分类号及篇名)、显示(显示分类号、著者、篇名、主题词、出处、文摘)等。主题词采用半受控标引方式,即根据《汉语主题词表》进行标引,当《汉语主题词表》内没有相应的主题词时,直接用自由词作标引,这种情况占有相当数量。同义词表查询是文献期刊数据库所特有的功能,当用户在检索某一关键词时,可通过自动运行机内同义词表,把意义相同而表达方式不同的词一并检索出来。篇名检索则可依据篇名进行全字段扫描检索,将输入的词与篇名逐一进行比较,若与篇名中的某词相符则为命中。
针对文献期刊数据库的特点,在文献检索过程中,制定合理的检索策略,可以增加相关文献的查全率和查准率,避免不必要的漏检和误检。检索策略的制定一般可从以下几个方面入手:
一、检索项的选择
检索项的选择一般要根据不同的检索课题的特点,选择不同的检索途径。由于用户检索时的需求表述通常都是关于课题内容的特征,因此以主题词的查找就为最常见的检索途径;如果用户要了解某著者近年来发表的文献,可直接从著者途径查得;同样,刊名途径提供了从期刊名查找文献的方法;篇名检索可向用户提供已知文献的出处;若用户想要了解某一学科的文献情况,分类检索途径可帮
助其迅速浏览相关文献。
二、主题词的选取
如何选取主题词,直接关系到文献的查全率、查准率,由于文献数据库是采用半受控标引方式,使用了很多自由词,难免在标引中产生误差,故须从多方面考虑主题词的选择,以减少这种误差造成的影响。
三、排除无关文献
计算机检索得到的文献一般分为两类。一类是与检索课题内容有关的文献,称相关文献或有关文献,另一类则称误检文献或无关文献。两类文献混杂在一起,是计算机检索结果的基本特征。如何排除这些无关文献,其手段和策略因题而异。如用“逻辑非”方法,或在检出文献后,用浏览或显示方法排除无关文献。
四、检索策略的修订
在检索过程中,常常会出现文献资料过少(甚至为零)或文献资料过多的情况,这时,就应在检索时随机应变,重新分析并制定检索策略,以使检索达到令人满意的效果。文献资料过多或过少,均可增加检索项,运用布尔逻辑的组配,以增加或缩小检索范围,达到减少或增加命中文献的目的。通常来说,可用“逻辑与”缩小检索范围,达到查准的目的;用“逻辑或”扩大检索范围,达到查全的目的。而用“逻辑非”排他检索,缩小检索范围,达到查准的目的。利用数据库资源,采用文献计量研究方法对科技论文进行统计分析,已经成为文献计量学研究发展的一个方向。因此,完善数据库著录字段,开发利用数据库的统计功能,把统计结果进行整理,定期发布如本年度研究热点、地区、研究机构以及研究人员发表论文数量、基金资助论文数量等评价结果;利用多年统计数据,不仅为评价和预测相关领域科学技术研究现状和发展趋势提供文献计量分析数据,而且为信息工作者提供经分析和整合的文献信息,为政府及有关管理部门的决策提供真实可靠的依据,这才是目前文献数据期刊检索的发展方向。