登陆注册
6501800000019

第19章 3 计算机检索基本方法

计算机检索系统采用的检索词和信息标识词对比运算的主要方法有:布尔逻辑检索、截词检索、限制检索、加权检索、词位置检索和全文检索等。

3.3.1布尔逻辑检索

布尔逻辑是表达不同概念之间关系的符号逻辑系统。利用布尔逻辑算符进行检索词语或代码的逻辑组配,是计算机文献检索系统中最常使用的一种检索方法。

布尔逻辑运算采用逻辑和、逻辑乘、逻辑差等算符,指定文献标引词中必须存在的条件或不能出现的条件。逻辑运算符在检索提问式中起着逻辑组配的作用,它能把一些具有简单概念的检索词组配成一个具有复杂概念并可由计算机执行逻辑运算的检索式,凡符合布尔逻辑检索式所规定条件的文献,即为命中文献,不符合的为非命中文献。

1)逻辑乘

文献应逻辑同时乘也含叫有逻算辑符与左,右其两运边算的符检号索多词用。逻“A辑ND乘”运或算*“可以”缩,小表命示中命范中围,起到缩检作用。如,要查询课题“计算机文献检索”,可用逻辑乘运算连接“计算机”和“文献检索”两个主题词,其提问式为:

计算机AND文献检索

上面这种“逻辑与”关系,(阴影部分为命中文献):

2)逻辑和

逻辑和也叫做逻辑或,其运算符号用“OR”或“+”,表示命中文献中至少必须出现该算符左右两边的一个检索词,也可以两个词目同时出现。逻辑和运算可以扩大命中范围,起到扩检的作用。如要查询有关股票和期货方面的文献,该检索课题对用关键词“股票”和“期货”标引的文献都感兴趣,可以用逻辑和运算构造以下提问式:

股票OR期货

其逻辑关系表示:

3)逻辑差

逻辑差也叫做逻辑非,其运算符号多用“NOT”或“-”表示命中文献须出现算符左边的检索词,但不能出现右边的检索词。逻辑差可以缩小检索范围,提高文献的检准率。如检索者对成人高等教育以外的“高等教育”方面的文献感兴趣,可用逻辑差运算,构造如下检索提问式:

高等教育NOT成人教育其逻辑关系表示:

4)布尔逻辑检索的运算次序

计算机检索系统一般都是从左到右进行布尔逻辑检索处理的。但是,各种算符的运算次序,不同的系统有不同的规定。美国DIALOG和我国“全国报刊索引数据库”的检索系统运算次序是:NOT最先执行,AND其次,OR最后。有些系统采用括号优先运算,多层括号时,先执行最内层的运算。

3.3.2截词检索

截词检索就是在检索词中保留相同的部分(即词干),用相应的截词符代替可变化部分,并代表许多同词干检索用词的一种检索方*“”作为有限截断符和无限截断符举例如下。

1)右截断

右截断,也叫做后截断,将截词符号放在提问条件的右方,只要检索词前方部分符合提问条件的都为命中信息。因此,右截断的检索性质是前方一致。右截断是我国计算机信息检索系统最普遍使用的截词检索技术。

例:人*口

这是一个主题词无限右截断的例子,信息标识的词干为“人口”的信息都满足该检索条件。符合该检索条件的检索词有:人口、人口地理、人口地图、人口调查、人口分布、人口构成、人口经济学、人口素质等。

2)左截断

左截断,也叫做前截断。它与右截断相对,将截断符放在提问条件的左方,只要检索词的后方部分符合提问条件的都为命中信息。因此,左截断的检索性质是后方一致。

例*:人口

这是一个主题词无限左截断的例子,检索词后方两个字都是“人口”的信息都满足该检索条件。符合该检索条件的检索词有:常住人口、城市人口、非农业人口、静止人口、流动人口、年末人口、农业人口、平均人口等。

3)左右截断

左右截断,也叫前后截断。其检索性质是中间一致。这种截断放在检索词的前方和后方,只要被检索词的中间部分符合该提问条件的都为命中信息。

例*:水*文

这是一个主题词左右截断的检索例子。被检索词中间部分为“水文”二字的都满足该检索条件。符合该检索条件的主题词有:水文、水文地理、水文地质、工程水文学、区域水文学等。

4)中截断

中截断,也有叫“屏蔽”。这种截断是把截断符置放在一个提问词的中间,只要求被检索词的前后方与其一致,而截断符所在的位置允许是任意字符。

例:海?地貌学

这是一个主题词中截断的例子。被检索词的第1个和第3~5个汉字必须与检索提问条件一致,第2个汉字允许是任意字。符合该提问条件的主题词有:海洋地貌学、海岸地貌学、海底地貌学等。

3.3.3限制检索

在信息检索系统中,为了满足某种检索条件或达到某种精确度,通常使用一些缩小或限定检索结果的方法,这些方法称为限制检索。限制检索的方式很多,这里仅介绍其中两种主要方式。

1)字段限定检索

将检索词限定在特定的字段中用来缩小查找范围的检索方法叫做字段限定检索。字段限定检索可分为主题因素限定和非主题因素限定两种。主题因素字段有:主题词,关键词,分类号等;非主题因素字段有:责任者、出版年、语种、记录号、文献信息出处等。以文化部研制的ILAS系统的参考咨询子系统为例。该系统设计了丰富的字段限定检索功能。如要查询在期刊《经济研究》发表的政治经济学研究的文献,就可以在主题词逻辑检索式中增加一个母体文献名字段限制检索。其检索式为:

政治经济学/SUBJE理论研究/SUBJECT|经济研究/463

在该检索式中,“|”*CT是限制检索符;“/”的左方是检索词,右方是索引标识或字段标识。SUBJECT是主题词索引标识,463是母体文献名字段标识,*“”是逻辑乘运算符。

2)范围限制检索

范围限制检索主要用于出版年、记录号、专利号等数字型字段限定检索。范围限制检索使用各种比较关系符来限定其与被检索词的比较范围。常用的比较关系有:

①大于(标识为“〉”);②小于(标识为“〈”);③等于(标识为“=”);④不等于(标识为“#”);⑤大于等于(标识“≥”);⑥小于等于(标识“≤”)。

例:检索要求:1994年以后出版的有关计算机文献检索的论文。

1994检索式:计算机/SUBJECT* 文献检索/SUBJECT|250A〉

250A是出版年字段标识。该检索式先进行主题词“计算机”和“文献检索”的逻辑乘运算,在命中的文献集合中再用出版年条件进行限制检索。

3.3.4加权检索

加权检索是一种定量检索方式。它的基本方法是,在每个提问词后面加写一个具体数值表示其重要性的程度,即该提问词的“权”。在检索中,先在数据库中查找这些检索词,对查获的检索词进行权值总和计算。只有当权值之和达到或超过预先规定的值时,该记录才算命中。这个预定的值称为阈值。

例如:检索词权值

计算机4

经济文献 3

文献检索 2

阈值=6

根据上述检索要求,序号1-3的文献为命中文献,:

由于检索词加权检索可以根据命中的文献的不同权和值从高到低地排列,用户可以容易识别出相关文献的切题程度。

3.3.5词位置检索

词位置检索又叫邻接检索,它是表示所连接的各个单元词之间位置关系的一种检索方式。较常用的词位置检索有(W)算符和(N)算符等。

1)(犠)算符和(狀犠)算符

(W)算符是“WORD”或“WITH”的缩写,它表示在此算符两侧的检索词必须严格按照输入时的词序,两词之间可有一个空格、或一个标点符号、或一个连接号,此外,不得出现其他字符。W算符可广泛用于以词组作为检索词的检索命令。比如:COMMODITY(W)ECONOMY。

(NW)算符是从(W)算符衍生出来的一种词位置检索方法。该符号表示算符两侧检索词的词序不变,但允许两词中间最多可嵌入N个其他检索词。

例如:SOCIALIST(1W)ECONOMY

可能检出:SOCIALISTCOMMODITYECONOMY

SOCIALISTPLANNEDECONOMY

SOCIALISTNATIONALECONOMY等等。

2)(犖)算符和(狀犖)算符

(N)算符是“NEAR”的缩写,它表示在此算符两侧的检索词必须紧密相连,两词之间不允许嵌入任何其他单词或字母,但词序可以颠倒。

例如:MONEY(N)SUPPLY

可能检出:MONEYSUPPLY和SUPPLYMONEY两个词组。

(NN)算符用于寻找在一定区域内同时出现的检索词的信息记录。(NN)算符表示在两个检索词之间最多可嵌入N个其他检索词,两个词的词序可以颠倒。两词的间隔越小的记录排列位置越靠前。

例如:FINANC???(2N)CRISIS

可能检出:FINANCIALCRISIS……

CRISISOFTHEFINANCE……

CRISISINASIANFINANCIAL……等。

3.3.6全文检索

随着计算机技术的不断发展,信息检索技术经历了从传统的主题词检索,到基于单汉字标引的全文检索阶段。在全文检索中,任意字、词和字串都有检索意义,都可用来对整个数据库进行全面匹配查找。目前,国内检索系统已广泛地将全文检索技术用于对特定字段、书目记录和整部信息的检索。对全文数据库检索的结果可以是信息全文,也可以是信息中某个词、某个字串的出处,或所在句、段的上下文。因特网搜索引擎基本上都是采用全文检索技术。

?案例3-1

雅虎搜索到底是如何工作的呢?

当您在搜索框内输入想要搜寻的字,并按下“搜寻"按钮后,YAHOO!中国的搜索结果会从数据库中找寻以下五个部分,按照顺序列出搜索结果。

?分类类目

?网站名称

?网站描述(显示在YAHOO!中国的目录里)

?相关网页(这项服务是由搜索引擎“GOOGLE"提供的)

?YAHOO!中国的相关新闻

搜索结果的排列顺序如下:先是相关类目、相关网站,然后是相关网页(由搜索引擎“GOOGLE"提供),最后是相关新闻。

YAHOO!中国会根据中文类目、网站信息与关键字串的相关程度来排列出相关的YAHOO!中国的类目和网站。影响相关程度的因素如下:

?和关键字串相同的字串多寡。相同愈多,相关程度愈高。(意思是,在分类类目、网站名称、网站描述中出现您输入的关键字出现次数越多,相应的网站越会被排在前面,反之,则排在后面)

?和关键字串符合的字串位置。网站名称(或新闻标题)符合关键字串的相关程度高于符合网址(或新闻内文)符合关键字串的网站。

?和关键字串完全符合(EXACTMATCH),相关程度高于部分符合。

?类目的通用性。愈是高级别的类目越排在前面,例如搜寻“玩具",则“商业经济/公司/玩具"类目会比“区域/国家与地区/中国大陆/商业与经济/公司/玩具"放在前面。因为前者更为通用,而后者则具有地域性。

?对于新闻搜索,新闻更新的时间也是搜寻结果排序的考虑要素,最新更新的新闻将优先列出。

怎样正确使用YAHOO!中国搜索?

简答:在雅虎主页或是经由类目搜索进入的页面上,您会看见一个长条状的搜索框,只需将您想要搜索的关键字输入其中,点击“搜寻"按钮,雅虎的搜索系统就会运行起来,带您进入搜索结果页面,您想了解的,从类目、网站到新闻都有啦!

更加快捷的办法:YAHOO!中国目录是基于主题、可供搜索的。如果您不是在寻找一个特定的网站,那么试试用一个比您想找的东西更大的主题。例如,如果想找川菜食谱,就在搜索框里输入“烹饪"来试试,结果许多烹饪网站里包括的川菜内容可能会比您输入川菜找到的“川菜"主题网站更全。再比如说您想寻找一些歌词,可以输入这些歌词的流派,就会更好找哦!

结论:使用YAHOO!中国搜索来寻找通过主题组织在一起的网站。通过雅虎的分类类目来找,不必寻找单个的网站。您将会得到更多想要的结果!当然,如果您知道您想要搜索的网站名称,那么,简单在搜索框里输入相应名称,再点击“搜寻"按钮就行了!

在雅虎进行搜索有什么窍门吗?

头等窍门:通过YAHOO!中国的分类目录搜索通常会比寻找单个的网站来得有效,特别当您对自己的搜索目标不太明确时。例如,您要找一个关于摩托车的网站,您会发现,在“摩托车"类目下有许多实用的网站。这比起您通过输入关键字后,在搜索结果页面中一页一页翻动要好得多。

还有一个类似的秘诀:如果您在迅速浏览过搜索结果后,看到了似乎合适的一个网站,您这时可以点击该网站所在的类目,您会看到,在这个类目中,有许多相关的网站(这通常会比您点击第一个看到的链接更有价值)。

如果您确切知道您找寻的目标,那么直接输入网站名称就可以了。(记住,最好使用网站的全名,例如:您想找“北京青年报",假如只输入“青年"两字就太泛了。)

当您使用YAHOO!中国搜索功能时,我们向您提供一些特别的秘诀:

?使用引号使得搜索结果中,您输入的关键字一定是一个完整词组而不会被分开。

例如,

?如果您希望某些字词一定要显示在搜索结果中,请在该字词的前面加上+。

例如,

?如果您希望某些字词不会出现在搜索结果中,请在该字词等前面加上-。

例如,

为什么有时我的搜索结果会跑到GOOGLE页面上呢?

GOOGLE搜索引擎是YAHOO!雅虎的一个合作伙伴,它的主要特点是,它能在整个互联网资源上进行全文检索。有时,您输入的一些特定的搜索字串,YAHOO!中国无法为您找到相应的网站,这时,我们会自动将您的搜索要求转到GOOGLE中。而GOOGLE的搜索结果是在我们的“相关网页"目录下。

GOOGLE是什么东西?它和YAHOO!中国的搜索有什么区别吗?

当您使用YAHOO!中国搜索时,YAHOO!中国本身的数据库以及我们的搜索引擎合作伙伴GOOGLE,组成了您所看到的搜索结果。

-如果您搜索的字词在YAHOO!中国的数据库内,那么搜索结果会在“相关类目"和/或“相关网站"中。(搜索结果页面上方的工具条上)

-如果您搜索的字词在GOOGLE的数据库中,那么搜索结果会在“相关网页"中。

-YAHOO!中国目录采用专业人工分类,不但可以直接当成目录来浏览,还可以用来搜寻您想要的内容。GOOGLE则是一个全自动搜索引擎,它是利用电脑程序直接在网页中抓取相关字。

雅虎支持带“+"、“-"等的进阶检索语法吗?

是的,我们支持进阶检索语法。

运用以下几种进阶检索格式,您会获得更精确的检索结果:

?利用双引号,来查询完全符合关键字串的网站。

例如:键入“中文输入",会找出包含中文输入的网站,但会忽略过包含“中文形声输入"的网站。

?指定关键字出现的段落。

加T:在关键字前,搜索引擎仅会查询网站名称。

加U:在关键字前,搜索引擎仅会查询网址(URLS)。

?利用+来限定关键字串一定要出现在结果中。

?利用-来限定关键字串一定不要出现在结果中。

一些类目后附带的@标记是什么意思呢?

分类类目后面的“@"表示,这个类目会同时出现在多个YA-HOO!中国的不同分类类目下面。

?范例1:“时尚"这个类目会同时被放在“艺术"和“社会与文化"的类目下。

?范例2:“音乐剧"会被放在“音乐"和“戏剧"的不同类目下。

只要您点击这个含有“@"的类目,就会链接至YAHOO!中国的其他相关类目。

同类推荐
  • 立志勤学(上)

    立志勤学(上)

    本丛书筛选内容主要遵循以下原则要求:(1)坚持批判继承思想,取其精华、去其糟粕。既不全盘肯定,也不全盘否定。坚持抽象继承、演绎发展、立足当代、为我所用。(2)坚持系统整体的原则。注意各历史时期分布;注意各民族的进步人物;注意各层面人物;注意人物各侧面。做到:竖看历史五千年,纵向成条线;横看美德重实践,横向不漏面。(3)坚持古为今用,为我所用原则。在发掘美德资源时,特别挖掘古代人物故事、言论,注重寻找挖掘各阶层、各民族的传统公德、通德、同德;注重人民性、民主性、进步性、发展性、普遍性、抽象性,不求全古代,不求全个体。
  • 这才是中国最好的语文书(散文分册)

    这才是中国最好的语文书(散文分册)

    本书分为“怀念”“新解读”“写朋友”“读书乐”“爱生活”“人世间”“少年游”七个部分。选入的散文比较宽泛,不局限于游记、抒情、记叙,亦将哲学、历史、文化、科学各类文论和随笔选入,并包括书评、影评、议论、杂感、演讲等,这些应用类文章不仅对中学生、大学生具有很高的实用价值,更有利于扩大他们的阅读视野。编者在每篇文章中依旧有选择地写出精练的点评,文后还特别写有分析短文,并设有“延伸阅读”板块,供读者深入解读。读者可以在阅读中掌握生动活泼的遣词造句,体会独特的思想和思考角度,从而领悟到另类的“形散神也散”的散文真谛……
  • 吹响未来的哨音

    吹响未来的哨音

    榜样的力量是无穷的。我们生活的这个世界之所以越来越美好,越来越进步,就是因为有无数的精英人物前赴后继,用生命和鲜血换来的。他们有的为民请命,有的慷慨赴死,有的钻研学问,有的发明创造……
  • 聆听孝道之爱

    聆听孝道之爱

    作品精选了中外最具启迪的心灵故事,内容短小精悍,饱含温馨情感。它如涓涓细流冲涤*内心,给我们心灵以滋养;又如母亲温暖的手轻轻抚慰着我们,给我们心灵以慰籍;还能让我们回顾往昔,感受善良的力量,使*灵魂获得安宁。这是*心灵鸡汤,让我们在阳光的滋润中感受到心灵的成长。
  • 现代物流技术基础

    现代物流技术基础

    本书可为初学者奠定基础,使读者对物流技术和物流系统规划设计有相应的了解,可作为高校相关专业的教材,也可作为物流专业人员进一步学习物流技术知识的参考书。
热门推荐
  • 混沌逆天大小姐

    混沌逆天大小姐

    本文一对一,喜欢的戳进来。谁能告诉她,当了14年的废材为何在一次阴差阳错的被人下媚药之后就可以修炼了,等等:当玉琉璃内视看到自己腹部的珠子之后,第一想法就是自己不会得了什么肿瘤吧?可是想想,21世纪的肿瘤不都是什么黑色或者暗红色还是什么紫色的吗?那这颗乳白色的是什么?饶是当了24年金牌特工的玉琉璃也不淡定了,莫名其妙的穿越就算了,身体里竟然还多了不明物,她不会悲吹到刚重生就又要死翘翘了吧?玉琉璃咬牙切齿道:“不要让我知道是谁给我下的媚药,否则……”上一秒还气愤填膺,下一秒却沉侵在自己的思想里:“到底是何方妖孽,让她就一次就中奖了。他身体太特么强悍了……”。某大街上:“真是废物,自己废物就算了,现在竟然还带了个小废物。”身旁的萌萌女疑惑了:“娘亲,什么是废物?”玉琉璃:“谁说我们是废物,那她就是废物了,废物就是像她那样子的。”“哦,原来姐姐你是废物啊,呵呵……”天真无害的表情下又隐藏着怎样的邪恶只有玉琉璃知道。某森林中:“小狐狸,劝你还是乖乖臣服吧,能成为我们的代步灰机(现代飞机)是你的荣幸。”某萌妹子又来了:“娘亲,什么是灰机?”玉琉璃:“额,灰机啊?灰机就是灰色的机机啊”玉琉璃一脸无奈,21世纪的飞机,让她怎么解释?“哦……”萌妹子似懂非懂的点点头。玉琉璃在收服小狐狸,某小孩还在想着灰机到底是什么东西。……………………玉坡大陆,实力为尊,玄气斗气满天飞舞。炼丹师、炼器师……横行天下,我们的女主自然不在话,下。21世纪的金牌特工又是如何站到世界巅峰的敬请期待。
  • 霸世龙啸

    霸世龙啸

    悠悠沧海,混沌开,道法自燃,苍龙现……天雷滚滚,翔云密布,电闪雷鸣之后,只见苍穹金光一闪,骄儿降世。从此天下群雄角逐,一场浩劫,正在弥漫而来。张翎骄,一个猎户之子,又是如何得奇果、习武技、巧姻缘、组势力、分天下、压群雄、成霸业呢……
  • 葬仙谣

    葬仙谣

    修道者能以元气掌控天地之力,风雷云雨皆能借用,搬山填海轻而易举。他们身与道合,诸天万界之力,无物不可外借。林周本是仙轮、仙命、仙缘的仙灵圣体,奈何被截断了气海,仙路被绝。但其另有盖世机缘,获不世传承,习无上神术,最近乎道的体质却走上了逆天伐道之路,无限精彩就此展开。天地为棋局,众生为棋子。一曲葬仙谣,屠尽红尘仙。
  • 为妻之道(婚婚欲醉系列)

    为妻之道(婚婚欲醉系列)

    [花雨授权]当踏入这深宅大院,她就知道今生今世都将被束缚。三从四德的为妻之道她是懂的呀,为什么要面对他和他的所爱?他怎么可能爱上她呢?他心系国家大事,也有青梅竹马的恋人,他要怎么取舍她与她!国事与情事孰重孰轻?
  • 宋谜2

    宋谜2

    宋朝有许多谜。比如,只有3公里长的杭州苏堤,为什么在课本上都谎说是三十里?为什么要谎说司马光砸过缸?为什么苏轼的私生子会这么多?为什么徽钦二帝会被劫走?又,十字军东征跟中国有什么关系?八仙过海都去了哪里?……本文的主角在北宋做了很多的努力,本文将继往开来,悬念不断,新意无数,开发科技,探索文明,笑侃历史。本文绝对有新意,能给你带去无穷的畅想和无数的笑意,谨请围观、点评。
  • 荣光与黄金

    荣光与黄金

    被伙伴杀害而回到过去,参与一个贫穷国家的成长,见证一个帝国的形成,追寻一段穿越过去与未来的羁绊。
  • 吸血鬼之祸乱人间

    吸血鬼之祸乱人间

    她,冷艳,高傲,生生与孤独相伴,在她心如死灰的日子,一个神秘的男人把她从人类的正常生活带往吸血鬼的世界......
  • 我这一辈子

    我这一辈子

    一个幽默的作家,一定是极会掌握语言文学的作家,他必须写得俏皮,泼辣,警辟,使人读了发笑,或啼笑皆非、受到教育。老舍作为一个幽默小说家,便具有这样的语言能力和幽默的心态,世事、异国观光、朋友亲邻,在他眼里皆是有趣的。一如他笔下“穿马裤的马裤先生”、“盼孙子的王老太太”、“院里不是东西的老王”等等,既写实传神,又夸张好笑。且他的这种笑不仅仅是让人捧腹的搞笑,还是一种含泪的笑。他将对当时社会的讽刺批判和自己博大悲悯的人道主义情怀,融入这种笑中,极具感染力,让人发笑的同时,也引人思考。
  • 十方神座

    十方神座

    我等生来自由身,谁敢高高在上。你敢高高在上!那我打死你可好?有人问我为何衷情于剑器?实不然。“我之所以用剑,只因我太过慈悲!”十方神道,我居王座,是为十方神座。
  • 妖孽来袭:腹黑男神住我家

    妖孽来袭:腹黑男神住我家

    (反穿越文,男穿现代文)她平凡的人生从开车撞到他时彻底改变。