网上搜索如何加速 (郝宇红 infoweb) 网上的信息搜索技术越来越多,怎样才能高效迅速地找到问题的答案?有几种 技术可以使得更加快捷地找到所需网页。没有一种技术是万能的,但将几种技术巧 妙的结合使用会大大加快网页搜索进程。几乎所有流行的搜索引擎都提供按词组搜 索的功能,按词组搜索是一种在浩瀚的网页搜索相关网页的最佳技术。 词组搜索 如果只给出一个单词进行搜索,那么将发现数以千计甚至以百万计的匹配网页。 然而如果再加上一个单词,那么搜索结果会更加切题。在搜索时,给出两个关键词, 并将两个词用AND(与逻辑) 结合起来,或者在每个词前面加上加号,这种与逻辑技 术大大地缩小了命中范围,从而加快了搜索。幸运的是,所有主要的搜索引擎都使 用同样有语法。一个带引号的词组意味着只有完全匹配该词组(包括空格)的网页 才是要搜索的网页。例如在搜索说明中,有“this exact phrase (这个确切词组) “这个词组,那么搜索引擎只搜索包含“this exact phrase(这个确切词组) “的 网页。 下面举一个例子,一个人要查找惠普的MPE/ix操作系统的命令清单,他可能在 Altavista站点只输入“MPE/ix“这个词,那么他可能会发现有2400个匹配网页;如 果在填写搜索条件时写了“MPE/ix“和“Commands“两个词并用AND(与逻辑) 结合 起来, 那么满足条件的可能是450个网页; 如果在搜索条件上输入 “MPE/ix Commands“,那么只有15条记录匹配,其中包括爱荷达州立大学计算与通信管理用 户指南,其中对MPE/ix系统命令有详细的描述。 词组选择 一般说来在网页搜索引擎中,用词组搜索来缩小范围从而找到搜索结果是最好 的办法。但是,运用词组搜索涉及到如何使用一个词组来表达某一具体问题。有时 简单地输入一个问题作为词组就能凑效, 尤其是在Altavista这个站点上,因为它 采用了“Ask Jeeves“引擎技术,该技术就常见问题给出预置的答案。 在Altavista上输入“ Why is the sky blue(为什么天是蓝的) “,就会在 “Ask Jeeves“部分找到答案,并给出若干网页回答这个问题。然而简单明了的提 问方法只对一部分搜索奏效。其他词组也可以作为搜索条件,尤其这些词组中有一 个词十分独特或者该词组是几个词独特的组合。试一试用人名、产品名、甚至是嵌 入程序中的字符串去搜索。 收到错误信息 将全部或部分错误信息作为词组进行搜索。 当夏时制时间变化时, Netscape Navigator(浏览器) 会产生一条错误信息, 该信息包含词组“book marks have changed on disk(磁盘书签已变动) “。在Northern light 或HotBot 站点上输 入该词组,就会找到对该问题的解释以及如何处理。 DejaNews和新闻组文档经常发现一些问题很难甚至不能通过搜索引擎找到答案。 由于新闻组更关注讨论而网页相对来说变更较少,DejaNews新闻组文档或许是一个 较快的信息源。 不幸的是,DejaNews 不能总是充分地处理词组引擎。尽管它遵守 常规的语法,但是它的搜索引擎是处理器密集式的,而且经常只给出与搜索词组匹 配的部分结果。有鉴于此,在DejaNews上搜索时最好直接键入词组不要加引号,并 希望包含该词组的记录出现在前面。有些搜索引擎在处理词组时出人意料——忽略 句号,搜索该词的其它形式,漏掉空格等等,但是在DejaNews中的处理过程中不存 在。 直接到信息源 有时词组搜索太精确或者一个词组无法准确表达所需信息。那么可以直接到信 息源,这种技术简单得似乎不值一提,但却很有效。根本不用搜索引擎,直接到提 供某种信息组织的站点去。很多时候我们可以用公式“www.公司名.com“去猜测某 一组织的站点。如果猜不中,那么到Yahoo去,或用搜索引擎。 例如,要找Dell公司现有附件的说明书,直接去该站点www.dell.com,想知道 Oracle公司有什么新闻,试一试www.oracle.com,然后再去新闻栏看一看。人们在 搜索引擎中得到很多无用信息,却忘了试一试该方法。这种技术还可用于其他搜索 目的,并不一定与公司有关。政府机构、职业协会、教育机构也可以提供很好的信 息资源。 有关人口统计请去www.census.gov,还能去www.acm.org看看最近的会议 清单。 新搜索引擎特点 近几个月来搜索引擎不断完善, 并且已经取得重要的进展。 比如前面提到的 Altavista将Ask Jeeve技术融合在其搜索引擎中,如果你的问题在Ask Jeeves库中 具有普遍性就会很容易在此找到答案。该技术在回答“What time is it in Paris? (巴黎现在几点了? )“这类问题时十分有效,而遇到诸如“What is the best way to make an Oracle database accessible on the web? (如何使Oracle数据库被 浏览器访问?)“这类问题时就显得不尽如人意。 HotBot使用直接命中法,即给出10个经常被搜索访问的站点。这两种方法在猜 不到某一组织的URL时非常有效。 Excite近来采取了更加复杂的方法,给出到公司站点的连接、它的地址、当前 股票价格、新文章等等。对于大公司名字这类标题,Excite可以正确识别,这是一 种获得基本信息和当前新闻的很好的办法。但这种办法在对待细节问题时大打折扣。