第十六章 Wais

Wais是一种可以迅速、全面检索大量信息的工具。当然,这一工具仅 仅针对信息的数量和类型,以及检索程序的功能而言的。Wais能检索数百 个信息资源中的任何一个资源,这些资源涉及大量的各种各样的主题。

Wais当然有不足之处,我们将讨论它的局限性。但是,即便在局限性 范围内,Wais仍是一种功能卓越的工具。只要能熟悉使用Wais,你就会觉 得它像是一组思维简单但效率颇高的图书管理人员,随时准备为你检索任 何你所需要的信息。

Wais的促成动因

名字“Wais”(读作“Wayz”)代表“广域信息服务”(Wide Area Information Service)。Wais作为Internet一项服务, 是唯一由三个商 业公司(Apple、Thinking Machines和Dow Jones )启动的研究计划促成 的服务。

Wais的最初设想是雄心勃勃的。该设想要求,在浩翰信息世界中,计 算机能为你跟踪大量的数据,筛选这些数据,然后向你提供仅与你的要求 有关的信息。该设想旨在编制出一个能起提供参考的图书管理员作用的程 序,这个程序可节省你的时间,并可以访问到你也许迄今不知道的信息。

例如,假定你的报纸每天以电子方式递送,这些信息将在你的计算机 屏幕上显示。假如你能告诉程序你想看什么内容,并让程序来选择和显示 这些内容,这有多么理想!

再如,我想对计算机说:“每天我要求你向我显示体育新闻,不要显 示商情。我想看用自动问答程序选择和显示的各种内容,但只限于看它是 否提及New York Mets, 除了在‘世界杯’赛事期间,我不想看任何足球 方面的内容。噢,是的,我还想看世界新闻,但政治内容不要太多。是否 有涉及飞机的内容,最好能保证有这方面的内容……”

你会这样想:让计算机程序来做这种事吧。此外,你还希望当这个程 序找到一篇真正使你感兴趣的文章时,你可以告诉它不要再找相同主题的 其它文章了。

当然,只要有了这样一个系统,你就不必陷于各种新闻的汪洋大海之 中。任何一种能被计算机存取的数据,原则上,都能由具有判别力的计算 机程序为你检索出来。

在此,可以看到Wais之所以成功的原因:Apple 公司制造了具有便于 使用的图形接口的个人计算机;Thinking Machines公司制造了含有许多 处理器, 适合于迅速检索大量数据的计算机;Dow Jones公司经营了信息 服务业。

显然,这样一个系统在有些方面是很奇妙的。你可以让计算机程序处 理信息检索的一切细节。你只需要象贵客一样,什么也不用动手就能按你 的要求阅读个人专用的报纸。

当然,事情总会有局限性。首先不论多么个人化,你的计算机屏幕上 的一系列文章始终不能取代可平放在桌上、用眼逐页阅读的印刷型的报纸 或书籍。

其次,无论计算机程序怎样迎合你的好恶,你接收的任何数据,都只 是针对你所提出的问题。你自己当然可以知道什么时候想看什么,却常常 不能准确地提出该问的问题。

最后,该计算机程序只能找到计算机处理过的数据,这就是很大的局 限性。试想一下,在一个正规图书馆中你能获取多少信息? 你可以步入图 书馆,从书架上取下任意一本书,打开并阅读这本书。虽然有时准确找出 你想要的内容很麻烦,但你可以翻阅书架上的每一本书,以及目录,在可 能情况下,也可以请专门的图书管理员来查找。

人们常犯的一个错误是,以为能在计算机化的图书馆目录中检索图书, 就能使用计算机阅读那本书的文本。在大多数情况下,即使你在计算机帮 助下找到一本书,你仍然必须真正拿到这本书后才能阅读它。

关键是,与实际的图书馆比较,将文本贮存在计算机中的图书和期刊 太少太少了。

Wais的最初计划是开发一个统一化的信息检索系统,这个系统能够访 问全世界的全部数据库。有些数据可从Internet中免费获得,但在人们开 始有偿使用信息之后就不再这样了。

Wais的未来或多或少可以预见到,起码也能事后知晓。它不会是未来 的信息工具。是的,有些人使用象Wais一样的付费计算机系统,但我们大 多数人仍然依赖于老式的印刷件。

因此,就Internet而论,Thinking Machines公司已停止提供公开传 播的Wais 。 Wais的免费版本叫做Freewais,现在由名为CNIDR (联网的 信息显示和检索交换站)的机构维护。

不过,Wais对于Internet仍然是很重要的,其原因是:Wais已逐渐发 展成为一个系统,该系统能提供极其重要的优质服务。

何为Wais

Wais是一项Internet服务,它能检索数百个数据库中的任意一个数据。 每个数据库是一个资源。你告诉Wais使用哪一个资源,你想找什么, 你给 Wais检索的内容指定一个或多个关键词,Wais将在你指定的资源中检索各 条目的全部文本,找出满足你的标准内容。这个过程叫作全文本检索。

例如,你可让Wais对着一大批资料(recipes) 并告诉它找出所有含有 单词“大蒜”、“鸡”、“水稻”的资料。或者可检索1992年美国总 统竞选活动中比尔·克林顿的讲演集,找出涉及“税收”、“削减”和“ 承诺”的讲话。或者可以检索蛋白质位置和模型的参考文献,选出所有含 单词“二氢叶酸 还原酶”的引文。或者可以检索《圣经》、《古兰经》、 《摩门教徒的书》,找出所有包括单词“通奸”的章节(想一想,计算机 能替你节约多少时间)。

使用Wais相当简单,你只需选择一个或多个资源,然后告诉Wais要找 什么。Wais将与包含这些资源的计算机连接,并要求它们进行检索。输出 将是文章或引文的清单。

Wais将向你显示这个清单,按相关程度从大到小显示条目。Wais认为 有关的内容是以你指定的关键词在每篇文章中出现的频率为根据的。Wais 认为最相关的文章是关键词出现次数最多的文章。

Wais向你显示它查找到的东西,你要通读这个清单,选出你想看的条 目。然后Wais将检索实际文本,并将其显示在你的屏幕上。 如果你要保留 这个条目,可以告诉Wais将其存到一个文件中,或将其邮寄给自己(亦可 邮寄给其他人)。

当你找到一篇与你的兴趣特别相关的文章时,可以告诉Wais对这篇文 章全文扫描或部分扫描,并使用这些词作进一步的检索,这叫做“关联性 反馈”。

Wais提供的服务可能是非常有用的,但仍有局限性。首先,Wais 只能 在查找了你所需信息后才对你有所帮助。虽然几百个信息源听起来好像很 多,但它们并不能覆盖人们可能提出的全部问题。

其次,Wais实际上检索资源中所含的每一个词,而不考虑小的常用词, 如“a ”和“the”。但这仅仅是一种简单的、非上下文联系的检索方法。 例如, 你可能告诉Wais检索含单词“税收”、 “削减”和“承诺”的讲 演集,而这些词可能出现在文本的任何地方,例如,发表讲演的人可能说: “我们必须付出才智,以增强我们履行未来诺言的能力。”( 此句含有关 键词“tax”,“ cut”和“ promise”——译注),此时我们无法叫Wais 去查找“减税承诺”的有关内容。

当Wais正常工作时,它仍然是一种功能卓越的工具,它能为你节约大 量的检索时间。因此,看一看Wais是如何工作的,我们应如何使用Wais。 Wais客户机

同许多Internet服务一样,Wais使用客户机/服务器系统(见第二章 ) 。你直接与Wais客户机上的程序相互配合。这个程序显示信息并执行你 的命令。每一个Wais信息源由“Wais服务器”维护。Internet上有许多公 共Wais服务器,你只需且只能通过Wais客户机来访问。

你无论何时提出请求,你的Wais客户机都会连接到适当的Wais服务器 并要求它进行检索。服务器进行检索,将结果反馈给客户机,并在你的屏 幕上显示出来。当你想看一个专门的条目时,客户机又向服务器发送请求, 该服务器送回这个条目,你的客户机将一次全屏地显示出来。

有多种Wais客户机可通过匿名FTP免费使用。 你的系统可能已经有了 Wais客户机程序。如果是这样,你只需要启动这个程序即可。两种最普通 的Wais客户机程序是标准Unix系统的swais和waissearch,及x window 系 统的x wais(我们在第二章中讨论过X Window )。 还有大量其他系统的 Wais客户机。

如果你的计算机中没有Wais客户机,你可以telnet到表16-1所列的某 个主机上。每一台这种计算机都提供任何人都能使用的公共的Wais客户机。 你登录之后,客户机将自行启动, 不要口令。 (我们在第七章中讨论过 Telnet。)

公共Wais主机提供的资源组并不相同。你可以要求试连不同的主机, 看哪个最适合。

当你telnet到公共Wais客户机时,你要使用swais客户机(表示“简 单的Wais”)。在本章的其余部分中,我们将假定这是你正在使用的客户 机,如果你正在使用不同的客户机,你得阅读相应的资料, 但是, 使用 Wais的基本思想与我们所讨论的相同。

有关 Wais 的其它信息, 有两个 Usenet 讨论组可以订阅: comp .infosystems.wais和alt.wais。还有一种Wais常见问题(FAQ)表,你将发 现它很有用处, 特别是你正在为你的计算机找Wais客户机时。


地区                  Internet地址         IP地址         以…登录

芬兰                  info.funet.fi        128.214.6.102  wais

美国:加利福尼亚州    swais.cwis.uci.edu   128.200.15.2   swais

美国:马萨诸塞州      nnsc.nsf.net         128.89.1.178   wais

美国:马萨诸塞州      quake.think.com      192.31.181.1   wais

美国:北卡罗来纳州    kudzu.cnidr.org      128.109.130.57 wais

美国:北卡罗来纳州    sunsite.unc.edu      152.2.22.81    swais

    表16-1你可Telnet到的公共Wais客户机

FAQ表定期邮寄到comp.infosystems.edu.wais,还可以通过匿名FTP 从rtfm.mit.edu下传。请进入/pub/usenet/news.answers/wais-faq目录 查找名为getting-started的文件。(我们在第九章中讨论过Usenet 新闻 组和FAQ表,在第十二章中讨论过匿名FTP。)

对Wais的思考

在下面各节,将向你介绍如何使用公共的Wais客户机进行检索。在介 绍之前,我们提几条建议:

要熟练使用Wais可能有一个过程。检索结果极大地取决于检索所选的 资源,及如何组配关键词。此外,Wais接口功能差(funky), 有一些习惯 的用法(对于没有生活在南加利福尼亚的你来说,funky 的意思是“质量 低劣但仍奇妙(but still cool)”)。

你必须明白,Wais要像一个优秀的图书管理员那样最终知道如何去找 到一本所要的书,是会有一个过程的。假如在初始阶段,你发现它很难提 供有用的东西,请不要灰心, 只要你有了经验后, 就很容易有效地使用 Wais了。

有时,你可能发现,你得亲自进行简短的演示, 以使持怀疑态度的 人确信花在Internet上的时间都是合算的。例如,可能叫你向上司或隔壁 办公室的同事演示Internet(在近六个月来,你尝试引起他们的注意)或向 好友演示(他们认为使用计算机通常是浪费时间)。

如果你决定使用Wais演示,到那天客户机程序运行很慢,且不配合, 你检索的每个资源都临时不工作。你不能向他们表示Wais如何很好地找出 数据,你将满面羞愧,演示可能以无结果而告终。我们建议你向他们演示 Gopher,Gopher比Wais可靠得多,并更容易使用。

好了,已提出了上述建议,让我们看一看使用Wais将会怎样。
开始使用Wais
要启动Wais,可以telnet到一个公共客户机,例如:
telnet quake think.com
在进行Telnet连接时,你将看到以下信息(如何使用Telnet的说明请 见第七章):
Trying 192.31.181.1……
Connected to quake:think.com:
Escape character is '^]'.
SunOS UNIX(quake)
login:
以Wais登录(你将不需要口令),然后你将看见:
Last login:Sat Jul 10 15:32:36 from jazz.ucc.uno.edu
SunOS Release 4.1.1(QUAKE)#3:Tue Jul 7 11:09:01 PDT 1992
Welcome to swais
Please type user identifer (optional.i.e user@host):
在此处录入你的Internet邮政地址,并按回车键。远程主机现在问你 使用的终端型号:
TERM=(vt100)
你既可录入终端型号,也可按回车键,默认vt-100(我们在第三章中 讨论过终端)。回答了这个提问后,等待swais客户机运行,届时, 将看 见一个资源清单,现在准备开始工作。


SWAISSource SelectionSources:463

#ServerSource

Cost

001:[archie.au]aarnet-resource-guideFree

002:[munin.ub2.1u.se]academic-email-confFree

003:[wraith.cs.uow.edu.au]acronymsFree

004:[archive.orst.edu]aeronauticsFree

005:[ftp.cs.colorado.edu]aftp-cs-colorado-edu Free

006:[nostr.omo.oes.orst.ed]agricultural-market-news Free

007:[archive.orst.edu]alt.drugs Free

008:[wais.oit.unc.edu]alt.gopher Free

009:[sun-wais.oit.unc.edu]alt.sys.sun Free

010:[wais.oit.unc.edu]alt.wais Free

011:[alfred.ccs.carleton.]amiga-slip Free

012:[munin.ub2.lu.se]amiga-fish-contents Free

013:[coombs.anu.edu.au]ANU-Aboriginal-Studies$0.00/minute

014:[coombs.anu.edu.au]ANU-Asian-Computing$0.00/minute

015:[commbs.anu.edu.au]ANU-Asian-Religions$0.00/minute

016:[  150.203.76.2]ANU-CAUT-Academics$0.00/minute

017:[coombs.anu.edu.au]ANU-CAUT-Projects$0.00/minute

018:[coombs.anu.edu.au]ANU-Coombspapers-Index$0.00/minute

Keywords:

<space> selects,w for keywords,arrows move. searches, q quits,or?

请看屏幕的各个部分,首先,最上面一行告诉我们:这是Wais资源选 择屏(请记住,我们必须选择自己的资源才能开始检索)。在右上方可看 见这个客户机程序,知道有463 个不同资源。

往下,看见前18个资源的简介。每一行表示含这个资源的主机地址, 资源的名称和进行检索的价格。请注意,第一个资源是由亮光条显示的。 当你使用这个清单时,你将在资源间选择,亮光条也移动,以指示当前资 源。

不必担心价格。所有的资源都是免费的。你不会因偶然的情况而付费。 倒数第二行,可看见“Keywords”。当我们准备开始检索时,在这里 录入所选关键词。

最后,最末一行总结了基本swais命令。一旦你了解了如何使用swais, 这些命令将更有意义。

在下面几节,我们将向你介绍如何选择资源和如何进行检索。在介绍 之前,我们想先向你介绍两个最基本的swais命令。

第一,可以按“h”(帮助)或“?”键来显示命令摘要。swais 客户 机按“cbreak mode”(字符结束)的方式工作。 这表示你在使用单个字母 命令时,不必按回车键。

例如当你想要帮助时,只需按“h” 键,不用按回车键。

第二,要停止swais并断开远程主机,请按“q”键。

使用q键时要当心,很容易在无意之中按q键——假如你正在阅读资源 目录时——会使你与Wais的对话不可改变地中止了。

选择资源

使用Wais的一个方法是选择一个或多个资源,然后进行检索。在这节 中,我们将复习用来选择资源的命令。在下一节中,我们将向你显示如何 进行检索。然后举个例子,说明它是如何工作的。

选择一个资源,你要移动亮光条指向它,再按SPACE。Wais 将向你显 示标有“*”符号的资源被选择。例如,在下面的清单中,资源10被选择:


008:[wais.oit.unc.edu]alt.gopherFree

009: [sun-wais.oit.unc.edu]alt.sys.sunFree

010:* [ wais.oit.unc.edu]alt.waisFree

011: [alfred.ccs.carleton.]amiga-slipFree

开始检索前,你可以按你想的那样选择许多资源。并且任何时候你都 可以移动亮光条到一个新的资料并用SPACE键来选中。 如果你决定停止使 用已选择了的资源,可以再一次移到它,并按SPACE键, 这样就可以不选 该资源。想放弃所选的所有的资源并开始新的检索,按“=”(等号)键。

你在开始进行一个新的检索之前,需按“=”键清除前一个检索已经选 择了的所有资源。

从一行移到另一行有几种方法。最容易的方法是使UP和DOWN键(带箭 头的光标控制键)。如果这些键在你的终端上不起作用,或者,如果你不 愿意使用这些键,那么,你还可以使用“j”或CTRL-N向下移动到下一行, 使用“k”或CTRL-N向上移动到上(前)一行。 (虽然移动键的这种选择 看起来很不规范,但他们与使用的vi编辑程序却是类似的,并且许多Unix 用户都使用这种类型的移动键。)

想全(整)屏向下移动到下面的资源,你可以使用“J”或CRTL-D , 想向上移动到前(上)一屏资源,你可以使用“K”或CTRL-U (注:这些 字母都是大写的“J”和“K”字母)。想直接跳到某一资源,仅简单的录 入其数字即可。 例如,想跳到15号资源,仅录入:

15 (在015中你不必录入第一个0字)

如果你已知道资源的名字,你就可以通过录入一个/(斜杠)后面跟 着它的名字的前面几个字母,就可以跳到你所要选择的资源。 例如, 想 跳到名为amiga-fish-contents的资源,录入:

/amiga-f

如果你想看Wais(能查到的)的一种资源技术信息,将亮光条移向它, 并按v(view)键。例如, 如果你移到amiga-fish-contents资源,并按v键, 你就会看到下面的显示:


    Name:amiga-fish-contents.src

    Directory:/sources/

    Maintainer:hakan@hera.dit.1th.se

    Selected:No

    Cost:Free

    Server:munin.ub2.1u.se

    Service:210

    Database:amiga-fish-contents

    Description:

    Server  created  with  WAIS  release  8  b5  on  Aug  29  16:

24:34  1992  by anders@munin

    This is an index of the contents of Fred Fish's  disks  #1-

 current  with 

    a freely distributable AMIGA software library    containing

 an extensive 

    collection of PD.shareware and  demo programs.

    Search for ‘dieknr’ to see the  current  ( latest)   disk

 number.

    Search for ‘ftp’ to see the some ftp sites where you  can

 get the disks. 

进行检索

当你已经选择了一个或多个资源,并准备进行检索,就按RETURN键。 这时光标移到靠近屏幕底的那一行:

Keywords:

这时你可以输入任何关键词。当你输入时,有几种供你修改的方法。 想删除单个字符按BACKSPACE键,如果这个键不能进行删除, 还可以 试着按CTRL-H,DELETE,或者CTRL-BACKSPACE。只要我们使用的是以上的 键,总有一个是可以进行删除的。

想删除整个词,按CTRL-W键;删除整行,按CTRL-U键。

下面是在我们录入几个关键词后,这一行象什么的例子: Keywords:tax cut promise.

当你指定了你的关键词时,按RETURN键就开始检索。在该过程中 Wais 将检索你指定的每一个资源,显示与之有关的清单,并将组织这个清单, 使得最符合要求的排在第一位。下面是一个通过检索适合于上述关键词的 名为clinton-speeches资源的例子。


    SWAISSearch ResultsItems:40

    #ScoreSourceTitleLines

001:  [1000](clinton-speeche) VP DEBATE ANALYSIS: Encyclopedi697

002: [928](clinton-speeche) THE ECONOMY: Staement791

003: [928](clinton-speeche) THE ECONOMY:Speech-Detroit 559

004: [819](clinton-speeche) LABOR: Speech-Washington,DC525

005: [782](clinton-speeche) ECONOMIC STRATEGY:6/21/92877

006: [728](clinton-speeche) ECONOMIC PLAN:Position Paper-773

007: [691](clinton-speeche) EDUCATION:Speech-Rockville 658

008: [673](clinton-speeche) VARIOUS TOPICS:Interview-Atl 830

009: [655](clinton-speeche) ECONOMICS:"New Covenant" Speech 634

010: [637](clinton-speeche) SMALL BUSINESS PLAN:Position P 598

011: [601](clinton-speeche) MANUFACTURING:Speech-Washing 706

012: [600](clinton-speeche) ON RESPONSIBILITY (BUSH'S): Spe 237

013: [600](clinton-speeche) THE ECONOMY:Speech-New Orlea 227

014: [564](clinton-speeche) HEALTH CARE: Speech-Macon,GA 440

015: [546](clinton-speeche) LABOR: Speech-San Diego,CA 507

016: [509](clinton-speeche) ECONOMICS: Speech-Flint,MI- 283

017: [509](clinton-speeche) JOB RETRAINING: Speech-Dayton 359

018: [509](clinton-speeche) EDUCATION: Speech-Los Angeles 638

<space> selects. arrows move. w for keywords. s.for sources.  ? for help

现在你已看到了Wais所找到的东西。是否去查找这些由你自己决定。 请注意第2列的得分,这个得分将告诉你条目与你的关键词相搭配的程度。 最好的搭配条目总是获得1000分,其它所有的条目都有得分并按匹配的程 度排列。

1000分并不意味着是满足你需要的最好条目——而是指根据Wais的标 准——这个特殊的条目具有最好的关键词搭配。此外,你还必须检查搭配 结果。在大多数情况下,你总是想指定较好的关键词并想再试一次。

在这方面,有两种选择,你可以查看一些条目,或者可以试着进行另 一次检索。想查看,就移到条目,并按RETURN,此时Wais将连接到合适的 服务器上,并请求拷贝实际文件。当获得文件时,Wais将使用翻页程序显 示文件,此时为全屏显示。

当你阅读文件时,你的屏幕是通过翻页程序控制的。有两个可使用的 基本命令:想看下一屏,按SPACE键;想停止显示的文章,按q键(quit键)。 当你在阅读时,按q键是退出翻页程序。除此之外的其他所有时候, 按q 键都将是退出Wais。因此,你必须习惯这一点。

如果你想获得你刚刚阅读到的一个永久性拷贝,可以使用S (大写字 母“S”)命令,将该文本贮存到一个文件中,或者使用m命令发送文本。 使用S命令的条件是你在自己的计算机上使用的一个Wais 客户机(你不能 在公共的Wais主机上存文件),不管怎样你总是可以使用m 命令给你自己 或别人发送文本拷贝。

如果你对检索结果不满意,你还可以通过按w(keyword)键再试检索一 次,这样也就可以恢复关键词行,你通过改变关键词就可以开始一次新的 检索。

当你决定在这个特定资源组中检索时,按s键, 这样就可以恢复资源 屏,此时你可以选择或不选你想要的任何一种资源。记住:如果你决定开 始用一个新的资源进行新的检索时,你可以按= 键停止选择所有的资源。 直到你进行完一个新的检索,你才可以通过按r键, 重新显示前一个检索 的结果。

在这方面,我们想就关联反馈说几句:对有的客户机,你可选择条目 的全部或部分作为欲查找内容的代表,让Wais将此条目所有词语存起来, 以帮助进一步的查找。这被称做关联反馈。当你telnet到公共Wais客户机 上时,关联反馈就没有多大的考虑必要,然而,如果在你自己的计算机上 使用的是一个高级Wais客户机, 你就可以使用关联反馈帮助你建立非常能 够体现专指性的检索。

如果你很看中Wais的话,去找一个好的Wais客户机,并在上面花一些 时间吧。 Wais命令简表

在图16-1的简表中,显示了用swais客户机程序所使用的Wais 基本命 令。如果你使用的是另外一种客户机,命令会有所不同(可能更加有效), 但是基本的概念将相同。


Basic Commands

hdisplay summary of commands [help]

?same as h

qquit Wais

Moving the Current Line

DOWNmove down one line

jsame as DOWN

CTRL-Nsame as DOWN

UPmove up one line

ksame as UP

CTRL-Psame as UP

numberjump to specified line number

/patternjump to source that begins with specified pattern

Jmove down to next screenful

CTRL-Dsame as J

Kmove up to previous screenful

CTRL-Usame as K

Selecting a Source

SPACEselect or unselect a source

=unselect all sources

RETURN(after selecting sources)ask for new keyword

rre-display results of the previous search

vdisplay technical information about source[view]

Performing a Search

RETURN(after entering keywords) start search

RETURN (while examining results of a search) display item

wask for new keywords

sre-display the source screen

Reading an Article

SPACEdisplay next screenful

qstop reading article[quit]

图16-1用swais客户机程序所使用的Wais命令

使用Wais的一个现实例子

为了丰富这一章,我们将使用Wais检索一些对你日常生活有些直接帮 助的重要信息。

如果你倦于现代生活的节奏,想去某个热带地区岛屿,而且岛屿上必 须有大量的椰子和鸟粪。你所遇到的问题是:

哪里是你应该去的地方呢?想找到答案,你可以使用Wais。

开始,你telnet到一个公共的Wais客户机上,登录,你使用: telnet nnsc.nsf.net

以Wais登录。当你指定了终端类型后,Wais 客户机将通过显示资源清 单开始进行检索。

你想开始进行检索,你就需要知道检索哪个资源(或资源群),如果 你非常熟悉这上面种的不同资源,这将没有多大问题。然而,如果你还不 能肯定哪一个资源最好,你可以使用Wais帮助你找到最好的。

这里正好有一种包括了所有其他资源信息的特殊资源, 它被称作 directory-of-servers。你可以通过检索这种资源来帮助你找到另外的资 源。首先跳到这个资源并录入: /directory-of-servers

接着,通过按SPACE键选择该资源。告诉Wais你准备录入关键词, 按 RETURN键。此时光标将移到关键词行。

现在,你可以使用什么关键词来查找资源,以找到地球上的某个地方? 试录入下面的词: world geography 按RETURN键开始进行检索,Wais便显示你的检索结果:

 

    SWAISSearch ResultsItem

    s:24

    ScoreSourceTitle

--> 001 [1000](directory-of-se)world factbook.src  

21

002 [ 526](directory-of-se)eros-data-center.src94

003 [ 474](directory-of-se)CCINFO.src106

004 [ 368](directory-of-se)unced-agenda.src71

005 [ 368](directory-of-se)world 91a.src26

006 [ 316](directory-of-se)ANU-Pacific-Relations.src

90

007 [ 316](directory-of-se)ANU-Thai-Yunnan.src83

008 [ 316](directory-of-se)ASK-SISY-Software-Information.src

34

009 [ 316](directory-of-se)Arabidopsis-thaliana-Genome.src 

37

010 [ 316](directory-of-se)Connection-Machine.src25

011 [ 316](directory-of-se)Fune-Prog-Abstracts.src23

012 [ 316](directory-of-se)POETRY-index.src28

013 [ 316](directory-of-se)Queer-Resouce,src21

014 [ 316](directory-of-se)US-State-Department-Travel-Adviso

rie89

015 [ 316](directory-of-se)comp.doc.techreports.src1

8

<space> selects.arrows move w. for keywords. s for sources.   ? for help

Wais给你找到了大量与之有关的资源,但是这里面只有1 号得分才达 到1000。看看里面有些什么东西,按RETURN键,你就可以看到:


    source

    :version 3

    :ip-address "131.239.2.100"

    :ip name "cmns-moon.think.com"

    :tcp-port 210

    :database name "CIA"

    :cost 0.00

    :cost-unit:free

    :maintainer "bug-public@think.com"

     : subjects  "social  sciences  demographics  politics  CIA

 worldfact  bookpopulation economics imports exports business"

       : description  "Connection  Machine  WAIS  server.   The

 WorldFact  book  by the CIA which contains a good  description

 of  every  country. The  entry for WORLD if also  particularly

 good.

    Descriptions of 249 nations. dependent areas.  and    other

 entries  with  information    on    population.       economic

 condition,imports/exports. conflicts and wars.  and  politics.

 Produced annually by the CIA.

    Search ‘World Factbook' for table of contents.

CIA免费给你提供这样有用的信息不好吗? 好象这正是你所需要的。 按q键(结束翻页程序),此时,你返回到结果屏。

想为你的下一个检索作准备,就需要选择一个新的资源。首先按s 键 返回到资源屏,接着按=键放弃所有选中的资源。(此例中, 我们只选择 一种资源。但是,在开始进行一个新的检索之前,按= 键的确是一个良好 的习惯。)

现在我们需要选择CIA World Factbook资源。想转到这个资源上,请 录入: /world factbook

想选择该资源,按SPACE键;想指定一个新的关键词,按RETURN键。

你将返回到关键词行,但是前面的关键词将仍然显示。要删除它们按 CTRL-U,录入新的关键词: coconut guano

(记住:我们正在寻找一个有椰子和鸟粪的热带地区岛屿。)想开始 进行检索,按RETURN键。下面是检索结果:


    SWAISSearch ResultsItems:25

    ScoreSourceTitle

-->001 [1000](cmns moon think)Glorioso Islands (French posesession)79

002 [ 543](cmns moon think) Juan de Nova Island (French  possess) 83

    003 [ 533](cmns moon think)Navassa Island (territory of the  US) 80

    004 [ 515](cmns moon think)Jhonston Atoll (territory of the  US) 107

    005 [ 515](cmns moon think)Jarvis Island (territory of  the  US) 90

    006 [ 515](cmns moon think)Howland Island (territory of the  US) 99

    007 [ 515](cmns moon think)Baker Island (territory of the US) 95

    008 [ 477](cmns moon think)Soviet Union Geography Total area:467

    009 [ 440](cmns moon think)Palmyra Atoll (territory of the US)79

    010 [ 421](cmns moon think)Tonga Geography Total area: 748  km2286

    011 [ 421](cmns moon think)Niue  ( free  association  with  New Zeal271

    012 [ 412](cmns moon think) Western Samoa Geography Total  area:288

    013 [ 412](cmns moon think)Saint Lucia Geography Total  area:   6290

    014 [ 412](cmns moon think) Philippines Geography Total  area:   3381

    015 [ 412](cmns moon think)French polynesia (overseas territory 288

<space> selects. arrows move. w for keywords. s for sources. ? for help

Wais再次找到大量的条目。但是,只有一条获得高分。要显示这一个 条目按RETURN键,下面就是你所要看到的(有一些省略的空白行):


    CIA World FactbookGlorioso Islands (French possession)

    Geography

    Total area: 5 km2;Land area: 5 km2; includes Ile Glorieuse,

    Ile de Lys.Verte Rocks,Wreck Rock,and South Rock.

    Comparative area: about 8.5 times the size of The  Mall  in

 Washington.DC.

    Land boundaries:none

    Coastline: 35.2 km

    Maritime claims:

    Contituous zone:12nm

    Exclusive economic zone: 200nm;

    Territorial sea: 12nm

    Disputes: claimed by Madagascar

    Climate: tropical

    Terrain: undetermined

    Natural resouvces: guano. coconuts

    Land use: arable land 0%;permanent crops 0%;

    meadows and pastures 0%;forest and woodland 0%;

    other--lush vegetation and coconut palms 100%

    Environment: subject to periodic cyclones

    Note: located  in  the  Indian  Ocean  just  north  of  the

 Mozambique Channel between Africa and Madagascar

    People

    Population: uninhabited

    Government

    Long-form name: none

    Type: French possession administered by Commissioner of the

    Republic Daniel CONSTANTIN. resident in Reunion

    Economy

    Overview: no economic activity

    Communications

    Airports: 1 with runway 1,220.2,439 m

    Ports: none; offshore anchorage only

    Defense Forces

    Note: defense is the responsibility of France

通过检索到的这个信息可以判断,似乎你已经找到了远离你现在这个 家的一个理想的家(只要你能安排 Internet访问)。想退出,你按两次q 键。一次是停止翻页程序,第二次是停止Wais。

选择资源的提示

有时候,使用Wais最难的部分是需要弄清楚使用什么资源。为了帮助 你解决这个难题,在这里介绍两种提示。

第一种提示是用你认为可以帮助你查找资源的关键词,对directory -of-servers资源进行预检索。记住,尽管是预检索, 你也应给出比查找 特定条目更笼统的关键词。你应问自己,什么样的参考种类才有可能包含 我想要的信息?

例如,在我们的例子中,我们想找的是一个与椰子和鸟粪两者都有关 联的地方,因此我们需要一些包含有关于世界地理性情况的参考类型。这 就是为什么我们能成功地用geography和world这两个词来检索directory -of-servers的原因。

使用比你最终目标更高水平的抽象思维,通常是你借助Wais进行成功 检索的先决条件。

第二种提示,是一种实时贮存器。你可以通过匿名FTP取得Wais 资源 文摘,该文摘包括了所有Wais资源的简短描述,并被收入了目录。

快速简便的选择资源的方法是在这个文件中查找。当找到所需目录时, 就可以使用认为是好的那种资源。另外,文件浏览时显得大了些,这是因 为它给出了Wais所能寻访内容的总览。唯一要说明的是:此文摘经常是过 时的,Wais可能查到更新的资源而文摘中并未列出。

你可以通过匿名FTP从kirk,Bond.edu.au下传Wais资源文摘, 并在名 为src- list. txt.文件的/pub/Bond-Uni/doc/wais的目录中查看。 另一 个匿名 FTP 主机为 archive. orst. edu , 它将相同文件贮存在名为 /pub/doc/wais 的目录中(我们在第十二章中讨论过FTP)。

 

WAIS


    当我们想对某个问题的某个细节进行深入研究时,可以去图书馆查阅资料,但不妨请WAIS来帮助一下,或许更快更好。
    简单地说,WAIS是全世界的数据库的查询工具,它涉及的领域相当广泛,这些数据库在Internet上被称之为WAIS资源。
    使用WAIS时,首先要确定使用哪些资源,还要给出适当的“关键词”,WAIS会根据“关键词”进行查询。它将遍历所有被选定的资源,直到找出与“关键词”相匹配的结果并显示出来。
    一、WAIS的由来 WAIS是“Wide Area Information Server(广泛信息查找服务器)”的缩写,是由美国Thinking Machines 公司和Joues&co. 、 Apple Computer 、KPMG Peat Marwick 这四家
在计算机信息反馈及数据库技术领域处于领先地位的公司合作开发的。当初设计它的目的就是为能让人们在计算机所存储的大量信息中以高速高效高质量地检索到自己感兴趣的信息资源。
    二、WAIS的介绍 1、WAIS是怎样工作的 WAIS是采用client/server(客户机/服务器)方式工作的。启动WAIS后,用户在client 侧向server侧出一个查询请求,server侧则检索服务器内所有的信息,并将检索结果通过客户机显示给用户。 WAIS服务器是怎样检索的呢?它是根据用户的查询请求,找到选择的资源(这些资源也许就是本服务器上的,也许是与本服务器相连的其它服务器上的资源),在 该资源内检索。例如文本文件,WAIS不仅检索它们的标题,还要对内容逐字检索。最后通过客户机显示检索结果。其中,每篇文献都会有一个分值,表示文献与“关 键词”的匹配程度。这个分值是归一化的,最高为1000,其它按比例减小。 值得一提的是,WAIS的“相关反馈"(relevance feedback ),即WAIS客户程序允许用户将一次查询的结果用于下一次查询。当用户得到一篇文献后,发现只有一段文字 甚至一句话是自己感兴趣的,那么请保留它,让它成为继续查询的线索,检索出更加令人满意的答案。 2、WAIS的使用 由于WAIS是采用client/server方式的,要使用它就要有WAIS客户程序。 如果用户的本地机上安装WAIS 客户程序,用户可以直接访问WAIS服务器。 如果用户的本地机上没有安装WAIS 客户程序,用户可以使用“telnet ”软件通过远 称登录到公共WAIS服务器上。 现在,登录进我们的用户服务器noya.bupt.edu.cn来看一看WAIS。
    (一)、进入WAIS 当登录进noya,会有的一段欢迎词及所起服务简介展现在您面前:
Welcome to BUPT Campus Network!
Service available now include Anonymous FTP,TELNET,MAIL,WWW,GOPHER,WAIS,
WHOIS, NEWS,BBS...For example:
MAIL: mailx foo@bupt.edu.cn pine
Anonymous FTP: ftp ftp.bupt.edu.cn (login:ftp; passwd your emailaddress)
GOPHER: gopher gopher.bupt.edu.cn
WWW: lynx http://www.bupt.edu.cn
BBS: telnet bbs.bupt.edu.cn ( login bbs ;you need chinese platform!!)
Usenet(News): tin
WAIS: waissearch -h wais.bupt.edu.cn -d
swais WHOIS: whois -h whois.bupt.edu.cn
For more info. You can see some reference books, or just contact nic@bupt.edu.cn

可以看到有关WAIS使用格式的简介,其中的swais是UNIX系统下字符界面的WAIS。
有时需要先告诉系统你的终端类型:vt100,再启动swais。 noya% set term=vt100
noya% swais
   (二)、使用WAIS 启动swais后,屏幕上会出现一个资源清单:
SWAIS Source Selection Sources: 529
# Server Source Cost
001: [ archie.au] aarnet-resource-guide Free
002: [ndadsb.gsfc.nasa.gov] AAS_jobs Free
003: [ndadsb.gsfc.nasa.gov] AAS_meeting Free
004: [ munin.ub2.lu.se] academic_email_conf Free
005: [ sv3.cnusc.fr] acubase Free
006: [ archive.orst.edu] aeronautics Free
007: [ wolfnet.com] afrophile Free
008: [bruno.cs.colorado.ed] aftp-cs-colorado-edu Free
009: [nostromo.oes.orst.ed] agricultural-market-news Free
010: [ wais.oit.unc.edu] alt.gopher Free
011: [ wais.oit.unc.edu] alt.wais Free
012: [ munin.ub2.lu.se] amiga_fish_contents Free
013: [ coombs.anu.edu.au] ANU-Aboriginal-EconPolicies $0.00/minute
014: [ 150.203.76.2] ANU-Aboriginal-Studies-L $0.00/minute
015: [ coombs.anu.edu.au] ANU-Aboriginal-Studies $0.00/minute
016: [ 150.203.76.2] ANU-ACT-Stat-L $0.00/minute
017: [ coombs.anu.edu.au] ANU-Ancient-DNA-L $0.00/minute
018: [ 150.203.76.2] ANU-Ancient-DNA-Studies $0.00/minute
019: [ 150.203.76.2] ANU-Asia-Pacific-Security-L $0.00/minute
020: [ 150.203.76.2] ANU-Asia-WWW-Gopher-News-L $0.00/minute
021: [ coombs.anu.edu.au] ANU-Asian-Computing $0.00/minute
022: [ coombs.anu.edu.au] ANU-Asian-Religions $0.00/minute
023: [ 150.203.76.2] ANU-Asian-Settlements $0.00/minute
024: [ coombs.anu.edu.au] ANU-AustPhilosophyForum-L $0.00/minute
025: [ 150.203.76.2] ANU-Austral-SocPol-Theory-L $0.00/minute
026: [ coombs.anu.edu.au] ANU-Australia-NZ-History-L $0.00/minute
027: [ coombs.anu.edu.au] ANU-Australian-Economics $0.00/minute
Keywords: selects, w for keywords, arrows move, searches, q quits, or ?
这一清单中,Source Selection ………… WAIS资源选择屏幕标题
Source:529 ………… WAIS客户机所知道的资源有529个
# ………… WAIS上资源的序号
Server ………… 资源所属的服务器
Source ………… 资源的名称
Cost ………… 访问此资源要付的费用,Free为免费。
后面列出可供选择的资源,资源的名称以字母顺序循环排列。 我们可以用k(小写j )向下移动、k(小写k)向上移动来选择资源。之后是“keywords:
”,就在此输入用户指定的关键词。 屏幕底部列出了swais的几条帮助命令:
………… 选择确定时按键
w (小写w) ………… 按w键后可键入关键词
arrows ………… 用箭头移动光标
………… 按键后系统进行检索
q (小写q) ………… 退出系统
? ………… 提供帮助信息
我们以选择第14项资源为例。将光标移动至第--项,按键,这时会出现一个“*”在序号后面,表示该资源被选。若再按一次键,将取消对该资源的选择。
014: * [ 150.203.76.2] ANU-Aboriginal-Studies-L $0.00/minute
屏幕底部的提示信息变为
Enter keywords with spaces between them; to search; ^C to c
之后,在“keywords:”处输入“education”,并按键,检索开始,依次显示连接信息
Initializing connection...
Searching ANU-Aboriginal-Studies-L.src...
Find 9 items 稍后便出现查询结果清单。
SWAIS Search Results Items: 9
# Score Source Title Lines
001: [1000] (ANU-Aboriginal-) World Indigenous Peoples' Conference, Al 126
002: [1000] (ANU-Aboriginal-) World Indigenous Peoples' Conference, Al 126
003: [ 858] (ANU-Aboriginal-) VOICES OF EXPERIENCES CONFERENCE 173
004: [ 143] (ANU-Aboriginal-) Coombspapers FTP archive - now 3 years o 182
005: [ 143] (ANU-Aboriginal-) 'This El Dorado of Australia' - 1994 boo 83
006: [ 143] (ANU-Aboriginal-) AIATSIS seminars 89
007: [ 143] (ANU-Aboriginal-) BOOK>Knowledge and Secrecy in an Aborigi 177
008: [ 143] (ANU-Aboriginal-) Re: L.J. Matson biographical details 33
009: [ 143] (ANU-Aboriginal-) Re: Majordomo results: C.R. Cole biograp 39
selects, arrows move, w for keywords, s for sources, ? for help
清单中,“Search Results”是标题:查找结果,公有9项;“#”是文献序号;
“Score”是表示文献与关键词匹配程度的分值;“Source”是文献出自何资源;“Title”是文献的题目;“Lines”文献的行数。如选中其中第5篇,并按
键,经获取信息:
Getting "'This El Dorado of Australia' - 1994 book byAnne Smith" from ANU-Aboriginal-
这篇文献就会出现在屏幕上:
SWAIS Document Display Page: 1
From owner-aboriginal-studies-l@coombs.anu.edu.au Mon Oct 3 20:00:08 1994
Received: by coombs.anu.edu.au
(1.37.109.8/16.2) id AA13277; Mon, 3 Oct 1994 20:00:08 +1000
Return-Path: Received: from [150.203.147.23] by coombs.anu.edu.au with SMTP
(1.37.109.8/16.2) id AA13272; Mon, 3 Oct 1994 20:00:03 +1000
X-Sender: tmc407@coombs.anu.edu.auMime-Version: 1.0
Content-Type: text/plain; charset="us-ascii"Date: Mon, 3 Oct 1994 20:05:43 +0100
To: aboriginal-studies-l@coombs.anu.edu.au
From: Paul Turnbull (by way of T. Matthew Ciolek )
Subject: 'This El Dorado of Australia' - 1994 book by Anne Smith
Sender: owner-aboriginal-studies-l@coombs.anu.edu.auPrecedence: bulk
Reply-To: aboriginal-studies-l@coombs.anu.edu.auForwarded from -----------------
'This El Dorado of Australia': A Centennial History of Aramac Shire.
By Dr Anne SmithHrdbck A$50 PBk A$25 ISBN 86443 5207
The title of this book is taken from the report in which the explorer Sir
Thomas Mitchell, proclaimed it the finest pastoral country he had ever
seen. It was the prospect of wealth through sheepgrazing that brought
settlers swarming into North Queensland immediately it was opened in 1861.
Much of the region quickly proved unsuitable for sheep and had switched to
cattle by 1870. For the subsequent half century, and again since the Second
World War, mining has been more important in the North's economy than
pastoralism.
Aramac is one North Queensland Shire which has remained wholly pastoral and
predominantly wool producing down to the present; it has never experienced
even an interlude of mining. Its history is essentially that of wool
production in a district handicapped by remoteness and by climaticextremes.
Press any key to continue, 'q' to quit.
(三)、对文献的管理 当得到一些好文章时,也许情不自禁要得到它们。那么,我们可以通过几个简单命令来管理它们。
1、S(save)命令—保存文件命令:当按下S(大写s)键,会出现一个对话框:
File:
Enter the filename into which to save this item; ^C to cancel
给文件起个文件名(系统缺省为swais中的文件名),便将它保存在当前目录下。
2、m(mail)命令—发送邮件命令:当按下m(小写m)键,会出现个对话框: Address:
Enter your e-mail address; ^C to cancel
这时,键入自己的或者好朋友的电子邮件地址,邮件便会发送出去。
3、s(select)命令—重新选择资源命令:了解了一个资源情况,又想知道其它资源的情况,按下s(小写s)键,就会返回开始的资源选择状态。
4、o(options)命令—显示及修改WAIS的系统参数:在使用WAIS时,可以按照自己的需要改变系统参数。按下o (小写o )键,屏幕会显示出参数列表:
SWAIS Option Settings Options: 6
# Option Value
001: widetitles off
002: sortsources on
003: sourcedir /export/home/zhangyan/wais-sources/
004: commondir /usr/lib/wais-sources/
005: pagerpause on 006: maxitems 40
Show wide Item titles on Results Screen by omitting source name
to change, arrows to move, s for sources, r for r
其中,widetitle项提供Internet的名称或服务器的地址。 maxitems项
决定WAIS在返回前最多要找到多少条信息匹配。修改时,将光标指到该项或键入标号,再由 搜索状态,然后在提示下输入新值。(四)、命令列表
为方便用户学习使用WAIS,列出命令简表。
SWAIS Source Selection Help Page: 1
j, down arrow, ^N Move Down one source
k, up arrow, ^P Move Up one source
J, ^V, ^D Move Down one screen
K, v, ^U Move Up one screen
### Position to source number ##
/sss Search for source sss, Select current source
= Deselect all sources
v, View current source info Perform search
s Select new sources (refresh sources list)
w Select new keywords
X, - Remove current source permanently
o Set and show swais options
h, ? Show this help display
H Display program history
q Leave this program远程登录
当用户的本地机上没有安装WAIS的客户程序时,可以用“telnet”软件远程登录到公共WAIS服务器上。
我们通过远程登录到公共服务器sunsite.unc.edu上,并以swais登录,简单介绍一下“telnet”:
noya% telnet sunsite.unc.edu 之后,出现连接信息 Trying 198.86.40.82 ...
Connected to calypso-too.oit.unc.edu.Escape character is '^]'.
***************** Welcome to SunSITE.unc.edu *****************
SunSITE offers several public services via login. These include:
NO MORE PUBLIC gopher login!
Use lynx the simple WWW client to access gopher and Web areas
For a simple WAIS client (over 500 databases), login as swais
For WAIS search of political databases, login as politics
For WAIS search of LINUX databases, login as linux
For a FTP session, ftp to sunsite.unc.edu. Then login as anonymous
For more information about SunSITE, send mail to info@sunsite.unc.edu
UNIX(r) System V Release 4.0 (helios)login: swais (以swais登录)Password:
Last login: Tue Mar 5 01:11:46 from 157.80.68.202
University of North Carolina Office For Information Technology
in cooperation with Sun Microsystems, Inc.
Materials available via this id are subject to the statements in
DISCLAIMER.readme found in the anonymous ftp area or on the main menu
of the SunSITE.unc.edu gopherYou could be running this code on your own machine.
You'll find it and other WAIS stuff available via anonymous ftp
from SunSITE.unc.edu in the pub/packages/infosystems/wais directory.
These databases are also available via gopher.
Just point your gopher client to sunsite.unc.edu 70
and enjoy using these databases from your gopher interface.
you're probably a vt100 or should beTERM = (unknown) vt100 (输入终端类型vt100)
It takes a minute to load all the database information
在“Term”后键入“vt100”并回车则进入该服务器的客户程序。
SWAIS Source Selection Sources: 82
# Server Source Cost
001: [ sunsite.unc.edu] alt-sys-sun Free
002: [] American-Music-Resource Free
003: [] avi_files Free
004: [calypso] bush-speeches Free
005: [] carter-oh Free
006: [] clinton-speeches Free
007: [] clinton-speechess Free
008: [ sunsite.unc.edu] Community-IdeaNet Free
009: [] Davis-eis-cds Free
010: [] Davis-eiscds Free
011: [] Davis-music-eam Free
012: [] Davis-music-jazz Free
013: [] Davis-music-rbr Free
014: [] Davis-music-vids Free
015: [calypso-2.oit.unc.ed] Dr-Fun Free
016: [] eisenhower-oh Free
Keywords:

selects, w for keywords, arrows    move, searches, q quits, or ?
之后的使用方法请参考“WAIS的使用”部分。 由于是远程登录,用户在公共WAIS服务器上没有私人帐号,所以“S”命令不能使用,其它命令依旧。
注意:由于公共WAIS的数量是在不断变化的,而且许多地址本身也会改变,所以在入网时,有可能某地址会关闭,那么换一个试一试。