若您对图像查询结果还算满意,那么接下来的一步是使用 Terrier 来搜索包含了这些图像的 XML 文档。与 imgSeek 不同,需要从命令行提示符启动 Terrier 的 GUI。请确保已经在计算机上安装了 Java™ 的正确版本。 在它的主窗口,Terrier 只显示了两个选项卡:Search 和 Index。当首次运行 Terrier 时,它聚焦于 Index 选项卡并显示了一个对话框(参见 图 9),询问您是否想要 Terrier 索引它自己的文档或您所选择的文档。 选择想要索引的 XML 文档的文件夹。当重启 Terrier 时,它会将聚焦转移到 Search 选项卡。可以在查询之前,转到 Index 选项卡来重新索引您的文档。 在 Index 选项卡上,选择文件夹以弹出一个窗口,在其中指定 Terrier 应该索引哪些文档。完成后,单击 OK 返回到 Index 选项卡并开始创建索引的过程。 Terrier 并不支持递增索引。每次创建一个索引,Terrier 都将删除旧的索引并从头索引所有指定的文件夹。 在窗口底部可以观察索引过程。Terrier 完成索引后,会将焦点转到 Search 选项卡。 Search 选项卡非常简单,只包含用来输入 Terrier 查询的一个字段。可以使用此查询语言来搜索单个单词或者是词组内的单词。如下的一些例子展示了如何对包含了用 imgSeek 找到的图像的文档进行查询。 此查询会返回包含一个或两个单词的文档,但并不总是会返回同时包含这两个单词的文档。让我们假设第一个单词是 搜索结果可能会以随机的顺序显示这些文档。这有助于辨别哪些文档包含了被错误标签的图像。 第一个单词的权重提高了 2.3,而第二个单词的权重则仍保持为 1。在键入查询时,不要忘记在单词和权重值之间插入一个 ^ 符号。搜索结果会返回总是包含第一个单词但不一定包含第二个单词的那些文档。搜索结果还会首先显示包含了加权词的文档。 与第一个例子中的文档不同,包含了权重为 2.3 的 为了进一步完善搜索,在搜索字段输入第三个单词,比如 也可以通过输入加号作为单词前缀来获得包含了这两个单词的文档。这两个单词可以处于文档的单独位置。它们也不必如同在一个词组内那样相邻。比如, 在寻找包含了第一个单词而不包含第二个单词的文档时,就可以参照这个示例。可以通过在第一个单词前面放上加号,在第二个单词前面放上减号来达到这个目的。如果一个文档既包含第一个单词,也包含第二个单词,那么这个文档将不会出现在搜索结果内。 比如,如果搜索三个单词: |