» «

RSS订阅


    抓虾    pageflakes
    Rojo    google reader
    netvibes    my yahoo
    newsgator    blogdtnes
    鲜果    哪吒
    有道

Linux下第一款高效桌面搜索软件:GSearch

来源: LUPA开源社区
发布时间: 2007-04-16 10:39 作者: webmaster 来源: Linux公社 版权申明 向LUPA投递新闻

字体: | 上一篇 下一篇 | 打印


文章来源于http://www.lupaworld.com
  中国科学院计算技术研究所龚才春博士开发了Linux平台下第一款高效桌面搜索软件--GSearch。

  gsearch是Linux平台下第一款高效桌面搜索软件。gsearch采用了高效并行硬盘扫描算法,实现Linux下文件系统的高速扫描和索引。gsearch使用高效索引实现文件属性信息的快速搜索,采用高效的模式匹配算法实现文本文件内容的搜索。gsearch对文件属性信息的搜索一般在只需要几毫秒,对文件内容的搜索视候选结果文件的数量和大小,搜索时间在100毫秒到10秒不等。gsearch在搜索时耗费内存一般在1M左右,对文件内容的搜索时耗费内存在5M左右,运行结束后不占用任何内存。

  gsearch是Linux平台下第一款快速桌面搜索软件,gsearch桌面搜索整合了高效的硬盘扫描技术和先进的索引技术,实现对Linux文件系统的快速扫描和索引;gsearch采用最先进的模式匹配算法实现文件内容的快速搜索,既保证了搜索的快速,又不会耗费太多宝贵的硬盘空间和内存空间。gsearch具有如下特点:
功能强大:支持多关键词检索、通配符模糊检索、精确检索、复合检索、文件类型检索;支持文件内容检索;支持用户设定索引目录。

  性能卓越:一般搜索可在数毫秒内完成,复合查询也可在不超过20毫秒的时间内完成,对文件内容的搜索一般也可在几秒钟内完成。对含有80多万文件、容量为1000G的硬盘,扫描和索引整个硬盘文件系统只需要12秒左右。

  短小精悍:用不到95K的程序完成本地文件系统的快速扫描、高效索引、查询解析、文件检索、结果过滤、结果显示等操作。对一般用户的机器建立索引,索引文件总共在30M左右,运行时消耗内存不超过5M。

  配置方便: gsearch用户可以非常方便地实现各种配置,包括扫描目录的配置、扫描频率的配置、文件类型的配置等。

  gsearch是一款功能强大、性能卓越的Linux平台的桌面搜索软件,第一版已经完成如下功能:

支持通配符模糊搜索;
支持文件系统快速索引;
支持文件内容的快速搜索;
支持一个或多个关键词(单词、字母组合、字母、数字、汉字)搜索;
支持后缀名搜索(以点号.标志后缀名);
支持包含关键词、待搜索目录、文件修改时间和文件大小等的复合检索;
支持文件类型搜索(文本文件、图片文件、音视频文件、可执行文件);
支持用户选择特定目录进行索引和检索;
支持定期索引和手动索引。

  gsearch由中国科学院计算技术研究所信息智能与信息安全中心龚才春博士设计和开发,对gsearch有任意意见或建议,均可与作者联系。作者Email为:gongcaichun@hotmail.com; 更多信息请访问作者维护的gsearch官方网站:www.gongcaichun.info,有全部源代码和开发文档提供。
文章来源于http://www.lupaworld.com

声明:LUPA开源社区刊登此文只为传递信息,并不表示赞同或者反对。

查看全部评论(10) 最新评论

  • 删除 Guest (2008-6-07 05:53:03, 评 3 分) 支持 反对

    还可以,比kind 强太多

  • 删除 Guest (2007-5-03 18:42:14, 评 -1 分) 支持 反对

    口气大大。不过速度也不是非常快啊。

  • 删除 yetist (2007-4-21 20:43:34, 评 0 分) 支持 反对

    难以想像, 龚博士是如何编译过去的.

  • 删除 sanool (2007-4-20 15:08:46, 评 0 分) 支持 反对

    该篇资讯是从论坛导入的  所以需要到论坛参与评论
    请勿以博士之心度君子之腹

  • 删除 gongcaichun (2007-4-20 09:52:40, 评 0 分) 支持 反对

    某些所谓官员才是做坏事怕别人说,自己发表的资讯还不让人评论,自己在网站上发出“Gsearch项目令人失望 linux开源软件行业太浮躁”的评论,却不让人评论,无耻啊无耻啊。

  • 删除 gongcaichun (2007-4-20 09:50:05, 评 0 分) 支持 反对

    GSearch作者龚才春博士回应某些网站对gsearch的恶意中伤

    近日有不少网站报导了gsearch桌面搜索发布的消息,也有不少网友对gsearch桌面搜索进行评论。龚才春对于善意的批评和建议从来都是虚心接受的,对于gsearch的恶意中伤和对于某些Linux委员会的政府官员的无知指责则是不能容忍的。

    首先,龚才春再次强调gsearch的实现原理:gsearch采用了高效并行硬盘扫描算法,实现Linux下文件系统的高速扫描和索引。gsearch使用高效索引实现文件属性信息的快速搜索,采用高效的模式匹配算法实现文本文件内容的搜索。所有gsearch桌面搜索的宣传材料第二句就说明了gsearch的实现原理,作者根本没有隐瞒gsearch未对文件内容建立索引的事实。相反,龚才春反复强调:这个不是gsearch的bug,而是gsearch的创举。

    gsearch是在火速桌面搜索的基础上开发出来的。作者龚才春以不同方式调查了300多位网友对桌面搜索的需求。结论是非常明显的:桌面搜索不应该索引文件内容全文,对于这点,大家可以参考一下龚才春在实验室做的一个报告--gsearch和火速桌面搜索的技术内幕,在龚才春网站上有下载。

    至于为什么没有必要建立全文索引,大致有这么几点理由:

    其一:索引文件内容全文耗时巨大,资源占用非常严重。google桌面搜索第一版在我台式机上测试结果索引耗时8小时,索引文件大小将近900M,后台索引程序占用51M内存,新版本对我另外一台文件数目较少的机器测试结果,索引耗时52分钟,索引文件300M,后台索引进程占用21M。已有cpu空闲就启动索引进程。

    其二:索引文件内容全文对用户机器硬盘损伤非常大,这个不用解释,当你知道一个程序时刻扫描你硬盘文件内容的时候,有80%的用户不愿使用了。我认识的很多人就是由于Google桌面搜索占用的资源和对硬盘的频繁扫描而不用google桌面了。

    其三:用户真正需要感兴趣的文件更高概论处于编辑中,因此用户感兴趣的文件内容更容易过期。基于全文索引模式的桌面搜索引擎不可能解决索引更新问题。

    其四:用户95%以上的查询是对文件名的查询,或者对文件名有特定模式。

    其五:桌面搜索是搜索用户自己机器,因此用户一般对自己机器的文件结构比较了解,如果用户一般都知道搜索结果应该有的特征,如在某个特定盘符或目录下,某些特定后缀,文件名中含有特定模式,修改时间等。利用这些特征加全文实时扫描,速度完全可以满足用户需求。大家可以试用一下快乐超级搜索,虽然没有全文索引,对全文搜索还是比较快的。

    因此,普通用户根据不能接受拿出几十M内存,几百M上G甚至好几G的硬盘空间,频繁的硬盘文件读写来满足搜索的需要,更不要说全文索引时的用户隐私问题。当用户知道商业桌面搜索的代价后,几乎所有用户都不觉得得不偿失。gsearch和快乐超级搜索的这种搜索方式目前也已经得到商业桌面搜索公司的认可。毕竟普通用户不是搜索引擎提供商,把web搜索引擎的技术直接拿到桌面搜索领域应该是Google、Baidu、Yahoo等公司对桌面搜索用户体验没有认真分析的结果。

    对于第一第二的问题,我觉得完全是某些网友和某些官员、某些负责人的睁着眼睛说瞎话。龚才春每次都是强调又强调gsearch的高效,gsearch从来不去争论桌面搜索第一第二的问题,但是强调gsearch这种搜索模式的首创性。不论是在linux平台,即使是在windows平台,gsearch的windows版本-快乐超级搜索的搜索模式也正在日益为大家接受。某些人墨守成规,只用了google桌面、百度硬盘就认为那是桌面搜索,这才反应了这些人的浮躁和无端指责。

    对gsearch的无端指责也反应了中国的某些所谓官员的无知和两面三刀的本性,连linux社区都没有一片净土。某些所谓浙江省Linux专业委员会副主任的人,当着龚才春就说“很高兴看到Linux平台下第一款高效桌面搜索软件Gsearch发布。在此我向您表示忠心的祝贺。感谢您填补了Linux系统本地搜索软件的空白。LUPA开源社区愿意提供更多的支持。”,背着龚才春就在自己网站上大放厥词:Gsearch项目令人失望 linux开源软件行业太浮躁,这就是中国官员的丑恶嘴脸。这种人,一方面千方百计跟龚才春联系,索求桌面搜索的文档和其它材料,寻求龚才春的帮助,一方面又背着龚才春在网站上兴风作浪,恶意中伤gsearch,这才是官员的中山之狼的本性,这种就是东郭先生救过的狼。

    gsearch确实有很多问题,也不排除代码中还存在bug,龚才春把gsearch源代码奉献出来,免费提供所有源代码和详细开发文档,就是要借助linux开源的特点,让大家来规范、完善,使gsearch越来越好。何来“浮躁之风盛行”??如果gsearch没有详细测试,报一些类似浮夸风时候的“一亩地产稻子10万斤”,那才可以称为浮躁。

    至于被某些网友和linux社区负责人指责的“gsearch没有做好国际化,代码中居然采用中文注释”的问题,龚才春的回应如下:gsearch桌面搜索和快乐超级搜索一样,目前都是针对中文平台开发的,英文版本的桌面搜索比这个简单多了,英文桌面搜索的难度和中文桌面搜索的难度根本就不可同日而语,所以gsearch目前是面向中国用户的,不是给美国人看的。将来如果要改成英文版本是非常简单的事情。采用中文注释不能表明龚才春的英文水平很差。

    至于gsearch桌面搜索没有采用图形界面,也没有“采用auto系列工作,增加configure支持”的问题,龚才春只想说一句:龚才春解决的是关键技术,提出的和提倡的是一种搜索模式,把gsearch源代码和详细开发文档提供出来后,就有很多专业人士找我联系,希望合作将gsearch做的更好,这其中也包括指责“Gsearch项目令人失望,linux开源软件行业太浮躁”的文章作者。学术界和开源软件界不是娱乐界,龚才春博士也不是芙蓉姐姐,龚才春不需要靠无聊人士的恶评出名。某些所谓官员不是实事求是的调查,不是向专家资讯、而是听信个别对桌面搜索一窍不通的网友,听取个别对信息检索没有深入研究的网友的评论,就在网站上发表类似新闻报导
    一样的评论员文章,这才反应了中国某些所谓官员和负责人的本性,连linux都没有一片净土。

  • 删除 Guest (2007-4-16 20:51:06, 评 0 分) 支持 反对

    在www.gongcaichun.info可以下载

  • 删除 Guest (2007-4-16 13:17:04, 评 0 分) 支持 反对

    說說而已,你還上心了!

  • 删除 Guest (2007-4-16 13:06:13, 评 0 分) 支持 反对

    在哪下啊....


相关阅读:

查看全部评论(10)我来说两句 直接向LUPA提出您的宝贵建议

-5 -3 -1 - +1 +3 +5