设为首页收藏本站

LUPA开源社区

 找回密码
 注册
文章 帖子 博客

Java搜索框架:Aperture

2007-5-8 17:13| 发布者: joejoe0332| 查看: 3333| 评论: 0

  Aperture这个Java框架能够从各种各样的资料系统(如:文件系统、Web站点、IMAP和Outlook邮箱)或存在这些系统中的文件(如:文档、图片)爬取和搜索其中的全文本内容与元数据。它当前支持的文件格式如下:

  • Plain text
  • HTML, XHTML
  • XML
  • PDF (Portable Document Format)
  • RTF (Rich Text Format)
  • Microsoft Office: Word, Excel, Powerpoint, Visio, Publisher
  • Microsoft Works
  • OpenOffice 1.x: Writer, Calc, Impress, Draw
  • StarOffice 6.x - 7.x+: Writer, Calc, Impress, Draw
  • OpenDocument (OpenOffice 2.x, StarOffice 8.x)
  • Corel WordPerfect, Quattro, Presentations
  • Emails (.eml files)

  •   http://aperture.sourceforge.net/

    酷毙

    雷人

    鲜花

    鸡蛋

    漂亮
    • 快毕业了,没工作经验,
      找份工作好难啊?
      赶紧去人才芯片公司磨练吧!!

    最新评论

    关于LUPA|人才芯片工程|人才招聘|LUPA认证|LUPA教育|LUPA开源社区 ( 浙B2-20090187 浙公网安备 33010602006705号   

    返回顶部