设为首页收藏本站

LUPA开源社区

 找回密码
 注册
文章 帖子 博客
LUPA开源社区 首页 业界资讯 开源资讯 查看内容

开源应用:30小时下载全部维基百科内容

2013-11-29 14:35| 发布者: joejoe0332| 查看: 2344| 评论: 0|原作者: 张林|来自: ZOL

摘要: 有这么一款开源应用程序,它可以帮助您用30多个小时时间内自动将所有的维基百科下载到你的电脑里。这个程序就是Xowa,软件可以离线显示440多万维基百科文章,并且完整保存HTML格式不变。 ...
  有这么一款开源应用程序,它可以帮助您用30多个小时时间内自动将所有的维基百科下载到你的电脑里。这个程序就是Xowa,软件可以离线显示440多万维基百科文章,并且完整保存HTML格式不变。


开源应用:30小时下载全部维基百科内容
维基百科


  用户也可以设置额外的wiki,像Wiktionary或者Wikiquote,并且支持离线查询。例如,在离线的时候,用户可以点击Wikitionary,并立即查看Wikitionary页面。Xowa已经存在了一段时间,原来只支持维基百科简单的操作。昨天刚刚完成升级,支持全部英文版本维基百科。


  英文版维基百科有大量数据,有1390万页内容,txt文档就超过20GB以及370张图片。设置下载这些东西不是一个很简单的过程,需要80GB空间以及5个小时左右的处理时间,如果想要下载图片,存储空间需要100GB,下载时间也会增加到30多个小时。当下载完成之后,用户会拥有一个完整的、几乎和英文版维基百科一模一样的副本。这些也可以安装到128GB的SD卡中。


  尽管安装期间至少需要80GB硬盘空间,安装之后,可以删除45GB临时文件,清理之后wiki文件最终会减少到25GB左右。除了维基百科数据转储以及来自维基媒体基金会,Xowa主要由XUL运行,Firefox运行环境;JAVA和SWT以及标准窗口小部件工具箱组成。


  如果你想下载,但是又不想花费一整天,Xowa开发者建议从简版维基百科开始。简版维基百科有184000页以及90000张图片。文本内容需要200MB空间,5分钟就可以搞定。如果需要下载图片,也仅仅需要2GB空间,30分钟。简版维基百科可以相当准确的模拟Wikepedia,而且相当小。


酷毙

雷人
1

鲜花

鸡蛋
1

漂亮

刚表态过的朋友 (2 人)

  • 快毕业了,没工作经验,
    找份工作好难啊?
    赶紧去人才芯片公司磨练吧!!

最新评论

关于LUPA|人才芯片工程|人才招聘|LUPA认证|LUPA教育|LUPA开源社区 ( 浙B2-20090187 浙公网安备 33010602006705号   

返回顶部