设为首页收藏本站

LUPA开源社区

 找回密码
 注册
文章 帖子 博客
LUPA开源社区 首页 业界资讯 软件追踪 查看内容

jiebaR 0.3发布,R语言中文分词

2014-12-2 16:39| 发布者: joejoe0332| 查看: 1482| 评论: 0|原作者: oschina|来自: oschina

摘要: jiebaR 中文分词 0.3 版本发布,此版本更新内容如下:编译改进通过 UBSAN 测试。修正 Mac 下的编译警告。完善跨平台支持,现支持 Windows、Linux、Mac、Solaris。Bugs 修正修正 Windows 下的区域设置问题。新功能和 ...

jiebaR 中文分词 0.3 版本发布,此版本更新内容如下:


编译改进

  • 通过 UBSAN 测试。

  • 修正 Mac 下的编译警告。

  • 完善跨平台支持,现支持 Windows、Linux、Mac、Solaris。

Bugs 修正

  • 修正 Windows 下的区域设置问题。

新功能和功能增强

  • 发布到 CRAN,简化安装流程。

install.packages("jiebaR") 
	library("jiebaR") 
	
  • 简化预处理文本的正则表达式,优化性能。

  • 新增快速模式,使用默认设置分词,自动加载 worker() 函数。

library(jiebaR) 
	qseg <= "江州市长江大桥参加了长江大桥的通车仪式" 
	
[1] "江州" "市长" "江大桥" "参加" "了" "长江大桥" "的"  
	[8] "通车" "仪式" 
	
  • 新增分词符号[。

library(jiebaR) 
	qseg[ "江州市长江大桥参加了长江大桥的通车仪式" ] 
	
  • 完善文档说明。

现在还可以查看这个 Shiny 演示应用。其他更新内容请看发行说明


酷毙

雷人

鲜花

鸡蛋

漂亮
  • 快毕业了,没工作经验,
    找份工作好难啊?
    赶紧去人才芯片公司磨练吧!!

最新评论

关于LUPA|人才芯片工程|人才招聘|LUPA认证|LUPA教育|LUPA开源社区 ( 浙B2-20090187 浙公网安备 33010602006705号   

返回顶部