设为首页收藏本站

LUPA开源社区

 找回密码
 注册
文章 帖子 博客
LUPA开源社区 首页 业界资讯 开源资讯 查看内容

谷歌开源大规模语言建模库,探索RNN极限

2016-9-17 19:12| 发布者: joejoe0332| 查看: 764| 评论: 0|原作者: oschina|来自: oschina

摘要: 近日,谷歌宣布开源大规模语言建模模型库,这项名为“探索RNN极限”的研究今年2月发表时就引发激论,如今姗姗来迟的开源更加引人瞩目。研究测试 取得了极好的成绩,另外开源的数据库含有大约10亿英语单词,词汇有80 ...

近日,谷歌宣布开源大规模语言建模模型库,这项名为“探索RNN极限”的研究今年2月发表时就引发激论,如今姗姗来迟的开源更加引人瞩目。研究测试 取得了极好的成绩,另外开源的数据库含有大约10亿英语单词,词汇有80万,大部分是新闻数据。这是典型的产业研究,只有在谷歌这样的大公司才做得出来。 这次开源也应该会像作者希望的那样,在机器翻译、语音识别等领域起到推进作用。

开源部分包括:

  • TensorFlow GraphDef proto buffer 文本文件

  • TensorFlow 预训练 checkpoint shards

  • 评估预训练模型的代码

  • 词汇表

  • LM-1B 评估测试

代码支持 4 种评估模式:

  • 提供数据库,计算模型的 perplexity

  • 提供前缀,预测后面一个单词

  • softmax 嵌入项,字符级别的 CNN 单词嵌入项

  • 输入句子,将转存 LSTM 状态的嵌入项

更多详情查看:开源地址


酷毙

雷人

鲜花

鸡蛋

漂亮
  • 快毕业了,没工作经验,
    找份工作好难啊?
    赶紧去人才芯片公司磨练吧!!

最新评论

关于LUPA|人才芯片工程|人才招聘|LUPA认证|LUPA教育|LUPA开源社区 ( 浙B2-20090187 浙公网安备 33010602006705号   

返回顶部