设为首页收藏本站

LUPA开源社区

 找回密码
 注册
文章 帖子 博客
LUPA开源社区 首页 开源热点 查看内容

LUPA开源周刊:微软将垄断开源系统工具?

2019-5-21 14:26| 发布者: joejoe0332| 查看: 8697| 评论: 0|原作者: LUPA开源社区|来自: LUPA开源社区

摘要: Build 2019上微软的开源动作有点不一样  微软今年举办的 Build 开发者大会可谓是抢足风头,大会第一天就放了不少大招:宣布新的命令行终端 Windows Terminal、Windows 10的Linux子系统WSL 2将运行真正的Linux内核 ...


  微软刚刚宣布开源一项 Bing 搜索背后的关键算法——SPTAG,它使 Bing 能够快速将搜索结果返回给用户。仅在几年前,网络搜索很简单,用户输入几个关键词并浏览结果页面。


  今天,相同的用户可能会在手机上拍照并将其放入搜索框中,或使用智能助手提问,而无需亲自触摸设备。他们也可能会输入一个问题并期待一个实际的答复,而不是一个可能答案的页面列表。

  SPTAG (Space Partition Tree And Graph)是分布式近似最近邻域搜索(ANN)库,为大规模矢量搜索场景提供高质量矢量索引构建、搜索和分布式在线服务工具包。利用 SPTAG 算法作为开源 Python 库的核心,Bing 能够在几毫秒内搜索数十亿条信息。

  当然,矢量搜索本身并不是一个新想法,微软所做的是将这一概念应用于深度学习模型。首先,团队采用预先训练的模型并将数据编码到矢量中,其中每个矢量代表一个字或像素。然后使用新的 SPTAG 库生成向量索引。随着查询的进入,深度学习模型将该文本或图像转换为向量,该库紧接着就能在索引中找到最相关的向量。

  微软表示,SPTAG 库迄今已对超过 1500 亿条数据进行了编目,包括单个单词、字符、网页代码段和完整查询。“Bing 每天处理数十亿个文档,现在的想法是将这些条目表示为向量,并搜索这个 1000 亿以上向量的巨大索引,以便在 5 毫秒内找到最相关的结果”。更多相关内容,请大家关注本次专辑……

  英特尔近日发布了专为开发者打造的 Clear Linux 版本。Clear Linux 追求在英特尔®架构上具有最佳性能,为开发者提供实用工具及工作流程,从而加速软件开发工作的进行。


  Clear Linux 开发者版本的优势有:简化的开发工具和工作流程。英特尔利用开源及跨平台技术,帮助开发者提高生产力。另外,开发者只需使用一个指令(`basic` bundles),就能获得多种用途的相关开发工具,像是是 C 语言或容器应用开发等。

  快速编译代码的能力。目前正运行最新的编译器 GCC 9,并且将在 GCC 10 可用时立即转移。英特尔表示,一直以来 Clear Linux OS 都在积极应用编译器标记(Compiler flags)来优化构建。

    与上游保持同步。Clear Linux 采用滚动更新,其核心会保持与上游 Linux 核心接近。英特尔会通过在上游提交更新的方法,让 Clear Linux 尽快使用英特尔 CPU 的所有功能 —— 这个做法同时对整个 Linux 生态也有贡献。更多内容,请关注本次专辑……
 
  近日,IBM 研究院发布了自动为新闻播报生成字幕 AI 模型的研究报告。据两项测试实验的结果显示,该语音识别系统的错误率分别为 6.5% 和 5.9%,而人类识别的错误率分别为 3.6% 和 2.8%。


  早在两年前,IBM 就已经创造了对话式电话语音领域(CTS)转录的性能记录。在这个领域,语音识别系统需要做的工作很多。例如,系统必须处理失真、以及来自多个不同电话通道的即兴演讲,并且这些对话式语音还可能有多个对话者重叠、中断、重新开始或重复确认的情况。

  新闻播报(BN)的语音识别任务也很有挑战性。语音识别系统需要处理多种说话风格、背景噪音以及广泛的新闻领域内容。一些情况下系统还得处理多种题材混合的语音材料 —— 像是现场采访、电视节目的剪辑内容等。

  为了成功地识别复杂的语音内容、给新闻播报内容生成字幕,IBM 研究团队通过语音识别技术,建立了一套深度神经网络。该深度神经网络在整合了长短期记忆网络和深度残差网络(residual network,ResNet)的基础上,结合了辅助的语言模型。更多内容,请关注本次专辑……


酷毙

雷人

鲜花

鸡蛋

漂亮
  • 快毕业了,没工作经验,
    找份工作好难啊?
    赶紧去人才芯片公司磨练吧!!

最新评论

关于LUPA|人才芯片工程|人才招聘|LUPA认证|LUPA教育|LUPA开源社区 ( 浙B2-20090187 浙公网安备 33010602006705号   

返回顶部