最近我仔细看了下AlphaGo在《自然》杂志上发表的文章,写一些分析给大家分享。AlphaGo这个系统主要由几个部分组成:1. 走棋网络(Policy Network),给定当前局面,预测/采样下一步的走棋。2. 快速走子(Fast rollout),目标和1一样,但在适当牺牲走棋质量的条件下,速度要比1快1000倍。3. 估值网络(Value Network),给定当前局面,估计是白胜还是黑胜。4. 蒙特卡罗树搜索(Monte Carlo Tree Search,MCTS),把以上这三个部分连起来,形成一个完整的系统。 我们的DarkForest和AlphaGo同样是用4搭建的系统。DarkForest较AlphaGo而言,在训练时加强了1,而少了2和3,然后以开源软件Pachi的缺省策略(default policy)部分替代了2的功能。以下介绍下各部分。 1.走棋网络:走棋网络把当前局面作为输入,预测/采样下一步的走棋。它的预测不只给出最强的一手,而是对棋盘上所有可能的下一着给一个分数。棋盘上有361个点,它就给出361个数,好招的分数比坏招要高。DarkForest在这部分有创新,通过在训练时预测三步而非一步,提高了策略输出的质量,和他们在使用增强学习进行自我对局后得到的走棋网络(RL network)的效果相当。当然,他们并没有在最后的系统中使用增强学习后的网络,而是用了直接通过训练学习到的网络(SLnetwork),理由是RLnetwork输出的走棋缺乏变化,对搜索不利。 毫无疑问,开源技术已经成为当今的主流。据业内估计,2011年至2014年期间,超过180家年轻公司通过他们的软件获得的大约32亿美元融资。今天,甚至主要的企业IT供应商在他们的关键业务上也依赖开源。从之前微软CEO Steve Ballmer称开源Linux操作系统为“癌症”(对微软的确是个威胁)到现在,的确是个很大的转变。 尽管开源软件日益流行,很多开源公司的财务并不健康。就像1990年代末的互联网时代,流量并没有转化成实际的网上购物,成千上万的免费软件下载并没有形成可持续的收入来源。毫无疑问,开源软件是一个才华横溢的提高用户采用率的交付模型,它在未来几年内可以驱动市场价值提升。但是这本身不是一个商业模式。 怎样建立一个大的,有利可图的开源商业?思索一下:考虑到Red Hat(红帽)的成功——现在估值大约140亿美元,成立超过20年——在2008年,MySQL被Sun以10亿美元收购,在开源的历史上,这些都是标志性的事件。 相对于成功的可能性,企业家和投资者都是类似的。我们在开源工作上的经验还包括Mirantis*, Cloudera*,MongoDB* 等等,我们有一些重要的教训给企业家让他们考虑并行构建开源社区和可持续的企业,他们两个不是相互排斥的。 更多本周开源资讯,本次专辑将为您一一呈现…… 据知情人士透露,甲骨文状告谷歌Android侵权案新一轮审理将会在5月9日开庭,届时我们有望听到有关谷歌Android业务的更多“爆炸性”的内幕信息。甲骨文希望说服陪审团令谷歌向其支付数十亿美元损害赔偿。而谷歌则可能会极力说服陪审团,Android操作系统中使用甲骨文Java软件属于版权法中规定的“正当使用”的情况。这意味着谷歌有权免费使用它,而且并不亏欠甲骨文什么。 InfoWorld 在部署、运营和保障网络安全领域精选出了年度开源工具获奖者。BIND, Sendmail, OpenSSH, Cacti, Nagios, Snort -- 这些为了网络而生的开源软件,好些家伙们老而弥坚。今年在这个范畴的最佳选择中,你会发现中坚、支柱、新人和新贵云集,它们正在完善网络管理,安全监控,漏洞评估,rootkit 检测,以及很多方面。 "软件正在吞没整个世界"的说法最先见于2011年。2015年,开源软件替代了这个位置。“如果这个理论推开来,软件吞没世界,那么开源软件将取代之,对吗?”2015年初福布斯还不确定地刺探。 但到年底他们就非常自信地发文“开源软件确实正在吞没整个世界”。 |