缓存是新的内存

2014-11-24 11:29| 发布者: joejoe0332| 查看: 4473| 评论: 0|原作者: douxingxiang, stefanzhlg|来自: oschina

摘要: 这是一次在 defrag 2014的演讲。这是经过长时间地多次技术变革后的（多个）技术优势之一。你看到了实际上突破。如果你只是看到了其中的一部分，很难正确推断。你要么短期有进展，要么落后很远。令人惊讶的不是事物 ...

　　所以下一个添到这张图上的复杂工具是什么呢？也许真正的方法是能简化事情的。

　　例如内存：在数据库机器上有很多内存，用做缓冲和计算；Memcached机器上也有很多内存。这些系统中的内存总和至少跟你的工作数据集一样大。如果不是，你就赚到了(under-bought，低阶买到好货)。而且，我非常怀疑你的缓存层是否100%高效。我打赌你有大量数据在被替换掉之前没有被读取过，我还打赌你从来没跟踪过。这不意味着你是个坏孩子，而意味着缓存比起其所值，更是个麻烦。

　　这些组件共有的很多特性看起来，是可以相互组合，并且互补的。只要它们被安排得合理。

Screen Shot 2014-11-11 at 3.48.07 PM

　　一旦你采用下面的公理：系统应该是分布式的，而数据应该是数字化的(solid-state是纯电气的，而不是mechanical机械式的)，有意思的事情出现了：模型更简单了。在查询触发时才会用到的临时内存数据结构是仅有的结构。随机访问不再是大罪，而是商业的正常过程。你不必担心分页，或者再均衡(rebalancing)，或者数据的位置。

Screen Shot 2014-11-11 at 3.48.13 PM
(2014：SQL内存集群解决一切)

　　这是个优美、简单的架构。就像负载均衡器抽象了应用程序服务器，SQL聚合器(aggregators)抽象了读写的组织细节。把数据存放策略的核心放在稳定的API之下，可以在少量中断的情况下允许两边变化。

Screen Shot 2014-11-11 at 3.48.24 PM

　　现在，一切都好了，我们最终到达了历史最后的美好之地，对吧？

Screen Shot 2014-11-11 at 3.48.30 PM

　　不管你在何时，对计算艺术状态的自满都是错误的。总会有其他瓶颈。

Screen Shot 2014-11-11 at 3.48.35 PM

　　这是AMD的Barcelona芯片，相当现代化的设计。它有4个核，但是大部分表面都被缓存和核心(core)周围的I/O区域占据，就像WalMart周围的大型停车场一样。奔腾时代，缓存区域只占晶圆(die)的15%。第三次计算领域的革命在于，CPU相对于内存快了多少。因此晶圆上大片昂贵的区域都为缓存保留着。

　　过去，数据库性能的主要关注点在内存和硬盘的延迟，现在我们打趣CPU和内存的延迟不是同样的问题，但是它确实是。