这个周末不太平,先是新浪微博歇菜了,接着又是苹果官网被人肉DDOS了,很多人都在抱怨由于系统问题导致自己预定多了,卡刷爆了,都是土豪……恰巧前阵子读到了这篇《程序员如何避免故障?》(http://blog.jobbole.com/90102/),虽然讲得东西都不深入,但实用性还是挺高的,至少可以给大家提个醒。其实这种玩意儿就该整成系统设计文档模板的Check List,设计时就多想想,多检查下。
熟悉的朋友一定都知道我有深厚的运维情节,虽然现在不是运维了,但还是很关心运维的事情。比如《阿里巴巴千岛湖数据中心宣布正式启动啦!》(http://mp.weixin.qq.com/s?__biz=MzAxMTM3OTQzMA==&mid=214304938&idx=1&sn=8dbdd489376ce86ee84360b1caf6edfb)。这个机房从外面看起来还真是风景秀丽,下图就是它的全景图。很多人都觉得能沟通过加机器解决的问题都不是问题,但是往往等你到了一个程度后,就没法加机器了,程序员想的是怎么保证分布式的事务和时序,变几个机房后的网络延时,而运维操心的则是机架位,以及背后的供电和制冷,从这篇文章就能看出,全篇都在讲这两个问题,PUE 1.3听起来已经挺美好了。
P.S. 最近花了些时间多了解了下Go语言,还深入敌后,潜入Go语言的微信群,其实就是为了写篇《作为一个Java程序员,我为什么不会在生产中转向Go》,好久没有写长文了,后续会分享给大家的。