经典解读:构建大数据体系的底层三根支柱!
发布于 2021-09-26 20:27
编 辑:彭文华
来 源:大数据架构师(ID:bigdata_arch)
彭友们好,我是你的老彭友。
节前小张找我,说想要一个讲大数据底层逻辑的课。我虽然满口答应下来,但这还真不好弄。。。
你想啊,底层逻辑,这是要讲源码吗?那玩意可费时间了!他在某厂里当民工,哪有时间看源码啊。
我琢磨了一下,诶。。。有了!
大家知道我研究东西有一个诀窍,就是学东西一定要学到最源头的地方。有些人学阿里的政委体系,殊不知这是从解放军那边学的。
学阿里根本不如学我党的党史啊!
所以,我找到了这个:
因为最核心的东西,就在其中,一旦看懂,就可以「触类旁通」,从使用到开发,很多细节通过脑补就可以猜个八九不离十。
而且,在如今的互联网时代,到处可见「分布式系统」,尤其是「大数据」时代到来之后,各种优秀的分布式系统层出不穷,但它们实现的本质还是那几篇经典的研究和论文。
其中对分布式系统工程实践领域,贡献最大的公司是 Google,Google 的基础设施有三驾马车,分别是《Google File System》、《Google MapReduce》以及《Google BigTable》。
Google 发表了这三篇论文以后,基本上「奠定」了业界大规模分布式存储系统的理论基础。
现如今非常流行的 HDFS、MapReduce、Hbase,以及国产数据库软件 TiDB、OceanBase 都是参考这几篇经典论文设计的,可见这些基础原理的重要性。
会用某个开源框架,是懂了「基础招式」。看开源框架的源码,是「武功秘籍」,能让你更高效地 debug。那研读论文,就是真正的「底层心法」。
武功招式可能每年都在更新迭代,但内功心法却不仅只在今时今日有用,更能让你一辈子受益。
这个专栏的作者是徐文浩,简单介绍下,他是 bothub.ai 创始人,一个创业的程序员,正在工业界的实战经验非常丰富。写过各种大型企业软件,从零开始搭建支撑每天百亿流量的广告算法系统,提升了十倍以上的广告收入和 ROI。
这个论文解读课,总结来说,就是让你从经典论文入手,提升问题解决能力。
本文来自网络或网友投稿,如有侵犯您的权益,请发邮件至:aisoutu@outlook.com 我们将第一时间删除。
相关素材