大数据评论
大数据审查知识点框架
1.大数据概述:只需回顾一下问题集中的示例。
2.Hadoop:注意单机安装和伪分布式安装的区别,以及Hadoop中块的概念和意义!
3、HDFS:
(1)名称节点的三种数据结构(FsImage、EditLog和内存中的元数据)的构成,以及协作关系!
(2)数据存储策略
(3)数据上传(复制)的过程
(4)数据错误的恢复
4、糖化血红蛋白
(1)HBase数据模型、概念指导、物理视图和列存储。
(2)区域定位的三层映射结构
(3)区域服务器的工作原理
(4)商店的工作原理
(5)HLog的工作原理
5、NoSQL:只复习习题课的例题。
6、MapReduce:
(1)注意基本关系运算(交集、并集、差集、内外左右连接)的MapReduce中Map端、Shuffle运算、Reduce端的设计。
(2)尝试理解作业3和5的MapReduce设计。
6、火花
(1)狭义依赖和广义依赖的概念
(2)阶段的划分
(3)概念3)RDD对“血缘关系”和“懒惰召唤”的理解
(4)4)RDD的操作和各操作的判别(图10-12)
(5)容错模式5)RDD
(6)彻底理解RDD的字数代码(10.5.2)
7、风暴
(1)彻底理解Storm的字数代码(11.4.5)
(2)能够绘制拓扑图。
(3)风暴中各分组策略的区分
内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/84593.html