转载链接
注:每年的课件可能会有更改,内容不一样,所以读者复习的时候以所在年份的课件为准
?
都是大题,没有选择题。
- 简要说明Morris算法的主要思想
- 最后估算的结果是f?i, 期望是fi,方差是fi的平方,分析估算的误差
- 请从不同的节点说明为什么指针的个数要比键值的个数多1
- 将<1,2,3,4,5,8>组成一个合理的B+树
- 在上一问的B+树插入6,7画出每一次插入二叉树的状态
?5. 课件上的哈希查找算法,请你给出一个具体的例子并说明这个算法(看课件上的就行)(12分)
?
- gfs采用主从式数据库和其他方法的优缺点,请举出一个其他的结构并和主从式相对比写出他们的优缺点。
- HDFS namenode、datanode、secondary namenode一起协同的工作流程
第一个是单机模型 第二个是spark的executer 第三个是google borgmaster和scheduler
- 写出map和reduce的伪代码
- 分析通信代价和空间代价
- 在此基础上的算法上进行改进,对任意位置上的x 原来的数据A[1到x]黑的个数不小于白色的个数,请设计算法并简要说明他的正确性。
总结:显敏老师的算法一定上课跟着算,要不然考试真的会吃亏,王老师上课讲的比较浅的东西一定要下课多查资料学习,没展开也不一定不需要掌握。
因为时间匆忙,有些东西不是很全,仅供参考。
大数据计算基础笔记