1. 目的:了解什么是分布式SQL计算;了解什么是Apache Hive
2. 使用Hive处理数据的好处
3.?什么是分布式SQL计算?
以分布式的形式,执行SQL语句,进行数据统计分析。
4. Apache Hive是做什么的?
很简单,是一款分布式SQL计算的工具,将SQL语句翻译成MapReduce程序,从而提供用户分布式SQL计算的能力。
基于MapReduce构建分布式SQL执行引擎,主要需要有哪些功能组件?
Hive是单机工具,只需要部署在一台服务器即可。Hive虽然是单机的,但是它可以提交分布式运行的MapReduce程序运行。
第四章-04-[实操]Hive在VMware虚拟机中部署_哔哩哔哩_bilibili
步骤1: 安装MySQL数据库(部署MySQL数据库,并配置root账户密码)
步骤2: 配置Hadoop(下载Hive上传并解压和设置软链)
步骤3: 下载解压Hive
步骤4: 提供MySQL Driver包(下载MySQL驱动jar包放入Hive的lib目录)
步骤5: 配置Hive(修改配置文件 (hive-env.sh和hive-site.xm)
步骤6:?初始化元数据库(启动hive的metastore服务:前台/后台启动)
步骤7:?启动Hive(使用Hadoop用户)(bin/hive)
第四章-05-[可选]在阿里云上部署Hive_哔哩哔哩_bilibili
第四章-06-[可选]在UCloud云上部署Hive.mp4_哔哩哔哩_bilibili
目标:体验在Hive中使用SQL来处理数据
目标:理解HiveServer2的作用;掌握使用Beeline客户端连接Hiveserver2操作Hive???????
目标:掌握使用DataGrip链接Hive使用;掌握使用DBeaver链接Hive使用