当前位置: 首页 > 图灵资讯 > 技术篇> Hive 与 HDFS 之间的联系、Hive 与 关系型数据库的区别

Hive 与 HDFS 之间的联系、Hive 与 关系型数据库的区别

来源:图灵教育
时间:2023-06-07 09:39:46

1 Hive 与 HDFS 之间的联系

(1)hive 是基于 Hadoop 数据仓库工具可以将结构化数据文件映射成数据库表,并提供完整的数据库工具 sql 可以查询功能 sql 语句转换为 MapReduce 运行任务。它的优点是学习成本低,可以通过类别 SQL 句子快速实现简单 MapReduce 统计数据不需要开发专门的统计数据 MapReduce 应用非常适合数据仓库的统计分析。

(2)Hive 是建立在 Hadoop 上数据仓库基础架构。它提供了一系列可用于数据提取、转换和加载的工具(ETL),这是一种可以存储、查询和分析存储的存储方式 Hadoop 大规模数据的机制。Hive 定义简单的类别 SQL 查询语言,称为 HQL,它允许熟悉 SQL 用户查询数据。同时,这种语言也允许熟悉 MapReduce 开发者的开发是自定义的 mapper 和 reducer 处理内部建筑 mapper 和 reducer 无法完成的复杂分析工作。

2 Hive 与 关系数据库 的区别

使用 hive 命令行接口感觉像是操作关系数据库,但是 hive 和关系数据库还是有很大区别的。我来比较一下。 hive 与关系数据库的区别如下:

  • Hive 不同于关系数据库存储文件的系统,Hive 使用的是 hadoop 的 HDFS(hadoop 分布式文件系统),关系数据库是服务器本地文件系统;
  • hive 使用的计算模型是 mapreduce,关系数据库是自己设计的计算模型;
  • 关系数据库是为实时查询业务设计的, Hive 为海量数据进行数据挖掘设计,实时性差;实时差异导致 Hive 应用场景和关系数据库差异很大;
  • Hive 很容易扩展你的存储能力和计算能力,这是继承 hadoop 是的,在这方面,关系数据库比数据库差得多。

以上都是从宏观角度进行比较 Hive 与关系数据库不同。

3 参考资料

1、为什么要在有Mysql数据库的情况下使用Hive数据库?

2、HIVE 基础介绍 https://www.tulingxueyuan.cn/d/file/p/20230607/ypmqv3ybuye style='background-color: rgb(232, 232, 232); border: 1px solid transparent; margin: 18px 0px;'>