本文共 788 字,大约阅读时间需要 2 分钟。
前言:不积跬步无以至千里,不积小流无以成江海 -----《劝学》
Sqoop导入数据是通过MapReduce作用完成的,并且是没有Reduce任务的MapReduce作业,下面讲解Sqoop的使用
将关系型数据库表的记录映射为一个java文件、java class类以及相关的jar包。该命令将数据库表的记录映射为一个java文件,在该java文件中对于有表的各个字段。生成的jar和class文件在Metasore功能使用时会用到。
该命令选项前面已经用到,作用是生成与关系数据库表的表结构对应的Hive表。
eval命令选项可以让Sqoop使用SQL语句对关系型数据库进行操作
从HDFS中将数据导出到关系数据库中
显示Sqoop的帮助信息
将数据库表的数据导入Hive中
将数据库里的所有表导入HDFS中,每个表在HDFS中都对应一个独立的目录
该命令选项可以生产一个Sqoop的作业,但是不会立即执行,需要手动执行
该命令选项可以列出关系型数据库的所有数据库名
该命令选项可以列出关系型数据库的某一个数据库的所有表名
该命令选项的作用是将HDFS上的俩份文件进行合并,在合并的同时进行数据去重
记录Sqoop作业的元数据信息,如果不启动Metastore实例,则默认的元数据存储目录为 ~/.sqoop;如果要更改存储目录,可以在配制文件sqoop.site.xml中进行更爱
显示Sqoop版本信息
Sqoop和Hive一样,都属于Hadoop的客户端。
转载地址:http://ncuwi.baihongyu.com/