SummarySummary 简介 前言 prefacesqoop 2本书约定本书代码 第一章 下载和安装sqoop安装JDBC连接器.md安装特定连接器.md运行sqoop.md获取sqoop帮助信息.md 第二章 从整张表中导入数据指定目标路径只导入部分数据密码保护使用CSV外的数据格式压缩导入数据加速数据传输从写类型映射并行控制对null编码导入所有表数据 第三章 只导入新数据递增导入可变数据保存最后导入数据在元数据中存储密码对以保存的作业重写参数在sqoop客户端将分享元数据 第四章 从两张表中导入数据使用自定义边界查询重命名sqoop作业实例导入具有重复的列的查询 第五章 从hadoop导出数据批量插入数据对语义的导出更新以存在的数据集同一时间更新或插入使用存储过程导入到部分列对null值赋值导出脏数据 第六章 使用Oozie的调度Sqoop任务在Oozie中指定命令使用合适Oozie的参数在Oozie中安装JDBC驱动直接将数据导入到Hive使用Hive分区表导入Hive时替换特定分隔符在Hive中正确使用null值导入数据到HBase将所有行导入HBase提升导入HBase时的性能 第七章 直接重写在postgresql的bool值向postgresql中导入自定义存储模式的表使用pg_bulkload从postgresql导出数据连接到Mysql从Mysql将数据直接导入Hive使用Mysql新技术来导出数据从Oracle导入数据在Oracle中使用表同义词Oracle的高速数据传输使用OraOop将数据导入Avro系统为Oracle选择合适的连接器导入数据到Teradata使用ClouderaTeradata连接器在Teradata中使用长列名