大数据
白天
夜间
首页
下载
阅读记录
书签管理
我的书签
添加书签
移除书签
azkaban
浏览
105
扫码
分享
2022-07-13 23:38:50
操作
最佳实践
使用说明
若有收获,就点个赞吧
0 人点赞
上一篇:
下一篇:
技术栈
hadoop
CAP理论
阿里云非HA-centos6.5
阿里云HA
端口
优化-参数配置
hdfs
操作
hdfs读写流程
NN、SNN、HA、DN
优化-参数配置
mapreduce
操作
概述
阶段
优化-参数配置
yarn
操作
RM、NM、工作流程
三种调度器
优化-参数配置
zookeeper
操作
基础知识
消息广播、崩溃恢复
优化-参数配置
利用zk实现分布式锁
分布式一致性算法
hive
sql-基础
sql-窗口函数
操作
基础知识
存储、压缩
hive-site.xml
优化-参数配置
优化-HiveServer2
Explain
UDF
flume
操作
基础知识
agent内部原理
事务、可靠性
优化-参数配置
netcat memory logger
exec file hdfs
spooldir memory hdfs
TAILDIR memory hdfs
ChannelSelector案例
SinkProcessor案例
项目:flume kafka flume hdfs
源码解读-flume启动
二次开发
sqoop
export
import
问题
kafka
基础知识
操作
producter:发送流程、存储机制
partition分区
exactly once
zookeeper在kafka中的作用
高效读写的原因
优化-参数配置
API
azkaban
操作
最佳实践
使用说明
kylin
操作
知识点
cube构建算法
优化
spark
spark core优化
spark sql优化
spark streaming优化
问题记录
存储计算分离
pyspark
端口
启动步骤
六种运行模式
submit
shuffle
join
RDD、dataframe、dataset
RDD的创建、保存、转换
RDD序列化
RDD分区
RDD算子-value型数据
RDD算子-keyvalue型数据
RDD累加器、广播变量
DF的创建、保存、转换
DS的创建、保存、转换
UDF、UDAF、UDTF
DStream的创建、转换
Streaming乱七八糟
flink
flink内存模型
优化-参数、submit、操作
基础知识、安装
序列化、架构
source、transform、sink
1、时间语义、Watermark
1、windows
2、RichFunction
2、processFunction
3、分流、合流、join
3、状态编程
4、检查点
4、exactly once
TableAPI SQL
TableAPI SQL之时间语义、分组
TableAPI SQL之join
TableAPI SQL之UDF
CEP
离线数据仓库
雪花模型
维度表处理
事实表处理
数据质量、指标体系、画像
数据质量
指标体系
用户画像
规范
数仓-开发规范
数仓-分层规范
数仓-表、指标命名规范
业务-流程规范
暂无相关搜索结果!
让时间为你证明
分享,让知识传承更久远
×
文章二维码
×
手机扫一扫,轻松掌上读
文档下载
×
请下载您需要的格式的文档,随时随地,享受汲取知识的乐趣!
PDF
文档
EPUB
文档
MOBI
文档
书签列表
×
阅读记录
×
阅读进度:
0.00%
(
0/0
)
重置阅读进度
×
思维导图备注