大数据
白天
夜间
首页
下载
阅读记录
书签管理
我的书签
添加书签
移除书签
102.分区 排序的案例
浏览
109
扫码
分享
2022-07-13 23:39:36
若有收获,就点个赞吧
0 人点赞
上一篇:
下一篇:
踩过的坑
1.没思考
Hadoop尚硅谷
第一章——环境的相关搭建
11、12.Hadoop
13.HDFS架构
14.YARN ----协调资源
15.MapReduce架构
16.HDFS、YARN和MapReduce关系
17.大数据生态圈
26.Hadoop三种运行模式——本地运行模式
27.scp命令安装集群
28.xsyns—集群分发脚本
29.SSH免密登陆
30.集群的配置
31、32、33集群测试及崩溃处理、历史服务器
38.常见的配置问题
第二章
44、45 Hadoop下Shell的操作
46——53 使用IDEA操作Hadoop集群
第三章
58读与写数据的架构图
59.Namenode与Secondnode的工作机制
63.DataNode的工作机制
68 MapReduce框架
69.MapReduce的处理流程
70、75Mapper与Reduce部分的代码(非常推荐看看)
78、使用集群的方式运行分词程序
79.序列化的背景以及流程
87.切片
88.Job提交流程源码
92.TextInputFormat及其子类
95。Shuffle机制流程
96.分区
98.分区数与Reduce数总结
102.分区 排序的案例
103 Combine
技术类读书笔记
1.Hadoop权威指南
1.2数据存储
网站日志分析项目——Spark
1.Hive
1.Hive的本质
2.Spark SQL和DataFrame本质
3.Spark SQL on Hive的配置及演示
4.使用Java及Scala开发DataFrame
数据结构
Spark学习
一、基础篇
day1—写一个分词的小程序
day2
4.scala协变、逆变、上界、下界
3.RDD的转换 编程
2.RDD介绍
1.Spark调试
day3
1.RDD的行动操作
2.RDD的高级特性
day04
1.Spark SQL
2.Spark Core的输入输出
day05
1.DataFrame的Schame获取(反射和编程模式)
2.自定义UDF函数
3.Spark SQL的输入与输出
4.Spark SQL的小实战
5.Spark SQL和hive的继承
6.UDAF函数
day6
1、Spark SQL的复习
2.Spark Stream与简单的实战
3.文件数据源的输入处理
day7
1.Sprak Stream的无状态切换
2.Spark GraphX 图的讲解
3.UpdateStateByKey 有状态转换
4.有状态转换(2)
5.图的转换操作
Spark调优
1、优化解析概述
2.数据倾斜(解决数据倾斜的演示)
3、解析调优
二、机器学习
1.协同过滤
2.FPGrow算法
3.决策树
4.线性回归
5.线性回归的实例
6.Spark源码解析
三、Spark源码解析(没看过)
暂无相关搜索结果!
让时间为你证明
分享,让知识传承更久远
×
文章二维码
×
手机扫一扫,轻松掌上读
文档下载
×
请下载您需要的格式的文档,随时随地,享受汲取知识的乐趣!
PDF
文档
EPUB
文档
MOBI
文档
书签列表
×
阅读记录
×
阅读进度:
0.00%
(
0/0
)
重置阅读进度
×
思维导图备注