Apache Spark 官方文档中文版

白天 夜间 首页 下载 阅读记录
  我的书签   添加书签   移除书签

编程指南

浏览 145 扫码 分享 2023-11-23 12:29:33
    • 概述
    • Spark 依赖
    • 初始化 Spark

      • 使用 Shell
    • 弹性分布式数据集(RDDs)

      • 并行集合
      • 外部 Datasets(数据集)
      • RDD 操作

        • 基础
        • 传递 Functions(函数)给 Spark
        • 理解闭包

          • 示例
          • Local(本地)vs. cluster(集群)模式
          • 打印 RDD 的 elements
        • 与 Key-Value Pairs 一起使用
        • Transformations(转换)
        • Actions(动作)
        • Shuffle 操作

          • Background(幕后)
          • 性能影响
      • RDD Persistence(持久化)

        • 如何选择存储级别 ?
        • 删除数据
    • 共享变量

      • 广播变量
      • Accumulators(累加器)
    • 部署应用到集群中
    • 从 Java / Scala 启动 Spark jobs
    • 单元测试
    • 快速链接

    若有收获,就点个赞吧

    0 人点赞

    上一篇:
    下一篇:
    • 书签
    • 添加书签 移除书签
    • 贡献指南
    • <center>Apache Spark 官方文档中文版</center>
    • Spark 概述
    • API 文档
    • 11.md
    • 集群模式概述
    • Submitting Applications
    • 14.md
    • Spark Standalone Mode
    • 在 Mesos 上运行 Spark
    • Running Spark on YARN
    • 其它
    • 19.md
    • 编程指南
    • Spark 配置
    • Monitoring and Instrumentation
    • Spark 调优
    • 作业调度
    • Spark 安全
    • 硬件配置
    • Accessing OpenStack Swift from Spark
    • 构建 Spark
    • 其它
    • 外部资源
    • 快速入门
    • Spark 官方文档中文版翻译进度
    • Spark 编程指南
    • 5.md
    • Spark Streaming 编程指南
    • Spark SQL, DataFrames and Datasets Guide
    • MLlib
    • GraphX Programming Guide
    • Spark RDD(Resilient Distributed Datasets)论文
    • 结构化流式编程指南
    暂无相关搜索结果!

      让时间为你证明

      展开/收起文章目录

      分享,让知识传承更久远

      文章二维码

      手机扫一扫,轻松掌上读

      文档下载

      请下载您需要的格式的文档,随时随地,享受汲取知识的乐趣!
      PDF文档 EPUB文档 MOBI文档

      书签列表

        阅读记录

        阅读进度: 0.00% ( 0/0 ) 重置阅读进度

          思维导图备注