1、win10环境下,下载linux版本hadoop,解压
    http://archive.apache.org/dist/hadoop/common/
    2、下载win10下bin文件,替换掉linux版本bin文件
    https://github.com/steveloughran/winutils
    3、下载scala,并解压
    https://www.scala-lang.org/download/
    4、配置hadoop、scala环境变量
    5、IDEA下下载scala插件
    6、创建maven项目
    7、Global Libraries里点击”+”号,添加scala的sdk
    8、在项目src\main目录下新建scala的目录;
    9、将Moudles里面,将scala目录设置为source目
    10、添加maven依赖
    spark-core_2.12这里的2.12指的是spark-core兼容scala的sdk版本为2.12,这里的版本一定要与scala的版本对应,否则编译会报错

    1. <?xml version="1.0" encoding="UTF-8"?>
    2. <project xmlns="http://maven.apache.org/POM/4.0.0"
    3. xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
    4. xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
    5. <modelVersion>4.0.0</modelVersion>
    6. <groupId>macro.com</groupId>
    7. <artifactId>test</artifactId>
    8. <version>1.0-SNAPSHOT</version>
    9. <properties>
    10. <spark.version>2.4.0</spark.version>
    11. <hadoop.version>2.7.3</hadoop.version>
    12. </properties>
    13. <dependencies>
    14. <!-- Spark依赖关系 -->
    15. <dependency>
    16. <groupId>org.apache.spark</groupId>
    17. <artifactId>spark-core_2.12</artifactId>
    18. <version>${spark.version}</version>
    19. </dependency>
    20. <dependency>
    21. <groupId>org.apache.hadoop</groupId>
    22. <artifactId>hadoop-client</artifactId>
    23. <version>${hadoop.version}</version>
    24. </dependency>
    25. <!-- https://mvnrepository.com/artifact/com.thoughtworks.paranamer/paranamer
    26. 升级 你的 paranamer 到2.8 ,这是由于你的jdk版本1.8导致
    27. -->
    28. <dependency>
    29. <groupId>com.thoughtworks.paranamer</groupId>
    30. <artifactId>paranamer</artifactId>
    31. <version>2.8</version>
    32. </dependency>
    33. </dependencies>
    34. </project>

    13、开发

    1. 新建一个txt文本文件,在里面输入若干单词、
    2. 建一个scala object,命名为WordCount
    3. 代码如下

    1420610-20181201235024197-491286836.png

    1. 结果如下