只需几个简单的步骤即可开始使用Flink Java程序。
要求
唯一的要求是使用Maven 3.0.4(或更高版本)和Java 8.x安装。
创建项目
使用以下命令之一创建项目:
$ mvn archetype:generate \
-DarchetypeGroupId=org.apache.flink \
-DarchetypeArtifactId=flink-quickstart-java \
-DarchetypeCatalog=https://repository.apache.org/content/repositories/snapshots/ \
-DarchetypeVersion=1.7-SNAPSHOT
这允许您命名新创建的项目。它将以交互方式询问您groupId,artifactId和包名称。
$ curl https://flink.apache.org/q/quickstart-SNAPSHOT.sh | bash -s 1.7-SNAPSHOT
注意:对于Maven 3.0或更高版本,不再可以通过命令行指定存储库(-DarchetypeCatalog)。如果要使用SNAPSHOT存储库,则需要向settings.xml添加存储库条目。有关此更改的详细信息,请参阅Maven官方文档
检查项目
您的工作目录中将有一个新目录。如果您使用了curl方法,则会调用该目录quickstart
。否则,它的名称为artifactId
:
$ tree quickstart/
quickstart/
├── pom.xml
└── src
└── main
├── java
│ └── org
│ └── myorg
│ └── quickstart
│ ├── BatchJob.java
│ └── StreamingJob.java
└── resources
└── log4j.properties
示例项目是一个Maven项目,它包含两个类:StreamingJob和BatchJob是DataStream和DataSet程序的基本框架程序。的主要方法是程序的入口点,无论是对在-IDE测试/执行并作适当的部署。
我们建议您将此项目导入IDE以进行开发和测试。IntelliJ IDEA支持开箱即用的Maven项目。如果您使用Eclipse,则m2e插件 允许导入Maven项目。某些Eclipse包默认包含该插件,其他包需要您手动安装它。
Mac OS X用户注意事项:对于Flink,Java默认JVM堆可能太小。你必须手动增加它。在Eclipse中,选择 Run Configurations -> Arguments
并写入VM Arguments
框:-Xmx800m
。在IntelliJ IDEA中,推荐的方法是从Help | Edit Custom VM Options
菜单中更改JVM选项。有关详细信息,请参阅此文
构建项目
如果要构建/打包项目,请转到项目目录并运行’ mvn clean package
‘命令。您将找到一个包含您的应用程序的JAR文件,以及您可能已作为依赖项添加到应用程序的连接器和库:target/<artifact-id>-<version>.jar
。
注意:如果您使用与StreamingJob不同的类作为应用程序的主类/入口点,我们建议您相应地更改文件中的mainClass
设置pom.xml
。这样,Flink可以从JAR文件运行时间应用程序,而无需另外指定主类。
下一步
写你的申请!
如果您正在编写流处理应用程序并且正在寻找灵感来写什么,请查看流处理应用程序教程。
如果您正在编写批处理应用程序,并且正在寻找要编写的内容,请查看批处理应用程序示例。
有关API的完整概述,请查看 DataStream API和 DataSet API部分。
在这里,您可以了解如何在本地群集上的IDE外部运行应用程序。
如果您有任何问题,请在我们的 邮件列表中查询。我们很乐意提供帮助。