用户登录
用户注册

分享至

spark 7077

  • 作者: 我家没隔壁
  • 来源: 51数据库
  • 2020-09-24
写Linux脚本
#!/bin/sh
if [ $# -lt 2 ] ;then
echo "Useage:$0 $1 "
exit
else
echo "wordcount is starting!"
spark-submit \
--master spark://spark:7077 \
--class WordCount \
--executor-memory 512m \
--total-executor-cores 6 \
~/input/WordCount.jar \
"$1" \
"$2"
echo "wordcount is stopped!"
fi




  应该说这个和是不是spark项目没什么关系。

建议你使用intellij idea,在spark目录下执行"sbt/sbt gen-idea",会自动生成.idea项目,导入即可。
idea我不熟,还需要做一些其他的插件配置(python, sbt等)和环境设置。

你也可以使用eclipse看,eclipse有scala ide,把spark项目当maven工程导入。但是子项目之间的依赖会有点问题,会报错。

推荐使用前者,向databricks的开发者看齐;我使用的是后者,我直接依赖了编译好的包就不会报错了,纯读源码的话也勉强可以跟踪和调试。

另外,我也看有的committer用vim看spark代码的,所以怎么看源码都无所谓,你熟悉就好,而且这和是不是spark项目也没什么关系。:)
软件
前端设计
程序设计
Java相关