如何用Python编写spark

时间:2024-10-12 21:41:16

1、为什么要使用Python来写SparkPython写spark我认为唯一的理由就是:你要做数据挖掘,AI相关的工作。因为很多做剞麽苍足数挖的他们的基础语言都是python,他们如果重新学scala比较耗时,而且,python他的强大类库是他的优势,很多算法库只有python有。Win本地编写代码调试编辑器:PyCharmSpark:1.6Python:2.7Win环境准备Python的安装解压python包,在环境变量里面配上bin的路径Spark的安装下载spark的bin文件,解压即可,在环境变量配置SPARK_HOME要可以通过编辑器来安装,如pycharm,查找pyspark库安装即可Hadoop安装安装hadoop环境 。在win下面需要winutils.exe;在环境里面配置HADOOP_HOME 即可。代码示例

如何用Python编写spark
© 手抄报圈