本文摘自php中文网,作者藏色散人,侵删。

spark能跑Python么?
spark是可以跑Python程序的。python编写好的算法,或者扩展库的,比如sklearn都可以在spark上跑。直接使用spark的mllib也是可以的,大部分算法都有。
Spark 是一个通用引擎,可用它来完成各种各样的运算,包括 SQL 查询、文本处理、机器学习等。
本次实验是搭有spark环境的linux下跑的,spark版本为1.6.1,相当于在在spark本地执行,spark文件放在/opt/moudles/spark-1.6.1/(代码中会看到)
编写python测试程序
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 | #test.py文件
# -*- coding:utf-8 -*-
import os
import sys
#配置环境变量并导入pyspark
os.environ[ 'SPARK_HOME' ] = r '/opt/moudles/spark-1.6.1'
sys.path.append( "/opt/moudles/spark-1.6.1/python" )
sys.path.append( "/opt/moudles/spark-1.6.1/python/lib/py4j-0.9-src.zip" )
from pyspark import SparkContext, SparkConf
appName = "spark_1" #应用程序名称
master= "spark://hadoop01:7077" #hadoop01为主节点hostname,请换成自己的主节点主机名称
conf = SparkConf().setAppName(appName).setMaster(master)
sc = SparkContext(conf=conf)
data = [1, 2, 3, 4, 5]
distData = sc.parallelize(data)
res = distData.reduce(lambda a, b: a + b)
print ( "===========================================" )
print (res)
print ( "===========================================" )
|
执行python程序
执行如下命令
执行与结果分别如下图所示:


以上就是spark能跑Python么的详细内容,更多文章请关注木庄网络博客!!
相关阅读 >>
Python数据分析用什么编译器
详解Python实现logger打印功能
Python实现连接数据库的方法介绍
深入认识Python中的itertools模块
Python 字典(dictionary)操作详解_Python
Python实现客户端和服务器端传输图片的代码
Python操作sqlite数据库与文件操作的实例详解
浅析Python打包工具distutils、setuptools
Python如何发送?Python发送email的三种方式介绍
Python是编译型语言吗
更多相关阅读请进入《Python》频道 >>
人民邮电出版社
python入门书籍,非常畅销,超高好评,python官方公认好书。
转载请注明出处:木庄网络博客 » spark能跑Python么