spark能跑Python么


本文摘自php中文网,作者藏色散人,侵删。

spark能跑Python么?

spark是可以跑Python程序的。python编写好的算法,或者扩展库的,比如sklearn都可以在spark上跑。直接使用spark的mllib也是可以的,大部分算法都有。

Spark 是一个通用引擎,可用它来完成各种各样的运算,包括 SQL 查询、文本处理、机器学习等。

本次实验是搭有spark环境的linux下跑的,spark版本为1.6.1,相当于在在spark本地执行,spark文件放在/opt/moudles/spark-1.6.1/(代码中会看到)

编写python测试程序

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

#test.py文件

# -*- coding:utf-8 -*-

import os

import sys

#配置环境变量并导入pyspark

os.environ['SPARK_HOME'] = r'/opt/moudles/spark-1.6.1'

sys.path.append("/opt/moudles/spark-1.6.1/python")

sys.path.append("/opt/moudles/spark-1.6.1/python/lib/py4j-0.9-src.zip")

from pyspark import SparkContext, SparkConf

appName ="spark_1" #应用程序名称

master= "spark://hadoop01:7077"#hadoop01为主节点hostname,请换成自己的主节点主机名称

conf = SparkConf().setAppName(appName).setMaster(master)

sc = SparkContext(conf=conf)

data = [1, 2, 3, 4, 5]

distData = sc.parallelize(data)

res = distData.reduce(lambda a, b: a + b)

print("===========================================")

print (res)

print("===========================================")

执行python程序

执行如下命令

1

python test.py

执行与结果分别如下图所示:

5c215f4eef961abbbcdf3c133b9627d.pngea2bb47185bbe3d22162bcee830cbca.png

以上就是spark能跑Python么的详细内容,更多文章请关注木庄网络博客!!

相关阅读 >>

Python数据分析用什么编译器

详解Python实现logger打印功能

Python实现连接数据库的方法介绍

深入认识Python中的itertools模块

Python 字典(dictionary)操作详解_Python

Python实现客户端和服务器端传输图片的代码

Python操作sqlite数据库与文件操作的实例详解

浅析Python打包工具distutils、setuptools

Python如何发送?Python发送email的三种方式介绍

Python是编译型语言吗

更多相关阅读请进入《Python》频道 >>




打赏

取消

感谢您的支持,我会继续努力的!

扫码支持
扫码打赏,您说多少就多少

打开支付宝扫一扫,即可进行扫码打赏哦

分享从这里开始,精彩与您同在

评论

管理员已关闭评论功能...