IT培训网

IT培训

关注我们

官方公众号 回复"大礼包"享福利

领学习资料 分享IT知识

|

IT在线学习

热门课程更多 >

OAO训练营: 不离岗不离校学门IT技术

优学VIP: 16大类IT课程提升职场竞争力

关注我们

扫码领资料 零基础学IT

微信扫码关注 回复“大礼包”享福利

| 初高中软件培训| 中公企商培训| 中公联合办学| 优校邦| 中公PMP| 中公软考| 计算机二级培训

实训项目库 登录 | 注册

中公教育 IT 培训品牌

专注于职业教育的A股上市公司

证券代码：002607

400-650-7353

您所在的位置：首页 > IT干货资料 > 大数据 > 【大数据基础知识】Spark算子介绍及map算子的使用

【大数据基础知识】Spark算子介绍及map算子的使用

发布：大数据培训
来源：大数据干货资料
2021-07-07 18:48:01
阅读()
分享

手机端入口

进入到大数据圈的朋友们都对Spark的强大功能有所了解，那么提到Spark，我们就想到了其中的算子，Spark的强大功能如何实现，自然离不开其中的算子了。怎么理解这些算子呢，我们可以简单把它理解为方法或函数，Spark已经定义好了很多功能强大的方法或函数，在这里称为算子。

Spark中的算子分为两类：一是转换类算子(Transformation)，二是行动类算子(Action)。转换类算子执行后得到新的RDD，并且不会立即执行，需要有行动类算子触发才能执行。行动类算子是立即执行的，并且执行后得到的不再是RDD。

这次，我们用命令行的方式先来看看这些算子如何使用。

首先，我们进入spark-shell命令行方式：

[root@node2 ~]# spark-shell --master spark://node1:7077

执行上面命令后，就进入了命令行方式：

此时，我们就可以测试使用Spark中的算子了。

有一点我们要注意的，这些算子都是作用在RDD上，所以我们首先要得到RDD。

map算子

map算子实现的是一一映射。

对某一个rdd执行map，rdd中每一条数据都会执行操作。也就是说rdd中有几条数据，就会被迭代几次。

执行map算子后返回值的数据类型，取决于给map传递的函数的返回值类型。

scala> val rdd=sc.makeRDD(List(1,2,3,4,5,6,7),3)

rdd: org.apache.spark.rdd.RDD[Int] = ParallelCollectionRDD[3] at makeRDD at :24

首先，我们通过makeRDD，将一个list转换成RDD，并且指定分区数为3。

scala> val rdd1=rdd.map(_>5)

rdd1: org.apache.spark.rdd.RDD[Boolean] = MapPartitionsRDD[4] at map at :26

执行map算子，传递的函数是判断元素是否大于5，结果得到一个新的的RDD，并且元素类型是Boolean类型。由此我们也可以看到，结果RDD的元素类型就是由传入map算子的函数决定的。

此时，实际上还没有真正执行，我们需要使用一个Action算子触发执行。

scala> rdd1.collect

[Stage 0:===================> res0: Array[Boolean] = Array(false, false, false, false, false, true, true)

我们使用collect算子触发执行，得到结果。Collect算子是Action类算子，是将结果回收到客户端。在生产环境中，要慎用此算子。我们测试中因为数据量非常小，用此算子是没有问题的。

文章“【大数据基础知识】Spark算子介绍及map算子的使用”已帮助人

>>本文地址：https://www.ujiuye.com/zhuanye/2021/69184.html

THE END

声明:本站稿件版权均属中公教育优就业所有，未经许可不得擅自转载。

推荐阅读

1 您的年龄

18岁以下
18-30岁
30岁以上

2 您的学历

高中及以下
专科及以上

3 您更想做哪个方向的工作？

编程开发类
设计类
运营类
测试运维类

获取测试结果

大前端
大数据
互联网营销
Java
Linux
Python
嵌入式
全域电商运营
软件测试
室内设计
平面设计
电商设计
网页设计
UI设计
VR/AR
网络安全
新媒体
直播带货
智能机器人

大家都在看
点击排行榜

1 软件测试需要学习什么技术？

2 大数据培训什么内容，培训完都可以从事什么工作？

3 Web前端饱和了嘛？现在参加培训还能找到工作吗？

4 Python培训完好找工作吗，现在学习还来得及吗？

5 Unity培训完薪资待遇多少钱？

6 网络营销的前景怎么样?现在学习还来得及吗?

7 优就业Linux培训课程体系是如何构成的？

8 Web前端的前景怎么样？现在学习来得及吗？

UI设计工资一般多少?

IT行业工资一般多少

UI设计师工资一般多少？

it培训机构排名，it培训机构哪个好？

编程都有哪些种类？

零基础学编程应该从哪入手？

现在UI设计培训一般需要多少钱？

it培训课程有哪些？IT培训具体都是培训哪些？

快速通道fast track

开班地区查看有哪些
课程大纲点击获取大纲
课程价格点击查看价格
近期活动领取优惠券
合作企业免费推荐就业
往期薪资查看详细数据

近期开班时间TIME

07月15日Java
咨询/试听
07月15日Python+人工智能
咨询/试听
07月15日Web前端
咨询/试听
07月15日UI设计
咨询/试听
07月15日大数据
咨询/试听
07月15日Java
咨询/试听
07月15日Python+人工智能
咨询/试听
07月15日Web前端
咨询/试听
07月15日UI设计
咨询/试听
07月15日大数据
咨询/试听

上一篇【大数据基础知识】Spark常用算子（二）

下一篇【大数据基础知识】Spark实现WordCount

优就业——中公教育旗下IT培训品牌

中公教育是大型的多品类职业教育机构，提供超过100个品类的综合职业就业培训服务。

优就业是中公教育IT培训品牌，致力于培养面向互联网领域的高端人才，以学员就业为目的，优质就业为宗旨，是一家集Java、Web前端、UI设计等十余类课程为一体的IT培训机构。

优就业

中公教育IT培训品牌 400-650-7353

Copyright©1999- 北京中公教育科技有限公司 .All Rights Reserved 京ICP备10218183号-88
京ICP证161188号京公网安备11010802020723号投诉建议：400-650-7353

扫码回复关键词“大礼包”
享学习福利

微信公众号

iPhone下载

Android下载