概述
Spark是专为大规模数据处理而设计的快速通用的计算引擎,应用非常广泛。本文主要介绍Spark相关的知识,主要包括:了解Spark,使用Spark,Spark典型案例(包括实现)、使用Spark过程中遇到的问题FAQ等,谨帮助用户快速了解Spark、以及如何使用Spark。本文内容是面对开发者的用户手册,在开发过程中可以用来查阅此手册。具体见:https://yq.aliyun.com/articles/705781?spm=a2c4e.11155435.0.0.29f43312jRON2M
目录
基础篇
- Spark的入门介绍
- 如何使用X-Pack Spark的YarnUI、SparkUI、Spark日志、任务运行状况的分析
- Spark 通用的性能配置方法:内存(executor-memory)和CPU(executor-cores)的配置
- Spark本地连接hbase集群做调试.
- Spark SQL语法介绍
- Spark Streaming介绍
- Structured Streaming介绍
- Spark DataSource外部数据源介绍
进阶篇(高级功能)
X-Pack Spark使用[FAQ]
FAQ明细请参考:X-Pack Spark使用FAQ
X-Pack Spark之性能优化
- Spark Streaming 常见优化。
案例实战
- 广告点击数实时统计:Spark StructuredStreaming + Redis Streams
- SparkSQL在有赞的实践
- HBase+Spark游戏大数据的实践。
- X-Pack Spark对接阿里云日志服务LogHub。
原创文章,作者:网友投稿,如若转载,请注明出处:https://www.cloudads.cn/archives/34181.html