这一两年Spark技术很火,自己也凑热闹,反复的试验、研究,有痛苦万分也有欣喜若狂,抽空把这些整理成文章共享给大家。这个系列基本上围绕了Spark生态圈进行介绍,从Spark的简介、编译、部署,再到编程模型、运行架构,最后介绍其组件SparkSQL、Spark Streaming、Spark MLib和Spark GraphX等。文章内容的整理一般是先介绍原理,随后是实战例子,由于面向的是入门读者,在实战中多截图,还请谅解。为了大家实验方便,在这里把实验相关的测试数据和安装包放在百度盘提供 下载 地址为 http://pan.baidu.com/s/1pJyyB6j

    本系列博客在博客园和CSDN首发,地址为:

    博客园 http://www.cnblogs.com/shishanyuan

    CSDN http://blog.csdn.net/yirenboy

    以下为该系列文章列表:

    1. Spark及其生态圈简介 下载

    2. Spark编译与部署(上)--基础环境搭建 下载

    2. Spark编译与部署(中)--Hadoop编译安装 下载

    2. Spark编译与部署(下)--Spark编译安装 下载

    3. Spark编程模型(上)--概念及SparkShell实战 下载

    3. Spark编程模型(下)--IDEA搭建及实战 下载

    4. Spark运行架构 下载

    5. Hive(上)--Hive介绍及部署 下载

    5. Hive(下)--Hive实战 下载

    6. SparkSQL(上)--SparkSQL简介 下载

    6. SparkSQL(中)--深入了解运行计划及调优 下载

    6. SparkSQL( )--Spark实战应用 下载

    7. Spark Streaming( )--实时流计算Spark Streaming原理介绍 下载

    7. Spark Streaming( )-- Spark Streaming实战 下载

    8. Spark MLlib(上)--机器学习及SparkMLlib简介 下载

    8. Spark MLlib(下)--机器学习库SparkMLlib实战 下载

    9 .Spark GraphX 下载

    10.分布式内存文件系统Tachyon介绍及安装部署  下载