SpringOne2GX 2015 回放：Apache Spark 用于大数据处理

新闻 | Pieter Humphrey | 2016 年 2 月 23 日 | ...

录制于 SpringOne2GX 2015 演讲者：Ludwine Probst & Ilayaperumal Gopinathan Big Data Track 幻灯片：http://www.slideshare.net/SpringCentral/apache-spark-for-big-data-processing

今天，我们生活在大数据的世界。Hadoop 和 MapReduce 在大规模数据处理领域占据主导地位。然而，MapReduce 模型在各种处理类型中显示出其局限性，尤其是在机器学习领域频繁遇到的高度迭代算法中。

Spark 是一个内存数据处理框架，与 Hadoop 不同，它提供了对大数据集进行交互式和实时分析的能力。此外，Spark 拥有更灵活的编程模型，并且比 Hadoop 性能更好。

本次演讲旨在描绘 Spark 的全貌，并浏览其生态系统，特别是 Spark Streaming 和 MLlib，并提供具体示例。我们还将展示如何将 Spark 与 Spring XD 结合使用，从而利用各自平台的优势。

Spring 博客