领先一步
VMware 提供培训和认证,助您加速进步。
了解更多录制于 SpringOne2GX 2015 演讲者:Ludwine Probst & Ilayaperumal Gopinathan Big Data Track 幻灯片:http://www.slideshare.net/SpringCentral/apache-spark-for-big-data-processing
今天,我们生活在大数据的世界。Hadoop 和 MapReduce 在大规模数据处理领域占据主导地位。然而,MapReduce 模型在各种处理类型中显示出其局限性,尤其是在机器学习领域频繁遇到的高度迭代算法中。
Spark 是一个内存数据处理框架,与 Hadoop 不同,它提供了对大数据集进行交互式和实时分析的能力。此外,Spark 拥有更灵活的编程模型,并且比 Hadoop 性能更好。
本次演讲旨在描绘 Spark 的全貌,并浏览其生态系统,特别是 Spark Streaming 和 MLlib,并提供具体示例。我们还将展示如何将 Spark 与 Spring XD 结合使用,从而利用各自平台的优势。