领先一步
VMware 提供培训和认证,帮助您快速提升技能。
了解更多录制于 SpringOne2GX 2015 演讲者:Ludwine Probst & Ilayaperumal Gopinathan 大数据主题幻灯片:http://www.slideshare.net/SpringCentral/apache-spark-for-big-data-processing
如今,我们生活在大数据时代。Hadoop 和 MapReduce 在大规模数据处理领域占据主导地位。然而,MapReduce 模型在各种类型的处理中显示出其局限性,尤其是在机器学习领域中经常遇到的高度迭代算法方面。
Spark 是一种内存数据处理框架,与 Hadoop 不同,它能够对大型数据集进行交互式和实时分析。此外,Spark 拥有更灵活的编程模型,并且比 Hadoop 具有更好的性能。
在本演讲中,我们的目标是描绘 Spark 的概况并浏览其生态系统,特别是 Spark Streaming 和 MLlib,并提供一个具体的示例。我们还将展示如何将 Spark 与 Spring XD 结合使用,从而使您能够利用每个平台的优势。