抢先一步
VMware 提供培训和认证,以加速您的进步。
了解更多在 SpringOne2GX 2015 上录制。演讲者:Ludwine Probst & Ilayaperumal Gopinathan 大数据主题幻灯片:http://www.slideshare.net/SpringCentral/apache-spark-for-big-data-processing
今天,我们生活在大数据的世界。 Hadoop 和 MapReduce 在大规模数据处理领域占据主导地位。但是,MapReduce 模型在各种类型的处理中都显示出其局限性,尤其是在机器学习领域中经常遇到的高度迭代算法方面。
Spark 是一个内存数据处理框架,与 Hadoop 不同,它提供对大型数据集的交互式和实时分析。此外,Spark 具有更灵活的编程模型,并且比 Hadoop 具有更好的性能。
在本次演讲中,我们的目标是介绍 Spark 并浏览其生态系统,特别是 Spark Streaming 和 MLlib,并提供一个具体的示例。我们还将展示如何将 Spark 与 Spring XD 结合使用,使您可以利用每个平台的优势。