隆重推出 Spring XD

工程 | Mark Fisher | 2013年4月23日 | ...

今天,我们正式启动了一个名为Spring XD的新项目,其主题是“解决大数据复杂性”1

在过去几年里,Spring Data 团队一直非常忙碌,不仅为 NoSQL 数据库提供支持,而且简化了 Hadoop 的开发体验。通过创建Spring for Apache Hadoop 项目,我们通过提供丰富的配置模型和跨 Hadoop 生态系统项目(如 Hive 和 Pig)一致的编程模型,使启动 Hadoop 应用程序的开发变得更容易。正如 Spring 用户所期望的那样,您可以

  1. 将 MapReduce 作业配置和运行为容器管理的对象。
  2. 使用 HDFS、HBase、Pig 和 Hive 的模板辅助类来消除应用程序中的样板代码。

Spring for Apache Hadoop 为构建 Hadoop 应用程序提供了坚实的基础。Spring XD 基于这些基础资源,进一步简化了创建实际大数据解决方案的过程。具体来说,Spring XD 解决了常见的大数据用例,例如

  1. 从各种输入源到 HDFS 的高吞吐量分布式数据摄取。
  2. 摄取时的实时分析,例如收集指标和计数值。
  3. 通过批处理作业进行 Hadoop 工作流管理,这些作业结合了与标准企业系统(例如 RDBMS)的交互以及 Hadoop 操作(例如 MapReduce、HDFS、Pig、Hive 或 Cascading)。
  4. 高吞吐量数据导出,例如从 HDFS 到 RDBMS 或 NoSQL 数据库。

Spring Data 书籍涵盖了其中一些用例,并且该书籍的示例代码可在我们的GitHub 存储库中找到。这些示例除了 Spring for Apache Hadoop 项目外,还基于 Spring Batch 和 Spring Integration。

在管理事件驱动的数据库摄取流方面,Spring Integration 提供了一个经过验证的模型,其灵感来自完善的企业集成模式。同样,Spring Batch 是一个强大的工作流管理解决方案,对最重要的需求(例如作业状态管理和重试/重启功能)提供了强大的支持,并且是JSR-352 的基础。

扩展框架以支持大数据用例始于书籍示例,但通过 Spring XD,我们旨在将这种支持提升到另一个层次。首先,我们将提供一个跨上述四个用例类别的一致模型。对于那些具有 Spring 经验的人来说,该模型将立即熟悉。其次,随着 Spring XD 的发展,我们将超越 API 层,提供开箱即用的可执行服务器、可插拔模块系统、在 Hadoop 集群内或集群外分发数据收集实例的简单模型等等。

如果您觉得这很有趣,请参与进来!您可以分叉存储库和/或监控JIRA。它现在几乎是一个全新的项目,但我们希望确保我们的社区成员有机会参与其中。与往常一样,我们认为来自我们广泛而热情的社区的反馈是我们最大的财富。我们在过去一年中做了大量的原型设计,因此您很快就会看到一些代码发布。此外,我们计划在每次冲刺后发布博客,以便您可以跟踪进度。而且,如果您尚未注册SpringOne,请务必注册;Spring XD 将成为其中一个重要的主题。

最后,请务必注册我们明天的直播活动(4月24日):Pivotal:新时代的新平台

1XD = eXtreme Data 或 'x' 如同 y = mx + b ;-)

获取 Spring 新闻通讯

随时关注 Spring 新闻通讯

订阅

领先一步

VMware 提供培训和认证,以快速提升您的进度。

了解更多

获取支持

Tanzu Spring在一个简单的订阅中提供对OpenJDK™、Spring和Apache Tomcat®的支持和二进制文件。

了解更多

即将举行的活动

查看 Spring 社区中所有即将举行的活动。

查看全部