使用 Project Reactor 1 进行上下文传播 - 基础知识

工程 | Dariusz Jędrzejczyk | 2023年3月28日 | ...

此文章是系列文章的一部分

Spring Boot 3 和 Spring Framework 6 为我们带来了一种统一且一致的方式，可以在使用 Micrometer 的应用程序中启用可观测性。从 Spring Cloud Sleuth 到 Micrometer 的演变，以及 Observation API 和 Micrometer Tracing，使我们整合了各种上下文传播方法。在本系列博客文章中，我们旨在解释我们如何在 Project Reactor 中支持上下文传播，以满足命令式库的需求。通过从基础开始构建您的理解，您将能够使用这些构造并理解其底层原理。我们假设您对响应式编程概念有基本的理解。如果您是新手或想复习知识，请查看 Project Reactor 文档中的响应式编程简介。

在本文中，我们将开发一个简单的电子商务应用程序。我们有限的视角考虑了一个添加产品并通知商店有新产品添加到库存的请求。作为负责任的开发人员，我们希望记录特定请求所采取的所有步骤，以便在调查问题时，我们可以查看日志并了解发生了什么。我们将探讨如何以命令式风格实现为日志实用程序提供有关请求的上下文元数据的目标，并将其与 Project Reactor 更具函数式、声明式风格进行比较。接下来的文章将更详细地探讨为什么以及如何我们需要在这两种编程风格之间建立桥梁。

ThreadLocal

为了识别属于特定请求的日志，我们需要一种关联它们的方法。我们可以生成一个简单的随机标识符，如下所示

static long correlationId() {
  return Math.abs(ThreadLocalRandom.current().nextLong());
}

我们需要一种方法使关联标识符在日志实用程序中可用。我们可以将关联作为业务逻辑中每个方法调用的一部分，但这会非常侵入性和冗长。

通常，第三方库使用 JDK 的 ThreadLocal 来传递与我们应用程序业务逻辑不直接相关的隐式信息。

让我们为关联标识符声明一个静态字段

static final ThreadLocal<Long> CORRELATION_ID = new ThreadLocal<>();

这是我们的日志方法。它打印当前的 Thread 名称并格式化输出

static void log(String message) {
  String threadName = Thread.currentThread().getName();
  String threadNameTail = threadName.substring(
    Math.max(0, threadName.length() - 10));
  System.out.printf("[%10s][%20s] %s%n",
    threadNameTail, CORRELATION_ID.get(), message);
}

现在我们拥有了处理请求和使用隐式关联标识符记录每个步骤所需的一切。

在每个请求开始时，应用程序都会调用以下方法来启动关联

static void initRequest() {
  CORRELATION_ID.set(correlationId()));
}

我们简化的请求处理程序执行以下操作

void handleRequest() {
  initRequest();

  addProduct("test-product");
  notifyShop("test-product");
}

业务逻辑中的日志记录如下所示

void addProduct(String productName) {
  log("Adding product: " + productName);
  // ...
}

void notifyShop(String productName) {
  log("Notifying shop about: " + productName);
  // ...
}

我们可以期望我们的应用程序记录这些行

[      main][ 8592000019542134146] Adding product: test-product
[      main][ 8592000019542134146] Notifying shop about: test-product

只要特定请求的执行发生在同一个 Thread 上，并且不与其他关注点交错，ThreadLocal 就可以让我们将业务逻辑与用于日志记录的元数据解耦。

异步处理

假设这个应用程序开始承受更高的负载，需要处理许多并发请求。假设我们可以使用一个异步和非阻塞的服务器实现，它要求我们提供异步声明而不是命令式和阻塞步骤。

我们的请求处理程序可以返回一个 CompletableFuture 以异步和非阻塞方式处理请求

CompletableFuture<Void> handleRequest() {
  return CompletableFuture
    .runAsync(() -> addProduct("test-product"))
    .thenRunAsync(() -> notifyShop("test-product"))
}

不幸的是，当我们执行异步版本时，日志不再包含关联标识符

[l-worker-1][                null] Adding product: test-product
[l-worker-1][                null] Notifying shop about: test-product

任务包装

解决此问题的已知方法是包装由异步 API 执行的任务。通过包装，我们指的是一种执行 ThreadLocal 上下文恢复的实现。当任务创建时，捕获当前上下文。当工作 Thread 实际执行任务时，该上下文将恢复。让我们看看这在我们使用 Runnable 的示例案例中如何工作

class WrappedRunnable implements Runnable {

  private final Long correlationId;
  private final Runnable wrapped;

  public WrappedRunnable(Runnable wrapped) {
    this.correlationId = CORRELATION_ID.get();
    this.wrapped = wrapped;
  }

  @Override
  public void run() {
    Long old = CORRELATION_ID.get();
    CORRELATION_ID.set(this.correlationId);
    try {
      wrapped.run();
    } finally {
      CORRELATION_ID.set(old);
    }
  }
}

我们可以像这样重新实现我们的处理程序

CompletableFuture<Void> handleRequest() {
  return CompletableFuture
    .runAsync(new WrappedRunnable(
      () -> addProduct("test-product")))
    .thenRunAsync(new WrappedRunnable(
      () -> notifyShop("test-product")));
}

不幸的是，这带来了很多开销。幸运的是，JDK 有一个用于执行异步任务的 API：Executor 接口。在实际场景中，我们希望使用更全面的 API，即 ExecutorService。然而，出于我们的解释目的，Executor 应该足够了。

让我们看看

static class WrappedExecutor implements Executor {

  private final Executor actual;

  WrappedExecutor(Executor actual) {
    this.actual = actual;
  }

  @Override
  public void execute(Runnable command) {
    actual.execute(new WrappedRunnable(command));
  }
}

让我们重用 CompletableFuture 框架默认使用的通用 ForkJoinPool，但用我们的实现包装它。现在我们的代码看起来像这样

static Executor executor = new WrappedExecutor(ForkJoinPool.commonPool());

CompletableFuture<Void> handleRequest() {
  return CompletableFuture
    .runAsync(() -> addProduct("test-product"), executor)
    .thenRunAsync(() -> notifyShop("test-product"), executor);
}

我们的日志再次正常工作

[l-worker-1][ 7321040639376081961] Adding product: test-product
[l-worker-2][ 7321040639376081961] Notifying shop about: test-product

在某些情况下，CompletableFuture 框架可以提供以非阻塞方式处理异步任务的方法。然而，在许多情况下，有限的 API 表面及其行为特性可能会受到限制。例如，当我们的系统达到容量时，我们可能希望延迟处理并在以后恢复。使用 CompletableFuture，所有创建的实例在创建后立即开始计算。我们可能还希望对数据流应用更细粒度的操作，而不是对单个计算单元进行操作。由于这些以及更多原因，我们可能会考虑使用响应式编程库。我们将考虑 Project Reactor，它是 Spring 组合中默认的响应式实现。

Project Reactor

为了提供一个健壮的异步处理框架，Java 社区提出了 Reactive Streams 规范。它有助于建立 JDK 之前所缺乏的通用词汇——明确的信号传播、错误处理、终止和生命周期管理语义。它还允许内置背压。Spring 通过引入 WebFlux 采用了这种方法，使 Project Reactor 及其响应式类型成为 API 的一等公民。

Reactive Streams 为异步流处理带来了优雅而简洁的解决方案。然而，上下文传播不属于规范的一部分。响应式库的非阻塞和异步特性，加上潜在的复杂实现，使得使用 ThreadLocal 极其困难。原因是无法保证哪个 Thread 可以运行用户的代码。只要实现保证串行传递，就可以执行各种优化，从而使用户的代码与并发无关，将处理并发的负担转移到库内部。

为了兑现其保证，Java 中的响应式编程假设使用函数式编程范式来形成声明式和可组合的流，它与不同的 Thread 可以执行用户提供的代码的事实无关。只要用户代码中没有假设在特定 Thread 中执行的副作用，响应式库就可以提供极其高性能的运行时，同时遵守规范。ThreadLocal 显然违反了这一要求。

让我们尝试重写我们的处理程序以使用 Project Reactor。单个操作变为

Mono<Void> addProduct(String productName) {
  log("Adding product: " + productName);
  return Mono.empty(); // Assume we’re actually storing the product
}

Mono<Boolean> notifyShop(String productName) {
  log("Notifying shop about: " + productName);
  return Mono.just(true); // Assume we’re actually notifying the shop
}

让我们尝试使用上面的代码

Mono<Void> handleRequest() {
  initRequest();
  log("Assembling the chain");

  return Mono.just("test-product")
    .flatMap(product ->
      Flux.concat(
        addProduct(product),
        notifyShop(product))
      .then())
}

我们简单的实现产生了预期的输出

[      main][ 7224499961623309444] Assembling the chain
[      main][ 7224499961623309444] Adding product: test-product
[      main][ 7224499961623309444] Notifying shop about: test-product

上面的实现是在 main Thread 中调用的，并且执行被限制在该 Thread 中。我们不应该做这样的假设。

在处理程序中，我们在传播处理结果之前引入了一个小的延迟。我们这样做是为了演示幕后发生的隐式 Thread 切换。

Mono<Void> handleRequest() {
  initRequest(); <1>
  log("Assembling the chain"); // <2>

  return Mono.just("test-product")
    .delayElement(Duration.ofMillis(1)) // <3>
    .flatMap(product ->
      Flux.concat(
        addProduct(product), // <4>
        notifyShop(product))
      .then())
}

运行时，打印出以下内容

[      main][ 6265915299594887150] Assembling the chain
[parallel-1][                null] Adding product: test-product
[parallel-1][                null] Notifying shop about: test-product

发生了什么？为什么一个日志有相关标识符而其他日志没有？

当服务器调用我们的处理程序时，<1> 处的初始化设置了 ThreadLocal 关联标识符，<2> 处的日志能够使用它。那些经验丰富的响应式编程人员会告诉您问题在于执行发生在不同的阶段。ThreadLocal 在组装时设置。“您也应该在订阅时恢复它”将是一个建议。我们稍后再讨论。如果“组装”、“订阅”和“执行时间”这些术语让您感到困惑，请查看Simon 的博客文章中的出色解释或观看同名演讲。

虽然方法会立即返回，但这并不能保证执行已经开始。这是因为返回的 Mono 必须被订阅才能触发处理。它可能发生在不同的 Thread 中。<3> 处的 delayElement 操作符隐式地使用 Reactor 中的共享 Scheduler（线程池的抽象）在指定延迟后在另一个 Thread 上传递信号。该信号传播到下游操作符，这使我们能够先添加产品，然后通知商店。我们组装的管道还有更多令人惊讶的方面，但我们不要太困惑。

问题在于，在 <4> 中，如果我们记录日志，我们无法真正确定调用将在哪个 Thread 上发生。像 flatMap 这样的操作符可以引入自己的异步性。

在常规情况下，当链被订阅时，值开始被传递。因此，我们可以在每次订阅时恢复 ThreadLocal 值。但这并非总是最好的主意。Subscription 可以异步传递，在不同的 Thread 上。值也可以在不同的 Thread 上传递。在背压的情况下，信号可以作为请求更多数据的结果在执行请求的 Thread 上传递，而不是由数据 Publisher 使用的 Thread。有很多需要考虑的活动部件和怪癖！要了解更多关于 Reactor 中的线程和异步执行，请查阅我们之前博客文章系列的另一部分。

Reactor Context

Project Reactor 引入了一种与函数式编程很好地对齐的机制，以提供传输上下文元数据的方法。它简单地称为 Context。尽管幕后发生了线程切换，但它仍然附加到响应式链上。

正如我们所见，Project Reactor 允许声明性地指定意图，同时保持并发无关性。它确实提供了在必要时控制并发的方法，通过使用专用操作符或配置参数（例如 publishOn、subscribeOn 或 flatMap 的高级参数），但这种控制级别与核心处理逻辑抽象分离。

我们前面提到过副作用。我们如何摆脱它们，同时仍然能够传输上下文元数据？

为了与函数式编程良好配合，Context 绑定到 Subscriber，即 Publisher 发出的信号的消费者。订阅时，Subscriber 对组装管道中的所有先行操作符可见。当我们使用不可变的 Map 状数据结构关联到 Subscriber 实例时，它允许在响应式管道的部分中附加和检索上下文信息。

通过控制影响以及在响应式链中的步骤之间提供继承的方法，Reactor Context 是一个无副作用的概念，可用于为处理提供元信息。“这正是我们关联请求所需要的！”

让我们重写我们的应用程序以使用 Reactor Context 而不是 ThreadLocal。

首先，我们需要将关联标识符设为日志方法的显式参数

static void log(String message, long correlationId) {
  String threadName = Thread.currentThread().getName();
  String threadNameTail = threadName.substring(
    Math.max(0, threadName.length() - 10));
  System.out.printf("[%10s][%20s] %s%n",
    threadNameTail, correlationId, message);
}

我们的行动如下

Mono<Void> addProduct(String productName) {
  return Mono.deferContextual(ctx -> {
    log("Adding product: " + productName, ctx.get("CORRELATION_ID"));
    return Mono.empty(); // Assume we’re actually storing the product
  });
}

Mono<Boolean> notifyShop(String productName) {
  return Mono.deferContextual(ctx -> {
    log("Notifying shop about: " + productName,
      ctx.get("CORRELATION_ID"));
    return Mono.just(true);
  });
}

有趣的是我们如何提供关联标识符。我们使用一个特殊的操作符 Mono.deferContextual，它可以访问 Context。我们从 ContextView（一个简化的、只读的 Context 版本）中提取关联标识符，然后返回一个实际的 Mono 供调用者订阅。

我们的处理程序看起来像这样

Mono<Void> handleRequest() {
  long correlationId = correlationId();
  log("Assembling the chain", correlationId);

  Mono.just("test-product")
    .delayElement(Duration.ofMillis(1))
    .flatMap(product ->
      Flux.concat(addProduct(product), notifyShop(product))
          .then())
    .contextWrite(Context.of("CORRELATION_ID", correlationId));

订阅后，输出符合预期

[      main][ 6328001264807824115] Assembling the chain
[parallel-1][ 6328001264807824115] Adding product: test-product
[parallel-1][ 6328001264807824115] Notifying shop about: test-product

信息流的反转是显而易见的。与任何响应式链一样，我们通过组装操作符链来定义处理流。一旦我们（或实际上是服务器）订阅此链，信息就会从下游操作符流向上游操作符以启动处理。之后，实际数据信号从上游传递到下游——例如，“test-product”值传递给 flatMap 操作符，然后传递给 concat 操作符，后者又将值提供给 addProduct 和 notifyShop。由于这种逻辑流，我们在最后（使用 contextWrite 方法）写入 Context，就在任何 Subscriber 订阅链之前。我们可以想象 Context 随后变得与 Subscriber 一起可供上游操作符中的所有阶段访问。

无论响应式管道在执行用户业务逻辑的过程中进行了多少次线程切换，上下文都不会丢失。

您可以在我们的文档中阅读有关 Reactor Context 的更多信息。

第三方库

不幸的是，我们不能指望第三方库使用 Reactor Context 来提供可观察性功能。传播隐式元信息的实际“货币”是 ThreadLocal。像 SLF4J 这样的库采用命令式风格，并在 Java 社区中占据稳定地位。如果我们能让它们与响应式范式协同工作，而不是期望它们适应响应式范式，那将是一个明显的胜利。在下一部分中，我们将讨论在 Spring Cloud Sleuth（一个可以与 Reactor 一起使用的追踪库）中传播响应式链中 ThreadLocal 值的历史和挑战。

Spring 博客

使用 Project Reactor 1 进行上下文传播 - 基础知识

ThreadLocal

异步处理

任务包装

Project Reactor

Reactor Context

第三方库

获取 Spring 新闻通讯

领先一步

获得支持

即将举行的活动