如何使gRPC 获得最佳性能？

vlambda
2021-05-27

如何使gRPC 获得最佳性能？

gRPC 专用于高性能服务。本文档介绍如何从 gRPC 获得最佳性能。

重用 gRPC 通道

进行 gRPC 调用时，应重新使用 gRPC 通道。重用通道后通过现有的 HTTP/2 连接对调用进行多路复用。

如果为每个 gRPC 调用创建一个新通道，则完成此操作所需的时间可能会显著增加。每次调用都需要在客户端和服务器之间进行多个网络往返，以创建新的 HTTP/2 连接：

打开套接字
建立 TCP 连接
协商 TLS
启动 HTTP/2 连接
进行 gRPC 调用

在 gRPC 调用之间可以安全地共享和重用通道：

gRPC 客户端是使用通道创建的。 gRPC 客户端是轻型对象，无需缓存或重用。
可从一个通道创建多个 gRPC 客户端（包括不同类型的客户端）。
通道和从该通道创建的客户端可由多个线程安全使用。
从通道创建的客户端可同时进行多个调用。

GRPC 客户端工厂提供了一种集中配置通道的方法。它会自动重用基础通道。有关详细信息，请参阅 .NET 中的 gRPC 客户端工厂集成。

连接并发

HTTP/2 连接通常会限制一个连接上同时存在的最大并发流（活动 HTTP 请求）数。默认情况下，大多数服务器将此限制设置为 100 个并发流。

gRPC 通道使用单个 HTTP/2 连接，并且并发调用在该连接上多路复用。当活动调用数达到连接流限制时，其他调用会在客户端中排队。排队调用等待活动调用完成后再发送。由于此限制，具有高负载或长时间运行的流式处理 gRPC 调用的应用程序可能会因调用排队而出现性能问题。

.NET 5 引入 SocketsHttpHandler.EnableMultipleHttp2Connections 属性。如果设置为 true，则当达到并发流限制时，通道会创建额外的 HTTP/2 连接。创建 GrpcChannel 时，会自动将其内部 SocketsHttpHandler 配置为创建额外的 HTTP/2 连接。如果应用配置其自己的处理程序，请考虑将 EnableMultipleHttp2Connections 设置为 true：

var channel = GrpcChannel.ForAddress("https://localhost", new GrpcChannelOptions
{
 HttpHandler = new SocketsHttpHandler
 {
 EnableMultipleHttp2Connections = true,

 // ...configure other handler settings
 }
});

.NET Core 3.1 应用有几种解决方法：

为具有高负载的应用的区域创建单独的 gRPC 通道。例如，Logger gRPC 服务可能具有高负载。使用单独的通道在应用中创建 LoggerClient。
使用 gRPC 通道池，例如创建 gRPC 通道列表。每次需要 gRPC 通道时，使用 Random 从列表中选取一个通道。使用 Random 在多个连接上随机分配调用。

重要

提升服务器上的最大并发流限制是解决此问题的另一种方法。在 Kestrel 中，这是用 MaxStreamsPerConnection 配置的。

不建议提升最大并发流限制。单个 HTTP/2 连接上的流过多会带来新的性能问题：

尝试写入连接的流之间发生线程争用。
连接数据包丢失导致在 TCP 层阻止所有调用。

负载均衡

一些负载均衡器不能与 gRPC 一起高效工作。通过在终结点之间分布 TCP 连接，L4（传输）负载均衡器在连接级别上运行。这种方法非常适合使用 HTTP / 1.1 进行的负载均衡 API 调用。使用 HTTP/1.1 进行的并发调用在不同的连接上发送，实现调用在终结点之间的负载均衡。

由于 L4 负载均衡器是在连接级别运行的，它们不太适用于 gRPC。 GRPC 使用 HTTP/2，在单个 TCP 连接上多路复用多个调用。通过该连接的所有 gRPC 调用都将前往一个终结点。

有两种方法可以高效地对 gRPC 进行负载均衡：

客户端负载均衡
L7（应用程序）代理负载均衡

备注

只有 gRPC 调用可以在终结点之间进行负载均衡。一旦建立了流式 gRPC 调用，通过流发送的所有消息都将前往一个终结点。

客户端负载均衡

对于客户端负载均衡，客户端了解终结点。对于每个 gRPC 调用，客户端会选择一个不同的终结点作为将该调用发送到的目的地。如果延迟很重要，那么客户端负载均衡是一个很好的选择。客户端和服务之间没有代理，因此调用直接发送到服务。客户端负载均衡的缺点是每个客户端必须跟踪它应该使用的可用终结点。

Lookaside 客户端负载均衡是一种将负载均衡状态存储在中心位置的技术。客户端定期查询中心位置以获取在作出负载均衡决策时要使用的信息。

Grpc.Net.Client 当前不支持客户端负载均衡。如果 .NET 中需要客户端负载均衡，则 Grpc.Core 是一个不错的选择。

代理负载均衡

L7（应用程序）代理的工作级别高于 L4（传输）代理。 L7 代理了解 HTTP/2，并且能够在多个终结点之间的一个 HTTP/2 连接上将多路复用的 gRPC 调用分发给代理。使用代理比客户端负载均衡更简单，但会增加 gRPC 调用的额外延迟。

有很多 L7 代理可用。一些选项包括：

Envoy - 一种常用的开源代理。
Linkerd - Kubernetes 服务网格。
YARP:反向代理 - 用 .NET 编写的预览开源代理。

进程内通信

客户端和服务之间的 gRPC 调用通常通过 TCP 套接字发送。 TCP 非常适用于网络中的通信，但当客户端和服务在同一台计算机上时，进程间通信 (IPC) 的效率更高。

考虑在同一台计算机上的进程之间使用 Unix 域套接字或命名管道之类的传输进行 gRPC 调用。有关详细信息，请参阅使用 gRPC 进行进程间通信。

保持活动 ping

保持活动 ping 可用于在非活动期间使 HTTP/2 连接保持为活动状态。如果在应用恢复活动时已准备好现有 HTTP/2 连接，则可以快速进行初始 gRPC 调用，而不会因重新建立连接而导致延迟。

在 SocketsHttpHandler 上配置保持活动 ping：

var handler = new SocketsHttpHandler
{
 PooledConnectionIdleTimeout = Timeout.InfiniteTimeSpan,
 KeepAlivePingDelay = TimeSpan.FromSeconds(60),
 KeepAlivePingTimeout = TimeSpan.FromSeconds(30),
 EnableMultipleHttp2Connections = true
};

var channel = GrpcChannel.ForAddress("https://localhost:5001", new GrpcChannelOptions
{
 HttpHandler = handler
});

前面的代码配置了一个通道，该通道在非活动期间每 60 秒向服务器发送一次保持活动 ping。 ping 确保服务器和使用中的任何代理不会由于不活动而关闭连接。

流式处理

在高性能方案中，可使用 gRPC 双向流式处理取代一元 gRPC 调用。双向流启动后，来回流式处理消息比使用多个一元 gRPC 调用发送消息更快。流式处理消息作为现有 HTTP/2 请求上的数据发送，节省了为每个一元调用创建新的 HTTP/2 请求的开销。

示例服务：

public override async Task SayHello(IAsyncStreamReader<HelloRequest> requestStream,
 IServerStreamWriter<HelloReply> responseStream, ServerCallContext context)
{
 await foreach (var request in requestStream.ReadAllAsync())
 {
 var helloReply = new HelloReply { Message = "Hello " + request.Name };

 await responseStream.WriteAsync(helloReply);
 }
}

示例客户端：

var client = new Greet.GreeterClient(channel);
using var call = client.SayHello();

Console.WriteLine("Type a name then press enter.");
while (true)
{
 var text = Console.ReadLine();

 // Send and receive messages over the stream
 await call.RequestStream.WriteAsync(new HelloRequest { Name = text });
 await call.ResponseStream.MoveNext();

 Console.WriteLine($"Greeting: {call.ResponseStream.Current.Message}");
}

将一元调用替换为双向流式处理是一种高级技术，由于性能原因，这在许多情况下并不适用。

有以下情况时，使用流式处理调用是一个不错的选择：

需要高吞吐量或低延迟。
gRPC 和 HTTP/2 被标识为性能瓶颈。
客户端的辅助程序使用 gRPC 服务发送或接收常规消息。

请注意使用流式处理调用而不是一元调用的其他复杂性和限制：

流可能会因服务或连接错误而中断。需要在出现错误时重启流的逻辑。
对于多线程处理，RequestStream.WriteAsync 并不安全。一次只能将一条消息写入流中。通过单个流从多个线程发送消息需要制造者/使用者队列（如 Channel<T>）来整理消息。
gRPC 流式处理方法仅限于接收一种类型的消息并发送一种类型的消息。例如，rpc StreamingCall(stream RequestMessage) returns (stream ResponseMessage) 接收 RequestMessage 并发送 ResponseMessage。 Protobuf 对使用 Any 和 oneof 支持未知消息或条件消息，可以解决此限制。

二进制有效负载

Protobuf 支持标量值类型为 bytes 的二进制有效负载。 C# 中生成的属性使用 ByteString 作为属性类型。

syntax = "proto3";

message PayloadResponse {
 bytes data = 1;
}

Protobuf 是一种二进制格式，它以最小开销有效地序列化大型二进制有效负载。基于文本的格式（如 JSON）需要将字节编码为 base64，并将 33% 添加到消息大小。

使用大型 ByteString 有效负载时，有一些最佳做法可以避免下面所讨论的不必要副本和分配。

发送二进制有效负载

ByteString 实例通常使用 ByteString.CopyFrom(byte[] data) 创建。此方法会分配新的 ByteString 和新的 byte[]。数据会复制到新的字节数组中。

通过使用 UnsafeByteOperations.UnsafeWrap(ReadOnlyMemory<byte> bytes) 创建 ByteString 实例，可以避免其他分配和复制操作。

var data = await File.ReadAllBytesAsync(path);

var payload = new PayloadResponse();
payload.Data = UnsafeByteOperations.UnsafeWrap(data);

字节不会通过 UnsafeByteOperations.UnsafeWrap 进行复制，因此在使用 ByteString 时，不得修改字节。

UnsafeByteOperations.UnsafeWrap 要求使用 Google.Protobuf 版本 3.15.0 或更高版本。

读取二进制有效负载

通过使用 ByteString.Memory 和 ByteString.Span 属性，可以有效地从 ByteString 实例读取数据。

var byteString = UnsafeByteOperations.UnsafeWrap(new byte[] { 0, 1, 2 });
var data = byteString.Span;

for (var i = 0; i < data.Length; i++)
{
 Console.WriteLine(data[i]);
}

这些属性允许代码直接从 ByteString 读取数据，而无需分配或副本。

大多数 .NET API 具有 ReadOnlyMemory<byte> 和 byte[] 重载，因此建议使用 ByteString.Memory 来使用基础数据。但是，在某些情况下，应用可能需要将数据作为字节数组获取。如果需要字节数组，则 MemoryMarshal.TryGetArray 方法可用于从 ByteString 获取数组，而无需分配数据的新副本。

var byteString = GetByteString();

ByteArrayContent content;
if (MemoryMarshal.TryGetArray(byteString.Memory, out var segment))
{
 // Success. Use the ByteString's underlying array.
 content = new ByteArrayContent(segment.Array, segment.Offset, segment.Count);
}
else
{
 // TryGetArray didn't succeed. Fall back to creating a copy of the data with ToByteArray.
 content = new ByteArrayContent(byteString.ToByteArray());
}

var httpRequest = new HttpRequestMessage();
httpRequest.Content = content;

前面的代码：

尝试使用 MemoryMarshal.TryGetArray 从 ByteString.Memory 获取数组。
如果成功检索，则使用 ArraySegment<byte>。段具有对数组、偏移和计数的引用。
否则，将回退到使用 ByteString.ToByteArray() 分配新数组。

vlambda博客
学习文章列表