本文转自 公众号 ByteByteGo,如有侵权,请联系,立即删除
我们经常需要设计具有高可用性、高可扩展性和高吞吐量的系统。它们的确切含义是什么?
下图是一份系统设计小抄,包含“三高”常见的解决方案。
高可用意味着我们需要达到一个高水平的正常运行时间。我们通常将设计目标描述为 "3 个 9 " 或 “4 个 9”。“4 个九”,即 99.99% 的正常运行时间,意味着服务每天只能中断 8.64 秒。
要实现高可用性,我们需要在系统中设计冗余。有几种方法可以做到这一点:
两个实例接收相同的输入,并将输出发送到下游服务。如果其中一方宕机,另一方可以立即接替。由于两边都向下游发送输出,下游系统需要能够处理重复数据。
两个实例接收相同的输入,只有 Hot 端向下游服务发送输出。如果 Hot 端宕机, Warm 端将接替并开始向下游服务发送输出。
一个领导实例从上游系统接收数据并复制到其他副本。
这种集群中没有领导者。任何写入都会复制到其他实例。只要写入实例数加上读取实例数大于实例总数,我们就能获得有效数据。这被称为 quorum。
这意味着服务需要在一段时间内处理大量请求。常用的指标是 QPS(每秒查询次数)或 TPS(每秒事务次数)。
为了实现高吞吐量,我们通常会在架构中添加缓存,以避免经过数据库或磁盘等较慢的 I/O 设备。我们还可以为计算密集型任务增加线程数量。但是,增加过多的线程会降低性能。因此,我们需要找出系统的瓶颈,提高系统的吞吐量。
我们还可以在系统中使用异步处理,以有效地单独隔离耗时耗资源的组件。
高扩展性意味着系统可以快速、轻松地扩展,以容纳更多的容量(横向可扩展性)或更多的功能(纵向可扩展性)。通常,我们通过观察响应时间来决定是否需要扩展系统。
要实现高度可扩展性,需要隔离每个服务的职责。为此,微服务被广泛采用。我们还利用服务注册和负载平衡器将请求路由到适当的实例。