【分布式系统学习】之分布式入门理解

发布时间:2024年01月04日

1、问:谈谈对分布式系统的理解

答:
分布式系统通俗来说:就是将计算能力和数据存储能力分散在不同服务器上,通过网络连接组成的一个整体的服务,不同服务器可能是物理机,也可能是虚拟机,可以理解成一种解决方案。
举例:

比如,美团外卖,用户角度去看这就是一个能叫外卖的 APP,选商品,提单付款,等待配送后订单完成,如果从系统开发工程师角度去看,这个小小的 APP 后面却是一个非常庞大的系统,你点一次外卖,后台会经过几十次上百次服务调用才能完成整个流程。从大的角度去看,包括商品管理系统,订单系统,支付系统,结算系统,商家系统,配送系统,风控系统等等。每一个子系统又能分成若干个微服务,各个系统逻辑上构成一个整体统一对外服务。

  • 分布式系统就是将一个大的服务拆分成几十个甚至上百个微小的服务。
    如果把单体架构服务器比做篮子,那代码就是鸡蛋,不要让所有鸡蛋别装在一个篮子里,也方便大家分工开发,代码不在一个项目里,也不会冲突;解决传统单体服务架构带来的各种问题:代码数量庞大、迭代测试维护困难、一处改动测试不到位造成整个服务瘫痪等;

举例:
比如阿里的 Dubbo,还有 Spring 全家桶里的 Spring Cloud,都是解决分布式微服务架构的优秀框架。

2、问:那分布式系统环境下各自有什么优缺点?

答:

2.1 优点

从 4 个方面说:

- 系统可用性提升

一个系统全年可用时间在 99.999%,5 个 9 的服务可用率在设计合理的分布式系统中并不是一个触不可及的数字。
传统的集中式计算或集中式存储在遇见单点故障时很容易造成整个服务不可用,分布式下的服务体系,单台机器有故障,不致于造成整个服务不可用。

- 系统并发能力提升

请求通过 Nginx 负载均衡被分发到不同的服务器上,运行同样代码的服务器可以有 1 台或 N 台,通常情况下会根据实际用户访问量随时增加机器,无论是数据库或者服务,都可以做到随时水平扩展。
比如双 11 活动,平时订单少 50 台机器就够了,到了 11 订单量剧增,服务器增加到 100 台,每台机器之间相互独立,互不影响。

- 系统容错能力提升

举例:如下图
手里有笔,能给面试官随便画画)

同一组服务分别部署在北京上海杭州,杭州的机房突发断电或者火灾,杭州机房的流量会被自动分发到北京和上海的机房,不影响用户使用。

- 低延迟

参考上一个图,北京的用户请求自动分发到北京,上海的用户请求被分发到上海,服务器会根据用户的 IP 选择距离自己最近的机房,降低网络延迟。
面试官:嗯,基本覆盖全面了,继续说说缺点。

2.2 缺点

凡事具有两面性,分布式服务带来很多好处的同时肯定还会带来麻烦;
主要从 3 方面考虑。

- 分布式服务依赖网络

服务器间通讯依赖网络,不可靠网络包括网络延时,丢包、中断、异步,一个完整的服务请求依赖一连串服务调用,任意一个服务节点网络出现问题,都可能造成本次请求失败。

- 维护成本高

传统单体式服务只需要维护一个站点就可以。
分布式服务系统被拆分成若干个小服务,服务从 1 变为几十个上百个服务后,增加运维成本。

- 一致性,可用性,分区容错性无法同时满足(CAP原理)

这个是最主要的,这三种特性就是平时说的 CAP 定理,在分布式系统中,这三种特性最多只能满足两种,无法同时满足,需要根据实际情况去调整牺牲掉其中哪个。

如果能意识到 CAP 问题那就更好了,关于 CAP详见这篇博客 CAP原理详解

总结:

  1. 分布式系统,就是把整个业务系统拆分成很多的服务,服务之间代码都没有冲突,服务可以自治,每个服务到技术也可以自己选型,只要遵循统一的服务调用协议就可以了。每次发布如果就改动一个服务那就上线一个服务,不用所有人一起联调,这样每次发布牵扯到的改动影响也是可控的。不像传统单体架构服务,动辄几百万行代码融在一起。
  2. 分布式系统总结来说是将数据存储能力和计算能力分布到不同的服务器上,作为一个整体对外服务。目的在于解决单台机器的故障问题,单机计算和 IO 性能问题,以及单机存储空间不足的问题。虽然单机故障的概率比较小,但是随着集群规模大了之后,集群宕机和磁盘损坏基本上是常态,分布式系统主要解决的是各种故障带来的问题。
  3. 分布式系统和微服务什么关系

关于分布式系统和微服务,两者都只是一种概念。如果你采用微服务,就意味着系统一定是分布式的,分布式系统具有的优缺点在微服务理都会体现;(可以理解:微服务是分布式系统的一种具体落地方案。)
在这里插入图片描述

分布式系统的优点:

  • 提升服务可用性
  • 稳定性
  • 提升系统并发能力
  • 提升系统容错能力
  • 低延迟

分布式系统缺点:

  • 依赖网络,会因为网络问题导致系统数据丢失或不一致性;
  • 系统复杂化,系统监控维护,版本迭代发布变得相对复杂,成本高;
  • 一致性,可用性,分区容错性无法同时满足。

参考博客:https://blog.csdn.net/qq_34272760/article/details/120714630

文章来源:https://blog.csdn.net/m0_48904153/article/details/135371549
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。