1.1 Sentinel介绍

    科技2025-06-04  31

     

    目录

    Pt1 基本概念

    Pt2 主要特性

    Pt3 核心原理

    Pt3.1 Sentinel框架

    Pt3.2 常用Slot

    NodeSelectorSlot

    ClusterBuilderSlot

    StatisticSlot

    FlowSlot

    DegradeSlot

    SystemSlot

    Pt3.3 核心类

    ProcessorSlotChain

    Context

    Entry

    Node

    StatisticSlot


    随着微服务的流行,服务和服务之间的稳定性变得越来越重要。Sentinel 是面向分布式服务架构的流量控制组件,主要以流量为切入点,从限流、流量整形、熔断降级、系统负载保护、热点防护等多个维度来帮助开发者保障微服务的稳定性。

     

    Pt1 基本概念

    限流

    限流是从系统能够承受的请求量考虑,应对突发流量的是系统保护策略。当请求的流量异常(突发流量或者是流量过载)时,为了进行自我保护,超过的流量将直接被丢弃或者进行排队处理(导致平均响应时间RT增高)。

    熔断

    熔断是从外部服务故障考虑,应对外部故障时的系统保护策略。主要有两种场景:上游系统请求量异常,对上游请求流量进行熔断,防止系统被压垮;下游依赖成功率或处理时间异常,对下游进行熔断,防止因下游导致自身处理变慢而导致的流量异常被压垮。

    降级

    当自身服务发生故障时,可以关闭当前服务,约定一个快速失败的Fallback,防止对上游调用链造成更大的影响。比如:连接超时、网络延迟、服务器响应时间过长。

    限流 Vs 熔断 Vs 降级 区别

    限流主要出于对异常流量考虑,为了保证系统不被突发流量击垮。

    熔断是出于服务故障考虑,应对服务中不稳定因素,防止远程服务故障引发的资源阻塞导致自身服务风险。

    降级通常是和熔断一起使用,牺牲非核心功能,或者对故障服务执行快速失败处理,防止引发雪崩效应。

     

    资源(需要被保护的)

    资源是 Sentinel 的关键概念。它可以是 Java 应用程序中的任何内容,例如,由应用程序提供的服务,或由应用程序调用的其它应用提供的服务,甚至可以是一段代码。只要通过 Sentinel API 定义的代码,就是资源,能够被 Sentinel 保护起来。大部分情况下,可以使用方法签名,URL,甚至服务名称作为资源名来标示资源。

    规则(限流规则/熔断规则)

    围绕资源的实时状态设定的规则,可以包括流量控制规则、熔断降级规则以及系统保护规则。所有规则可以动态实时调整。

     

    Pt2 主要特性

    Sentinel 分为两个部分:

    核心库(Java 客户端)不依赖任何框架/库,能够运行于所有 Java 运行时环境,同时对 Dubbo / Spring Cloud 等框架也有较好的支持。

    控制台(Dashboard)基于 Spring Boot 开发,打包后可以直接运行,不需要额外的 Tomcat 等应用容器。

     

    Pt3 核心原理

    Sentinel 的主要工作机制如下:

    对主流框架提供适配或者显示的 API,来定义需要保护的资源,并提供设施对资源进行实时统计和调用链路分析。

    根据预设的规则,结合对资源的实时统计信息,对流量进行控制。同时,Sentinel 提供开放的接口,方便您定义及改变规则。

    Sentinel 提供实时的监控系统,方便您快速了解目前系统的状态。

     

    Pt3.1 Sentinel框架

    在 Sentinel 里面,所有的资源都对应一个资源名称(resourceName),每次资源调用都会创建一个 Entry 对象。Entry 可以通过对主流框架的适配自动创建,也可以通过注解的方式或调用 SphU API 显式创建。Entry 创建的时候,同时也会创建一系列功能插槽(slot chain),这些插槽有不同的职责,例如:

    NodeSelectorSlot 负责收集资源的路径,并将这些资源的调用路径,以树状结构存储起来,用于根据调用路径来限流降级;

    ClusterBuilderSlot 则用于存储资源的统计信息以及调用者信息,例如该资源的 RT, QPS, thread count 等等,这些信息将用作为多维度限流,降级的依据;

    StatisticSlot 则用于记录、统计不同纬度的 runtime 指标监控信息;

    FlowSlot 则用于根据预设的限流规则以及前面 slot 统计的状态,来进行流量控制;

    AuthoritySlot 则根据配置的黑白名单和调用来源信息,来做黑白名单控制;

    DegradeSlot 则通过统计信息以及预设的规则,来做熔断降级;

    SystemSlot 则通过系统的状态,例如 load1 等,来控制总的入口流量;

     

    总体的框架如下:

    Sentinel 将 ProcessorSlot 作为 SPI 接口进行扩展(1.7.2 版本以前 SlotChainBuilder 作为 SPI),使得 Slot Chain 具备了扩展的能力。您可以自行加入自定义的 slot 并编排 slot 间的顺序,从而可以给 Sentinel 添加自定义的功能。

     

    Pt3.2 常用Slot

    NodeSelectorSlot

    这个 slot 主要负责收集资源的路径,并将这些资源的调用路径以树状结构存储起来,用于根据调用路径进行流量控制。

    ContextUtil.enter("entrance1", "appA"); Entry nodeA = SphU.entry("nodeA"); if (nodeA != null) {   nodeA.exit(); } ContextUtil.exit();

    上述代码通过 ContextUtil.enter() 创建了一个名为 entrance1 的上下文,同时指定调用发起者为 appA;接着通过SphU.entry()请求一个 token,如果该方法顺利执行没有抛 BlockException,表明 token 请求成功。

    以上代码将在内存中生成以下结构:

        machine-root                 /                   /         EntranceNode1             /             /       DefaultNode(nodeA)

    注意:每个 DefaultNode 由资源 ID 和输入名称来标识。换句话说,一个资源 ID 可以有多个不同入口的 DefaultNode。

    ContextUtil.enter("entrance1", "appA"); Entry nodeA = SphU.entry("nodeA"); if (nodeA != null) {   nodeA.exit(); } ContextUtil.exit(); ​ ContextUtil.enter("entrance2", "appA"); nodeA = SphU.entry("nodeA"); if (nodeA != null) {   nodeA.exit(); } ContextUtil.exit();

    以上代码将在内存中生成以下结构:

                      machine-root                   /         \                 /           \         EntranceNode1   EntranceNode2               /               \               /                 \       DefaultNode(nodeA)   DefaultNode(nodeA)

    上面的结构可以通过调用 curl http://localhost:8719/tree?type=root 来显示:

    EntranceNode: machine-root(t:0 pq:1 bq:0 tq:1 rt:0 prq:1 1mp:0 1mb:0 1mt:0) -EntranceNode1: Entrance1(t:0 pq:1 bq:0 tq:1 rt:0 prq:1 1mp:0 1mb:0 1mt:0) --nodeA(t:0 pq:1 bq:0 tq:1 rt:0 prq:1 1mp:0 1mb:0 1mt:0) -EntranceNode2: Entrance1(t:0 pq:1 bq:0 tq:1 rt:0 prq:1 1mp:0 1mb:0 1mt:0) --nodeA(t:0 pq:1 bq:0 tq:1 rt:0 prq:1 1mp:0 1mb:0 1mt:0) ​ t:threadNum pq:passQps bq:blockedQps tq:totalQps rt:averageRt prq: passRequestQps 1mp:1m-passed 1mb:1m-blocked 1mt:1m-total

     

    ClusterBuilderSlot

    此插槽用于构建资源的 ClusterNode 以及调用来源节点。ClusterNode 保持某个资源运行统计信息(响应时间、QPS、block 数目、线程数、异常数等)以及调用来源统计信息列表。调用来源的名称由 ContextUtil.enter(contextName,origin) 中的 origin 标记。可通过如下命令查看某个资源不同调用者的访问情况:curl http://localhost:8719/origin?id=caller:

    id: nodeA idx origin threadNum passedQps blockedQps totalQps aRt   1m-passed 1m-blocked 1m-total 1   caller1 0         0         0         0       0     0         0         0         2   caller2 0         0         0         0       0     0         0         0        

     

    StatisticSlot

    StatisticSlot 是 Sentinel 的核心功能插槽之一,用于统计实时的调用数据。

    clusterNode:资源唯一标识的 ClusterNode 的实时统计

    origin:根据来自不同调用者的统计信息

    defaultnode: 根据入口上下文区分的资源 ID 的 runtime 统计

    入口流量的统计

    Sentinel 底层采用高性能的滑动窗口数据结构 LeapArray 来统计实时的秒级指标数据,可以很好地支撑写多于读的高并发场景。

     

    FlowSlot

    这个 slot 主要根据预设的资源的统计信息,按照固定的次序,依次生效。如果一个资源对应两条或者多条流控规则,则会根据如下次序依次检验,直到全部通过或者有一个规则生效为止:

    指定应用生效的规则,即针对调用方限流的;

    调用方为 other 的规则;

    调用方为 default 的规则。

     

    DegradeSlot

    这个 slot 主要针对资源的平均响应时间(RT)以及异常比率,来决定资源是否在接下来的时间被自动熔断掉。

     

    SystemSlot

    这个 slot 会根据对于当前系统的整体情况,对入口资源的调用进行动态调配。其原理是让入口的流量和当前系统的预计容量达到一个动态平衡。

    注意系统规则只对入口流量起作用(调用类型为 EntryType.IN),对出口流量无效。可通过 SphU.entry(res, entryType) 指定调用类型,如果不指定,默认是EntryType.OUT。

     

    Pt3.3 核心类

    ProcessorSlotChain

    Sentinel 的核心骨架,将不同的 Slot 按照顺序串在一起(责任链模式),从而将不同的功能(限流、降级、系统保护)组合在一起。slot chain 其实可以分为两部分:统计数据构建部分(statistic)和判断部分(rule checking)。

    核心结构:

    目前的设计是 one slot chain per resource,因为某些 slot 是 per resource 的(比如 NodeSelectorSlot)。

     

    Context

    Context 代表调用链路上下文,贯穿一次调用链路中的所有 Entry。Context 维持着入口节点(entranceNode)、本次调用链路的 curNode、调用来源(origin)等信息。Context 名称即为调用链路入口名称。

    Context 维持的方式:通过 ThreadLocal 传递,只有在入口 enter 的时候生效。由于 Context 是通过 ThreadLocal 传递的,因此对于异步调用链路,线程切换的时候会丢掉 Context,因此需要手动通过 ContextUtil.runOnContext(context, f) 来变换 context。

     

    Entry

    每一次资源调用都会创建一个 Entry。Entry 包含了资源名、curNode(当前统计节点)、originNode(来源统计节点)等信息。

    CtEntry 为普通的 Entry,在调用 SphU.entry(xxx) 的时候创建。特性:Linked entry within current context(内部维护着 parent 和 child)

    需要注意的一点:CtEntry 构造函数中会做调用链的变换,即将当前 Entry 接到传入 Context 的调用链路上(setUpEntryFor)。

    资源调用结束时需要 entry.exit()。exit 操作会过一遍 slot chain exit,恢复调用栈,exit context 然后清空 entry 中的 context 防止重复调用。

     

    Node

    Sentinel 里面的各种种类的统计节点:

    StatisticNode:最为基础的统计节点,包含秒级和分钟级两个滑动窗口结构。

    DefaultNode:链路节点,用于统计调用链路上某个资源的数据,维持树状结构。

    ClusterNode:簇点,用于统计每个资源全局的数据(不区分调用链路),以及存放该资源的按来源区分的调用数据(类型为 StatisticNode)。特别地,Constants.ENTRY_NODE 节点用于统计全局的入口资源数据。

    EntranceNode:入口节点,特殊的链路节点,对应某个 Context 入口的所有调用数据。Constants.ROOT 节点也是入口节点。

    构建的时机:

    EntranceNode 在 ContextUtil.enter(xxx) 的时候就创建了,然后塞到 Context 里面。

    NodeSelectorSlot:根据 context 创建 DefaultNode,然后 set curNode to context。

    ClusterBuilderSlot:首先根据 resourceName 创建 ClusterNode,并且 set clusterNode to defaultNode;然后再根据 origin 创建来源节点(类型为 StatisticNode),并且 set originNode to curEntry。

    几种 Node 的维度(数目):

    ClusterNode 的维度是 resource

    DefaultNode 的维度是 resource * context,存在每个 NodeSelectorSlot 的 map 里面

    EntranceNode 的维度是 context,存在 ContextUtil 类的 contextNameNodeMap 里面

    来源节点(类型为 StatisticNode)的维度是 resource * origin,存在每个 ClusterNode 的 originCountMap 里面

     

    StatisticSlot

    StatisticSlot 是 Sentinel 最为重要的类之一,用于根据规则判断结果进行相应的统计操作。

    entry 的时候:依次执行后面的判断 slot。每个 slot 触发流控的话会抛出异常(BlockException 的子类)。若有 BlockException 抛出,则记录 block 数据;若无异常抛出则算作可通过(pass),记录 pass 数据。

    exit 的时候:若无 error(无论是业务异常还是流控异常),记录 complete(success)以及 RT,线程数-1。

    记录数据的维度:线程数+1、记录当前 DefaultNode 数据、记录对应的 originNode 数据(若存在 origin)、累计 IN 统计数据(若流量类型为 IN)。

    Processed: 0.010, SQL: 8