Kubernetes 指标参考
Kubernetes 组件导出的指标数据的详细信息。
指标(v1.30)
此页面详细介绍了不同 Kubernetes 组件导出的指标。可以使用 HTTP 抓取查询这些组件的指标端点,并以 Prometheus 格式获取当前指标数据。
稳定 Kubernetes 指标列表
稳定指标遵守严格的 API 合同,在指标生命周期中,不能添加或删除稳定指标的标签。
apiserver_admission_controller_admission_duration_seconds
准入控制器延迟直方图(以秒为单位),按名称标识,并按每个操作和 API 资源以及类型(验证或准入)细分。
- 稳定
- 直方图
apiserver_admission_step_admission_duration_seconds
准入子步骤延迟直方图(以秒为单位),按每个操作和 API 资源以及步骤类型(验证或准入)细分。
- 稳定
- 直方图
apiserver_admission_webhook_admission_duration_seconds
准入 webhook 延迟直方图(以秒为单位),按名称标识,并按每个操作和 API 资源以及类型(验证或准入)细分。
- 稳定
- 直方图
apiserver_current_inflight_requests
过去一秒内,此 apiserver 的每个请求类型使用的活动请求限制的最大值。
- 稳定
- 仪表
apiserver_longrunning_requests
所有活动长时间运行的 apiserver 请求的仪表,按动词、组、版本、资源、范围和组件细分。并非所有请求都以这种方式跟踪。
- 稳定
- 仪表
apiserver_request_duration_seconds
每个动词、干运行值、组、版本、资源、子资源、范围和组件的响应延迟分布(以秒为单位)。
- 稳定
- 直方图
apiserver_request_total
apiserver 请求的计数器,按每个动词、干运行值、组、版本、资源、范围、组件和 HTTP 响应代码细分。
- 稳定
- 计数器
apiserver_requested_deprecated_apis
已请求的已弃用 API 的仪表,按 API 组、版本、资源、子资源和 removed_release 细分。
- 稳定
- 仪表
apiserver_response_sizes
每个组、版本、动词、资源、子资源、范围和组件的响应大小分布(以字节为单位)。
- 稳定
- 直方图
apiserver_storage_objects
上次检查时存储的对象数量,按类型划分。如果出现获取错误,则值为 -1。
- 稳定
- 仪表
apiserver_storage_size_bytes
物理分配的存储数据库文件的大小(以字节为单位)。
- 稳定
- 自定义
container_cpu_usage_seconds_total
容器消耗的累积 CPU 时间(以核心秒为单位)
- 稳定
- 自定义
container_memory_working_set_bytes
容器当前工作集的大小(以字节为单位)
- 稳定
- 自定义
container_start_time_seconds
容器自 Unix 纪元开始的启动时间(以秒为单位)
- 稳定
- 自定义
cronjob_controller_job_creation_skew_duration_seconds
cronjob 计划运行的时间和相应作业创建的时间之间的间隔
- 稳定
- 直方图
job_controller_job_pods_finished_total
已完全跟踪的已完成 Pod 的数量
- 稳定
- 计数器
job_controller_job_sync_duration_seconds
同步作业所需的时间
- 稳定
- 直方图
job_controller_job_syncs_total
作业同步次数
- 稳定
- 计数器
job_controller_jobs_finished_total
已完成作业的数量
- 稳定
- 计数器
kube_pod_resource_limit
集群中工作负载的资源限制,按 Pod 细分。这显示了调度程序和 kubelet 预期每个 Pod 使用的资源,以及资源的单位(如果有)。
- 稳定
- 自定义
kube_pod_resource_request
集群中工作负载请求的资源,按 Pod 细分。这显示了调度程序和 kubelet 预期每个 Pod 使用的资源,以及资源的单位(如果有)。
- 稳定
- 自定义
kubernetes_healthcheck
此指标记录单个健康检查的结果。
- 稳定
- 仪表
kubernetes_healthchecks_total
此指标记录所有健康检查的结果。
- 稳定
- 计数器
node_collector_evictions_total
自当前 NodeController 实例启动以来发生的节点驱逐次数。
- 稳定
- 计数器
node_cpu_usage_seconds_total
节点消耗的累积 CPU 时间(以核心秒为单位)
- 稳定
- 自定义
node_memory_working_set_bytes
节点当前工作集的大小(以字节为单位)
- 稳定
- 自定义
pod_cpu_usage_seconds_total
Pod 消耗的累积 CPU 时间(以核心秒为单位)
- 稳定
- 自定义
pod_memory_working_set_bytes
Pod 当前工作集的大小(以字节为单位)
- 稳定
- 自定义
resource_scrape_error
如果获取容器指标时出错,则为 1;否则为 0。
- 稳定
- 自定义
scheduler_framework_extension_point_duration_seconds
运行特定扩展点的所有插件的延迟。
- 稳定
- 直方图
scheduler_pending_pods
挂起的 Pod 数量,按队列类型划分。'active' 表示 activeQ 中的 Pod 数量;'backoff' 表示 backoffQ 中的 Pod 数量;'unschedulable' 表示调度程序尝试调度但失败的 unschedulablePods 中的 Pod 数量;'gated' 表示调度程序从未尝试调度的 unschedulablePods 的数量,因为它们被屏蔽。
- 稳定
- 仪表
scheduler_pod_scheduling_attempts
成功调度 Pod 的尝试次数。
- 稳定
- 直方图
scheduler_pod_scheduling_duration_seconds
调度 Pod 的端到端延迟,可能包含多次调度尝试。
- 稳定
- 直方图
- 1.29.0
scheduler_preemption_attempts_total
到目前为止集群中的抢占尝试总次数
- 稳定
- 计数器
scheduler_preemption_victims
选定的抢占受害者数量
- 稳定
- 直方图
scheduler_queue_incoming_pods_total
按事件和队列类型划分添加到调度队列的 Pod 数量。
- 稳定
- 计数器
scheduler_schedule_attempts_total
调度 Pod 的尝试次数,按结果划分。'unschedulable' 表示 Pod 无法调度,而 'error' 表示调度程序内部问题。
- 稳定
- 计数器
scheduler_scheduling_attempt_duration_seconds
调度尝试延迟(以秒为单位)(调度算法 + 绑定)
- 稳定
- 直方图
Beta Kubernetes 指标列表
Beta 指标遵守比其稳定对应指标更宽松的 API 合同。在 Beta 指标的生命周期中,不能删除标签,但是,可以在指标处于 Beta 阶段时添加标签。这提供了保证,即 Beta 指标将遵守现有的仪表板和警报,同时允许在将来进行修改。
apiserver_flowcontrol_current_executing_requests
API 优先级和公平性子系统中处于初始(对于 WATCH)或任何(对于非 WATCH)执行阶段的请求数量
- BETA
- 仪表
apiserver_flowcontrol_current_executing_seats
API 优先级和公平性子系统中当前执行(对于 WATCH 为初始阶段,其他情况为任何阶段)的请求占用的并发性(座位数)
- BETA
- 仪表
apiserver_flowcontrol_current_inqueue_requests
API 优先级和公平性子系统中当前在队列中挂起的请求数量
- BETA
- 仪表
apiserver_flowcontrol_dispatched_requests_total
由 API 优先级和公平性子系统执行的请求数量
- BETA
- 计数器
apiserver_flowcontrol_nominal_limit_seats
为每个优先级级别配置的名义执行座位数
- BETA
- 仪表
apiserver_flowcontrol_rejected_requests_total
API 优先级和公平性子系统拒绝的请求数
- BETA
- 计数器
apiserver_flowcontrol_request_wait_duration_seconds
请求在其队列中等待的时间长度
- BETA
- 直方图
disabled_metrics_total
已禁用的指标数量。
- BETA
- 计数器
hidden_metrics_total
隐藏指标的数量。
- BETA
- 计数器
kubernetes_feature_enabled
此指标记录有关 k8s 功能的阶段和启用状态的数据。
- BETA
- 仪表
registered_metrics_total
按稳定性级别和弃用版本细分的已注册指标数量。
- BETA
- 计数器
scheduler_pod_scheduling_sli_duration_seconds
Pod 调度的端到端延迟,从 Pod 进入调度队列开始,可能涉及多次调度尝试。
- BETA
- 直方图
Alpha Kubernetes 指标列表
Alpha 指标没有任何 API 保证。使用这些指标存在风险,Kubernetes 的后续版本可能完全删除这些指标,或以破坏现有仪表板和警报的方式更改 API。
aggregator_discovery_aggregation_count_total
发现被聚合的次数计数器
- ALPHA
- 计数器
aggregator_openapi_v2_regeneration_count
OpenAPI v2 规范重新生成计数器,按导致的 APIService 名称和原因细分。
- ALPHA
- 计数器
aggregator_openapi_v2_regeneration_duration
OpenAPI v2 规范重新生成持续时间的 Gauge,以秒为单位。
- ALPHA
- 仪表
aggregator_unavailable_apiservice
标记为不可用的 APIService 的 Gauge,按 APIService 名称细分。
- ALPHA
- 自定义
aggregator_unavailable_apiservice_total
标记为不可用的 APIService 的计数器,按 APIService 名称和原因细分。
- ALPHA
- 计数器
apiextensions_apiserver_validation_ratcheting_seconds
更新期间用于将旧版本与新版本进行比较以执行 CRDValidationRatcheting 的时间(以秒为单位)。
- ALPHA
- 直方图
apiextensions_openapi_v2_regeneration_count
OpenAPI v2 规范重新生成计数器,按导致的 CRD 名称和原因细分。
- ALPHA
- 计数器
apiextensions_openapi_v3_regeneration_count
OpenAPI v3 规范重新生成计数器,按组、版本、导致的 CRD 和原因细分。
- ALPHA
- 计数器
apiserver_admission_match_condition_evaluation_errors_total
准入匹配条件评估错误计数,按包含匹配条件的资源名称标识,并按包含 matchConditions 的每个类型(webhook 或策略)、操作和准入类型(验证或准入)细分。
- ALPHA
- 计数器
apiserver_admission_match_condition_evaluation_seconds
准入匹配条件评估时间(以秒为单位),按名称标识,并按包含 matchConditions 的每个类型(webhook 或策略)、操作和类型(验证或准入)细分。
- ALPHA
- 直方图
apiserver_admission_match_condition_exclusions_total
准入匹配条件评估排除计数,按包含匹配条件的资源名称标识,并按包含 matchConditions 的每个类型(webhook 或策略)、操作和准入类型(验证或准入)细分。
- ALPHA
- 计数器
apiserver_admission_step_admission_duration_seconds_summary
准入子步骤延迟摘要(以秒为单位),按每个操作和 API 资源以及步骤类型(验证或准入)细分。
- ALPHA
- Summary
apiserver_admission_webhook_fail_open_count
准入 webhook 故障打开计数,按名称标识,并按每个准入类型(验证或变异)细分。
- ALPHA
- 计数器
apiserver_admission_webhook_rejection_count
准入 webhook 拒绝计数,按名称标识,并按每个准入类型(验证或准入)和操作细分。其他标签指定错误类型(如果发生错误,则为 calling_webhook_error 或 apiserver_internal_error;否则为 no_error),以及 webhook 使用 HTTP 状态码拒绝请求时可选的非零拒绝码(当代码大于或等于 400 时,apiserver 会遵守)。大于 600 的代码将截断为 600,以保持指标基数的界限。
- ALPHA
- 计数器
apiserver_admission_webhook_request_total
准入 webhook 请求总数,按名称标识,并按每个准入类型(验证或变异)和操作细分。其他标签指定请求是否被拒绝以及 HTTP 状态码。大于 600 的代码将截断为 600,以保持指标基数的界限。
- ALPHA
- 计数器
apiserver_audit_error_total
无法正确审核的审核事件计数器。插件标识受错误影响的插件。
- ALPHA
- 计数器
apiserver_audit_event_total
生成的审核事件计数器,并发送到审核后端。
- ALPHA
- 计数器
apiserver_audit_level_total
审核事件的策略级别计数器(每个请求 1 个)。
- ALPHA
- 计数器
apiserver_audit_requests_rejected_total
由于审核日志后端中的错误而导致的 apiserver 请求被拒绝的计数器。
- ALPHA
- 计数器
apiserver_authentication_config_controller_automatic_reload_last_timestamp_seconds
按状态和 apiserver 身份细分的身份验证配置的最后一次自动重新加载的时间戳。
- ALPHA
- 仪表
apiserver_authentication_config_controller_automatic_reloads_total
按状态和 apiserver 身份细分的身份验证配置的自动重新加载总数。
- ALPHA
- 计数器
apiserver_authentication_jwt_authenticator_latency_seconds
jwt 身份验证操作的延迟(以秒为单位)。这是仅在缓存未命中时(即,当缓存中未找到令牌时)用于对令牌进行身份验证的时间。
- ALPHA
- 直方图
apiserver_authorization_config_controller_automatic_reload_last_timestamp_seconds
按状态和 apiserver 身份细分的授权配置的最后一次自动重新加载的时间戳。
- ALPHA
- 仪表
apiserver_authorization_config_controller_automatic_reloads_total
按状态和 apiserver 身份细分的授权配置的自动重新加载总数。
- ALPHA
- 计数器
apiserver_authorization_decisions_total
授权者做出的最终决定总数,按授权者类型、名称和决定细分。
- ALPHA
- 计数器
apiserver_authorization_match_condition_evaluation_errors_total
授权 webhook 遇到匹配条件错误时的错误总数,按授权者类型和名称细分。
- ALPHA
- 计数器
apiserver_authorization_match_condition_evaluation_seconds
授权匹配条件评估时间(以秒为单位),按授权者类型和名称细分。
- ALPHA
- 直方图
apiserver_authorization_match_condition_exclusions_total
由于匹配条件将其排除在外而跳过授权 webhook 时的排除总数。
- ALPHA
- 计数器
apiserver_authorization_webhook_duration_seconds
请求延迟(以秒为单位)。
- ALPHA
- 直方图
apiserver_authorization_webhook_evaluations_fail_open_total
由于 webhook 超时或错误而导致的 NoOpinion 结果。
- ALPHA
- 计数器
apiserver_authorization_webhook_evaluations_total
与授权 webhook 的往返次数。
- ALPHA
- 计数器
apiserver_cache_list_fetched_objects_total
在提供 LIST 请求过程中从监视缓存中读取的对象数量
- ALPHA
- 计数器
apiserver_cache_list_returned_objects_total
从监视缓存中返回的 LIST 请求的对象数量
- ALPHA
- 计数器
apiserver_cache_list_total
从监视缓存中提供的 LIST 请求的数量
- ALPHA
- 计数器
apiserver_cel_compilation_duration_seconds
CEL 编译时间(以秒为单位)。
- ALPHA
- 直方图
apiserver_cel_evaluation_duration_seconds
CEL 评估时间(以秒为单位)。
- ALPHA
- 直方图
apiserver_certificates_registry_csr_honored_duration_total
已发行的 CSR 总数,其请求的持续时间已得到满足,按签名者细分(仅明确标识 kubernetes.io 签名者名称)
- ALPHA
- 计数器
apiserver_certificates_registry_csr_requested_duration_total
已发行的 CSR 总数,其请求的持续时间,按签名者细分(仅明确标识 kubernetes.io 签名者名称)
- ALPHA
- 计数器
apiserver_client_certificate_expiration_seconds
用于对请求进行身份验证的证书剩余生命周期的分布。
- ALPHA
- 直方图
apiserver_clusterip_repair_ip_errors_total
修复循环检测到的 clusterip 错误数量,按错误类型细分:泄漏、修复、完整、超出范围、重复、未知、无效
- ALPHA
- 计数器
apiserver_clusterip_repair_reconcile_errors_total
clusterip 修复协调循环上的协调失败次数
- ALPHA
- 计数器
apiserver_conversion_webhook_duration_seconds
转换 webhook 请求延迟
- ALPHA
- 直方图
apiserver_conversion_webhook_request_total
转换 webhook 请求的计数器,包含成功/失败和失败错误类型
- ALPHA
- 计数器
apiserver_crd_conversion_webhook_duration_seconds
CRD webhook 转换持续时间(以秒为单位)
- ALPHA
- 直方图
apiserver_current_inqueue_requests
过去一秒内此 apiserver 中每个请求类型的排队请求的最大数量。
- ALPHA
- 仪表
apiserver_delegated_authn_request_duration_seconds
请求延迟(以秒为单位)。按状态码细分。
- ALPHA
- 直方图
apiserver_delegated_authn_request_total
按状态码划分的 HTTP 请求数量。
- ALPHA
- 计数器
apiserver_delegated_authz_request_duration_seconds
请求延迟(以秒为单位)。按状态码细分。
- ALPHA
- 直方图
apiserver_delegated_authz_request_total
按状态码划分的 HTTP 请求数量。
- ALPHA
- 计数器
apiserver_egress_dialer_dial_duration_seconds
拨号延迟直方图(以秒为单位),按协议(http-connect 或 grpc)、传输(tcp 或 uds)标记
- ALPHA
- 直方图
apiserver_egress_dialer_dial_failure_count
拨号失败计数,按协议(http-connect 或 grpc)、传输(tcp 或 uds)和阶段(连接或代理)标记。阶段指示拨号失败的阶段
- ALPHA
- 计数器
apiserver_egress_dialer_dial_start_total
拨号开始,按协议(http-connect 或 grpc)和传输(tcp 或 uds)标记。
- ALPHA
- 计数器
apiserver_encryption_config_controller_automatic_reload_failures_total
按 apiserver 身份细分的加密配置的自动重新加载失败总数。
- ALPHA
- 计数器
- 1.30.0
apiserver_encryption_config_controller_automatic_reload_last_timestamp_seconds
按 apiserver 身份细分的加密配置的最后一次成功或失败的自动重新加载的时间戳。
- ALPHA
- 仪表
apiserver_encryption_config_controller_automatic_reload_success_total
按 apiserver 身份细分的加密配置的自动重新加载成功总数。
- ALPHA
- 计数器
- 1.30.0
apiserver_encryption_config_controller_automatic_reloads_total
按 apiserver 身份细分的加密配置的重新加载成功和失败总数。
- ALPHA
- 计数器
apiserver_envelope_encryption_dek_cache_fill_percent
缓存中当前被缓存的 DEK 占用的槽位百分比。
- ALPHA
- 仪表
apiserver_envelope_encryption_dek_cache_inter_arrival_time_seconds
转换请求的到达间隔时间(以秒为单位)。
- ALPHA
- 直方图
apiserver_envelope_encryption_dek_source_cache_size
数据加密密钥 (DEK) 源缓存中的记录数。在重启时,此值近似于服务器将向 KMS 插件发出的解密 RPC 调用数量。
- ALPHA
- 仪表
apiserver_envelope_encryption_invalid_key_id_from_status_total
Status RPC 调用返回无效 keyID 的次数,按错误细分。
- ALPHA
- 计数器
apiserver_envelope_encryption_key_id_hash_last_timestamp_seconds
keyID 最后使用的时间(以秒为单位)。
- ALPHA
- 仪表
apiserver_envelope_encryption_key_id_hash_status_last_timestamp_seconds
Status RPC 调用返回 keyID 的最后时间(以秒为单位)。
- ALPHA
- 仪表
apiserver_envelope_encryption_key_id_hash_total
按转换类型、提供程序和 apiserver 标识拆分的 keyID 使用次数。
- ALPHA
- 计数器
apiserver_envelope_encryption_kms_operations_latency_seconds
带有 gRPC 错误代码状态的 KMS 操作持续时间总计。
- ALPHA
- 直方图
apiserver_flowcontrol_current_inqueue_seats
API 优先级和公平性子系统队列中当前正在等待的席位数。
- ALPHA
- 仪表
apiserver_flowcontrol_current_limit_seats
每个优先级级别当前可用的执行席位数。
- ALPHA
- 仪表
apiserver_flowcontrol_current_r
R(上次更改时间)。
- ALPHA
- 仪表
apiserver_flowcontrol_demand_seats
每纳秒结束时,观察到的(每个优先级级别可以使用的席位数)/(该级别的名义席位数)。
- ALPHA
- TimingRatioHistogram
apiserver_flowcontrol_demand_seats_average
上次调整周期内,demand_seats 的时间加权平均值。
- ALPHA
- 仪表
apiserver_flowcontrol_demand_seats_high_watermark
上次调整周期内,demand_seats 的高水位线。
- ALPHA
- 仪表
apiserver_flowcontrol_demand_seats_smoothed
平滑的席位需求。
- ALPHA
- 仪表
apiserver_flowcontrol_demand_seats_stdev
上次调整周期内,demand_seats 的时间加权标准差。
- ALPHA
- 仪表
apiserver_flowcontrol_dispatch_r
R(上次调度时间)。
- ALPHA
- 仪表
apiserver_flowcontrol_epoch_advance_total
队列集的进度表向后跳动的次数。
- ALPHA
- 计数器
apiserver_flowcontrol_latest_s
S(最近一次调度请求)。
- ALPHA
- 仪表
apiserver_flowcontrol_lower_limit_seats
每个优先级级别可用的执行席位的配置下限。
- ALPHA
- 仪表
apiserver_flowcontrol_next_discounted_s_bounds
队列中 S(队列中最旧的等待请求) - 估计的正在进行的工作的最小值和最大值。
- ALPHA
- 仪表
apiserver_flowcontrol_next_s_bounds
队列中 S(队列中最旧的等待请求)的最小值和最大值。
- ALPHA
- 仪表
apiserver_flowcontrol_priority_level_request_utilization
每纳秒结束时,观察到的正在等待或处于任何执行阶段(但 WATCH 仅处于初始阶段)的请求数(作为相关限制的一部分)。
- ALPHA
- TimingRatioHistogram
apiserver_flowcontrol_priority_level_seat_utilization
每纳秒结束时,观察到的用于任何执行阶段(但 WATCH 仅处于初始阶段)的席位利用率。
- ALPHA
- TimingRatioHistogram
- phase:executing
apiserver_flowcontrol_read_vs_write_current_requests
每纳秒结束时,观察到的正在等待或处于常规执行阶段的请求数(作为相关限制的一部分)。
- ALPHA
- TimingRatioHistogram
apiserver_flowcontrol_request_concurrency_in_use
API 优先级和公平性子系统中当前执行(对于 WATCH 为初始阶段,其他情况为任何阶段)的请求占用的并发性(座位数)
- ALPHA
- 仪表
- 1.31.0
apiserver_flowcontrol_request_concurrency_limit
为每个优先级级别配置的名义执行座位数
- ALPHA
- 仪表
- 1.30.0
apiserver_flowcontrol_request_dispatch_no_accommodation_total
由于没有可用席位而导致的调度尝试导致无法容纳的次数。
- ALPHA
- 计数器
apiserver_flowcontrol_request_execution_seconds
API 优先级和公平性子系统中请求执行的初始阶段(对于 WATCH)或任何(对于非 WATCH)阶段的持续时间。
- ALPHA
- 直方图
apiserver_flowcontrol_request_queue_length_after_enqueue
每个请求在排队后看到的 API 优先级和公平性子系统中的队列长度。
- ALPHA
- 直方图
apiserver_flowcontrol_seat_fair_frac
分配给每个可以使用的优先级级别的服务器并发性的公平比例。
- ALPHA
- 仪表
apiserver_flowcontrol_target_seats
席位分配目标。
- ALPHA
- 仪表
apiserver_flowcontrol_upper_limit_seats
每个优先级级别可用的执行席位的配置上限。
- ALPHA
- 仪表
apiserver_flowcontrol_watch_count_samples
API 优先级和公平性中对可变请求的观察者数量。
- ALPHA
- 直方图
apiserver_flowcontrol_work_estimated_seats
与 API 优先级和公平性中的请求相关的估计席位数(初始席位和最终席位的最大值)。
- ALPHA
- 直方图
apiserver_init_events_total
按资源类型细分的 watch 缓存中处理的 init 事件计数器。
- ALPHA
- 计数器
apiserver_kube_aggregator_x509_insecure_sha1_total
计算对服务器的请求数量,这些服务器在服务证书中具有不安全的 SHA1 签名,或者计算由于不安全的 SHA1 签名导致的连接失败数量(基于运行时环境,任一或两者)。
- ALPHA
- 计数器
apiserver_kube_aggregator_x509_missing_san_total
计算对服务器的请求数量,这些服务器在服务证书中缺少 SAN 扩展名,或者计算由于缺少 x509 证书 SAN 扩展名而导致的连接失败数量(基于运行时环境,任一或两者)。
- ALPHA
- 计数器
apiserver_nodeport_repair_port_errors_total
修复循环检测到的端口错误数量,按错误类型细分:泄漏、修复、已满、超出范围、重复、未知。
- ALPHA
- 计数器
apiserver_nodeport_repair_reconcile_errors_total
nodeport 修复协调循环的协调失败次数。
- ALPHA
- 计数器
apiserver_request_aborts_total
apiserver 可能由于超时而中止的请求数量,对于每个组、版本、动词、资源、子资源和范围。
- ALPHA
- 计数器
apiserver_request_body_size_bytes
按资源和动词细分的 apiserver 请求正文大小(以字节为单位)。
- ALPHA
- 直方图
apiserver_request_filter_duration_seconds
每个过滤器类型的请求过滤器延迟分布(以秒为单位)。
- ALPHA
- 直方图
apiserver_request_post_timeout_total
跟踪与关联请求超时后请求处理程序的活动。
- ALPHA
- 计数器
apiserver_request_sli_duration_seconds
每个动词、组、版本、资源、子资源、范围和组件的响应延迟分布(不包括 webhook 持续时间和优先级和公平性队列等待时间)(以秒为单位)。
- ALPHA
- 直方图
apiserver_request_slo_duration_seconds
每个动词、组、版本、资源、子资源、范围和组件的响应延迟分布(不包括 webhook 持续时间和优先级和公平性队列等待时间)(以秒为单位)。
- ALPHA
- 直方图
- 1.27.0
apiserver_request_terminations_total
apiserver 为自我防御而终止的请求数量。
- ALPHA
- 计数器
apiserver_request_timestamp_comparison_time
在 UPDATE 或 PATCH 请求中比较旧对象和新对象所需的时间。
- ALPHA
- 直方图
apiserver_rerouted_request_total
由于本地 apiserver 无法提供服务而被代理到对等 kube apiserver 的请求总数。
- ALPHA
- 计数器
apiserver_selfrequest_total
按每个动词、API 资源和子资源细分的 apiserver 自请求计数器。
- ALPHA
- 计数器
apiserver_storage_data_key_generation_duration_seconds
数据加密密钥 (DEK) 生成操作的延迟(以秒为单位)。
- ALPHA
- 直方图
apiserver_storage_data_key_generation_failures_total
数据加密密钥 (DEK) 生成操作失败的总数。
- ALPHA
- 计数器
apiserver_storage_db_total_size_in_bytes
存储数据库文件实际分配的总大小(以字节为单位)。
- ALPHA
- 仪表
- 1.28.0
apiserver_storage_decode_errors_total
按对象类型细分的存储对象解码错误数量。
- ALPHA
- 计数器
apiserver_storage_envelope_transformation_cache_misses_total
访问密钥解密密钥 (KEK) 时缓存未命中的总数。
- ALPHA
- 计数器
apiserver_storage_events_received_total
按类型细分的接收到的 etcd 事件数量。
- ALPHA
- 计数器
apiserver_storage_list_evaluated_objects_total
在为存储提供 LIST 请求的过程中测试的对象数量。
- ALPHA
- 计数器
apiserver_storage_list_fetched_objects_total
在为 LIST 请求提供服务时从存储中读取的对象数量。
- ALPHA
- 计数器
apiserver_storage_list_returned_objects_total
为 LIST 请求从存储返回的对象数量。
- ALPHA
- 计数器
apiserver_storage_list_total
从存储中提供的 LIST 请求数量。
- ALPHA
- 计数器
apiserver_storage_transformation_duration_seconds
值转换操作的延迟(以秒为单位)。
- ALPHA
- 直方图
apiserver_storage_transformation_operations_total
转换的总数。成功的转换将具有状态“OK”,而转换失败时将具有不同的状态字符串。此状态和 transformation_type 字段可用于使用 transformation_type from_storage(用于解密)和 to_storage(用于加密)来提醒加密/解密失败。
- ALPHA
- 计数器
apiserver_stream_translator_requests_total
由 StreamTranslatorProxy 处理的请求总数,StreamTranslatorProxy 处理流式 RemoteCommand/V5。
- ALPHA
- 计数器
apiserver_terminated_watchers_total
由于无响应而关闭的观察者计数器,按资源类型细分。
- ALPHA
- 计数器
apiserver_tls_handshake_errors_total
使用“TLS 握手错误来自”错误删除的请求数量。
- ALPHA
- 计数器
apiserver_validating_admission_policy_check_duration_seconds
单个验证表达式(以秒为单位)的验证准入延迟,按策略标记,并进一步包括绑定、状态和采取的强制措施。
- ALPHA
- 直方图
apiserver_validating_admission_policy_check_total
验证准入策略检查总数,按策略标记,并进一步通过绑定、采取的强制措施和状态识别。
- ALPHA
- 计数器
apiserver_validating_admission_policy_definition_total
验证准入策略总数,按状态和强制措施标记。
- ALPHA
- 计数器
apiserver_watch_cache_events_dispatched_total
按资源类型细分的 watch 缓存中分派的事件计数器。
- ALPHA
- 计数器
apiserver_watch_cache_events_received_total
按资源类型细分的 watch 缓存中接收到的事件计数器。
- ALPHA
- 计数器
apiserver_watch_cache_initializations_total
按资源类型细分的 watch 缓存初始化计数器。
- ALPHA
- 计数器
apiserver_watch_cache_read_wait_seconds
等待 watch 缓存变为最新的时间直方图。
- ALPHA
- 直方图
apiserver_watch_events_sizes
观察事件大小分布(以字节为单位)。
- ALPHA
- 直方图
apiserver_watch_events_total
watch 客户端发送的事件数量。
- ALPHA
- 计数器
apiserver_watch_list_duration_seconds
按组、版本、资源和范围细分的 watch 列表请求的响应延迟分布(以秒为单位)。
- ALPHA
- 直方图
apiserver_webhooks_x509_insecure_sha1_total
计算对服务器的请求数量,这些服务器在服务证书中具有不安全的 SHA1 签名,或者计算由于不安全的 SHA1 签名导致的连接失败数量(基于运行时环境,任一或两者)。
- ALPHA
- 计数器
apiserver_webhooks_x509_missing_san_total
计算对服务器的请求数量,这些服务器在服务证书中缺少 SAN 扩展名,或者计算由于缺少 x509 证书 SAN 扩展名而导致的连接失败数量(基于运行时环境,任一或两者)。
- ALPHA
- 计数器
attach_detach_controller_attachdetach_controller_forced_detaches
A/D 控制器执行强制分离的次数。
- ALPHA
- 计数器
attachdetach_controller_total_volumes
A/D 控制器中的卷数。
- ALPHA
- 自定义
authenticated_user_requests
按用户名细分的已验证请求计数器。
- ALPHA
- 计数器
authentication_attempts
已验证尝试的计数器。
- ALPHA
- 计数器
authentication_duration_seconds
按结果细分的身份验证持续时间(以秒为单位)。
- ALPHA
- 直方图
authentication_token_cache_active_fetch_count
- ALPHA
- 仪表
authentication_token_cache_fetch_total
- ALPHA
- 计数器
authentication_token_cache_request_duration_seconds
- ALPHA
- 直方图
authentication_token_cache_request_total
- ALPHA
- 计数器
authorization_attempts_total
授权尝试计数器,按结果细分。结果可以是“允许”、“拒绝”、“无意见”或“错误”。
- ALPHA
- 计数器
授权持续时间(秒)
按结果细分的授权持续时间(秒)。
- ALPHA
- 直方图
云提供商 Webhook 请求持续时间(秒)
请求延迟(以秒为单位)。按状态码细分。
- ALPHA
- 直方图
云提供商 Webhook 请求总数
按状态码划分的 HTTP 请求数量。
- ALPHA
- 计数器
云提供商 GCE API 请求持续时间(秒)
GCE API 调用的延迟
- ALPHA
- 直方图
云提供商 GCE API 请求错误
API 调用的错误数量
- ALPHA
- 计数器
容器交换使用量(字节)
容器交换使用量的当前字节数。仅在非 Windows 系统上报告
- ALPHA
- 自定义
CSI 操作持续时间(秒)
容器存储接口操作持续时间,包含 gRPC 错误代码状态总数
- ALPHA
- 直方图
端点切片控制器更改
端点切片更改的数量
- ALPHA
- 计数器
端点切片控制器期望的端点切片
在完美端点分配的情况下存在的端点切片数量
- ALPHA
- 仪表
端点切片控制器每次同步添加的端点
每次服务同步添加的端点数量
- ALPHA
- 直方图
端点切片控制器期望的端点
期望的端点数量
- ALPHA
- 仪表
端点切片控制器每次同步删除的端点
每次服务同步删除的端点数量
- ALPHA
- 直方图
端点切片控制器每次同步更改的端点切片
每次服务同步更改的端点切片数量
- ALPHA
- 直方图
端点切片控制器端点切片数量
端点切片数量
- ALPHA
- 仪表
端点切片控制器按流量分配分类的服务数量
使用特定流量分配的服务数量
- ALPHA
- 仪表
端点切片控制器同步
端点切片同步的数量
- ALPHA
- 计数器
端点切片镜像控制器每次同步跳过的地址
每次端点同步由于无效或超过 MaxEndpointsPerSubset 而跳过的地址数量
- ALPHA
- 直方图
端点切片镜像控制器更改
端点切片更改的数量
- ALPHA
- 计数器
端点切片镜像控制器期望的端点切片
在完美端点分配的情况下存在的端点切片数量
- ALPHA
- 仪表
端点切片镜像控制器每次同步添加的端点
每次端点同步添加的端点数量
- ALPHA
- 直方图
端点切片镜像控制器期望的端点
期望的端点数量
- ALPHA
- 仪表
端点切片镜像控制器每次同步删除的端点
每次端点同步删除的端点数量
- ALPHA
- 直方图
端点切片镜像控制器端点同步持续时间
syncEndpoints() 的持续时间(秒)
- ALPHA
- 直方图
端点切片镜像控制器每次同步更新的端点
每次端点同步更新的端点数量
- ALPHA
- 直方图
端点切片镜像控制器端点切片数量
端点切片数量
- ALPHA
- 仪表
短暂卷控制器创建失败总数
持久卷声明创建请求的数量
- ALPHA
- 计数器
短暂卷控制器创建总数
持久卷声明创建请求的数量
- ALPHA
- 计数器
etcd 书签计数
按类型划分的 etcd 书签(进度通知事件)数量。
- ALPHA
- 仪表
etcd 租约对象计数
附加到单个 etcd 租约的对象数量。
- ALPHA
- 直方图
etcd 请求持续时间(秒)
每个操作和对象类型的 etcd 请求延迟(秒)。
- ALPHA
- 直方图
etcd 请求错误总数
每个操作和对象类型的 etcd 失败请求计数。
- ALPHA
- 计数器
etcd 请求总数
每个操作和对象类型的 etcd 请求计数。
- ALPHA
- 计数器
etcd 版本信息
etcd 服务器的二进制版本
- ALPHA
- 仪表
字段验证请求持续时间(秒)
每个字段验证值的响应延迟分布(秒)
- ALPHA
- 直方图
强制清理失败的卷操作错误总数
在 kubelet 启动期间其重建失败后强制清理失败的卷数量。
- ALPHA
- 计数器
强制清理失败的卷操作总数
在 kubelet 启动期间其重建失败后被强制清理的卷数量。这包括成功和失败的清理。
- ALPHA
- 计数器
垃圾收集器控制器资源同步错误总数
垃圾收集器资源同步错误的数量
- ALPHA
- 计数器
获取令牌计数
对备用令牌源的 Token() 请求总数计数器
- ALPHA
- 计数器
获取令牌失败计数
对备用令牌源的 Token() 请求失败计数器
- ALPHA
- 计数器
水平 Pod 自动伸缩器控制器指标计算持续时间(秒)
HPA 控制器计算一个指标所需的时间(秒)。标签“操作”应为“缩减”、“扩展”或“无”。标签“错误”应为“规范”、“内部”或“无”。标签“指标类型”对应于 HPA.spec.metrics[*].type
- ALPHA
- 直方图
水平 Pod 自动伸缩器控制器指标计算总数
指标计算次数。标签“操作”应为“缩减”、“扩展”或“无”。此外,标签“错误”应为“规范”、“内部”或“无”。标签“指标类型”对应于 HPA.spec.metrics[*].type
- ALPHA
- 计数器
水平 Pod 自动伸缩器控制器协调持续时间(秒)
HPA 控制器协调一次所需的时间(秒)。标签“操作”应为“缩减”、“扩展”或“无”。此外,标签“错误”应为“规范”、“内部”或“无”。请注意,如果在协调期间发生规范错误和内部错误,则报告第一个发生的错误在“错误”标签中。
- ALPHA
- 直方图
水平 Pod 自动伸缩器控制器协调总数
HPA 控制器的协调次数。标签“操作”应为“缩减”、“扩展”或“无”。此外,标签“错误”应为“规范”、“内部”或“无”。请注意,如果在协调期间发生规范错误和内部错误,则报告第一个发生的错误在“错误”标签中。
- ALPHA
- 计数器
作业控制器作业完成索引总数
`已完成索引的数量。状态标签的可能值为:“成功”、“失败”。回退限制标签的可能值为:“每索引”和“全局”`
- ALPHA
- 计数器
作业控制器作业 Pod 创建总数
`作业控制器创建的 Pod 数量,这些 Pod 用 Pod 创建原因标记。此指标还区分使用不同 Pod 替换策略设置创建的 Pod。原因标签的可能值为:,新、重新创建终止或失败、重新创建失败。状态标签的可能值为:,成功、失败。`
- ALPHA
- 计数器
作业控制器由外部控制器管理的作业总数
由外部控制器管理的作业数量
- ALPHA
- 计数器
作业控制器由失败策略处理的 Pod 失败总数
`根据匹配的规则应用的失败策略操作处理的失败 Pod 数量。操作标签的可能值对应于失败策略规则操作的可能值,即:,FailJob、Ignore 和 Count。`
- ALPHA
- 计数器
作业控制器终止 Pod 跟踪终结器总数
`已终止的 Pod 数量(阶段=失败|成功),这些 Pod 具有终结器 batch.kubernetes.io/job-tracking。事件标签可以是“添加”或“删除”。`
- ALPHA
- 计数器
kube_apiserver_clusterip_allocator_allocated_ips
测量为服务分配的 IP 数量的指标
- ALPHA
- 仪表
kube_apiserver_clusterip_allocator_allocation_errors_total
尝试分配集群 IP 时出现的错误数量
- ALPHA
- 计数器
kube_apiserver_clusterip_allocator_allocation_total
集群 IP 分配的数量
- ALPHA
- 计数器
kube_apiserver_clusterip_allocator_available_ips
测量可用于服务的 IP 数量的指标
- ALPHA
- 仪表
kube_apiserver_nodeport_allocator_allocated_ports
测量为服务分配的 NodePort 数量的指标
- ALPHA
- 仪表
kube_apiserver_nodeport_allocator_allocation_errors_total
尝试分配 NodePort 时出现的错误数量
- ALPHA
- 计数器
kube_apiserver_nodeport_allocator_allocation_total
NodePort 分配的数量
- ALPHA
- 计数器
kube_apiserver_nodeport_allocator_available_ports
测量可用于服务的 NodePort 数量的指标
- ALPHA
- 仪表
kube_apiserver_pod_logs_backend_tls_failure_total
由于 kubelet 服务器 TLS 验证失败而导致的 pods/logs 请求总数
- ALPHA
- 计数器
kube_apiserver_pod_logs_insecure_backend_total
按使用类型划分的 pods/logs 请求总数:enforce_tls、skip_tls_allowed、skip_tls_denied
- ALPHA
- 计数器
kube_apiserver_pod_logs_pods_logs_backend_tls_failure_total
由于 kubelet 服务器 TLS 验证失败而导致的 pods/logs 请求总数
- ALPHA
- 计数器
- 1.27.0
kube_apiserver_pod_logs_pods_logs_insecure_backend_total
按使用类型划分的 pods/logs 请求总数:enforce_tls、skip_tls_allowed、skip_tls_denied
- ALPHA
- 计数器
- 1.27.0
kubelet_active_pods
kubelet 认为活动并正在考虑在接受新 Pod 时考虑的 Pod 数量。static 为 true 表示 Pod 不是来自 apiserver。
- ALPHA
- 仪表
kubelet_certificate_manager_client_expiration_renew_errors
证书续订错误计数器。
- ALPHA
- 计数器
kubelet_certificate_manager_client_ttl_seconds
Kubelet 客户端证书 TTL(生存时间)的指标。该值以秒为单位,表示到证书到期的时间(如果已过期则为负数)。如果客户端证书无效或未使用,则该值为 +INF。
- ALPHA
- 仪表
kubelet_certificate_manager_server_rotation_seconds
前一个证书在轮换之前存活的秒数直方图。
- ALPHA
- 直方图
kubelet_certificate_manager_server_ttl_seconds
Kubelet 服务器证书的最短 TTL(生存时间)的指标。该值以秒为单位,表示到证书到期的时间(如果已过期则为负数)。如果服务器证书无效或未使用,则该值为 +INF。
- ALPHA
- 仪表
kubelet_cgroup_manager_duration_seconds
cgroup 管理器操作的持续时间(秒)。按方法细分。
- ALPHA
- 直方图
kubelet_container_log_filesystem_used_bytes
容器日志在文件系统上使用的字节数。
- ALPHA
- 自定义
kubelet_containers_per_pod_count
每个 Pod 的容器数量。
- ALPHA
- 直方图
kubelet_cpu_manager_pinning_errors_total
需要固定但失败的 CPU 内核分配数量。
- ALPHA
- 计数器
kubelet_cpu_manager_pinning_requests_total
需要固定的 CPU 内核分配数量。
- ALPHA
- 计数器
kubelet_credential_provider_plugin_duration
凭据提供程序插件执行持续时间(秒)
- ALPHA
- 直方图
kubelet_credential_provider_plugin_errors
凭据提供程序插件的错误数量
- ALPHA
- 计数器
kubelet_desired_pods
kubelet 被指示运行的 Pod 数量。static 为 true 表示 Pod 不是来自 apiserver。
- ALPHA
- 仪表
kubelet_device_plugin_alloc_duration_seconds
为设备插件分配请求提供服务的持续时间(秒)。按资源名称细分。
- ALPHA
- 直方图
kubelet_device_plugin_registration_total
设备插件注册的累积数量。按资源名称细分。
- ALPHA
- 计数器
kubelet_evented_pleg_connection_error_count
与 CRI 运行时建立流式连接时遇到的错误数量。
- ALPHA
- 计数器
kubelet_evented_pleg_connection_latency_seconds
与 CRI 运行时的流式连接延迟,以秒为单位。
- ALPHA
- 直方图
kubelet_evented_pleg_connection_success_count
获得流式客户端以接收 CRI 事件的次数。
- ALPHA
- 计数器
kubelet_eviction_stats_age_seconds
收集统计信息的时间与 Pod 由于这些统计信息被驱逐信号驱逐的时间之间的间隔
- ALPHA
- 直方图
kubelet_evictions
按驱逐信号划分的 Pod 驱逐的累积数量
- ALPHA
- 计数器
kubelet_graceful_shutdown_end_time_seconds
自 Unix 纪元以来的秒数,最后一次正常关机开始时间
- ALPHA
- 仪表
kubelet_graceful_shutdown_start_time_seconds
自 Unix 纪元以来的秒数,最后一次正常关机开始时间
- ALPHA
- 仪表
kubelet_http_inflight_requests
正在进行的 HTTP 请求数量
- ALPHA
- 仪表
kubelet_http_requests_duration_seconds
为 HTTP 请求提供服务的持续时间(秒)
- ALPHA
- 直方图
kubelet_http_requests_total
服务器启动后接收到的 HTTP 请求数量
- ALPHA
- 计数器
kubelet_image_garbage_collected_total
kubelet 垃圾收集的图像总数,无论是通过磁盘使用量还是图像年龄。
- ALPHA
- 计数器
kubelet_image_pull_duration_seconds
拉取图像的持续时间(秒)。
- ALPHA
- 直方图
kubelet_lifecycle_handler_http_fallbacks_total
生命周期处理程序从 https 成功回退到 http 的次数。
- ALPHA
- 计数器
kubelet_managed_ephemeral_containers
此 kubelet 管理的 Pod 中的短暂容器的当前数量。
- ALPHA
- 仪表
kubelet_memory_manager_pinning_errors_total
需要固定内存页分配的次数,这些分配失败。
- ALPHA
- 计数器
kubelet_memory_manager_pinning_requests_total
需要固定内存页分配的次数。
- ALPHA
- 计数器
kubelet_mirror_pods
kubelet 尝试创建的镜像 Pod 数量(每个已承认的静态 Pod 一个)。
- ALPHA
- 仪表
kubelet_node_name
节点的名称。计数始终为 1。
- ALPHA
- 仪表
kubelet_node_startup_duration_seconds
节点启动的总时长(以秒为单位)。
- ALPHA
- 仪表
kubelet_node_startup_post_registration_duration_seconds
节点在注册后启动的时长(以秒为单位)。
- ALPHA
- 仪表
kubelet_node_startup_pre_kubelet_duration_seconds
kubelet 启动之前节点启动的时长(以秒为单位)。
- ALPHA
- 仪表
kubelet_node_startup_pre_registration_duration_seconds
节点在注册之前启动的时长(以秒为单位)。
- ALPHA
- 仪表
kubelet_node_startup_registration_duration_seconds
节点在注册期间启动的时长(以秒为单位)。
- ALPHA
- 仪表
kubelet_orphan_pod_cleaned_volumes
上次周期性扫描中清理了其卷的孤立 Pod 的总数。
- ALPHA
- 仪表
kubelet_orphan_pod_cleaned_volumes_errors
上次周期性扫描中未能清理其卷的孤立 Pod 的数量。
- ALPHA
- 仪表
kubelet_orphaned_runtime_pods_total
在容器运行时检测到的但 Pod 工作器尚未知晓的 Pod 数量。这通常表明 kubelet 在 Pod 在 API 或本地配置中被强制删除时重新启动,这种情况很少见。
- ALPHA
- 计数器
kubelet_pleg_discard_events
PLEG 中丢弃事件的数量。
- ALPHA
- 计数器
kubelet_pleg_last_seen_seconds
PLEG 最后一次被检测为活动的时戳(以秒为单位)。
- ALPHA
- 仪表
kubelet_pleg_relist_duration_seconds
在 PLEG 中重新列出 Pod 的时长(以秒为单位)。
- ALPHA
- 直方图
kubelet_pleg_relist_interval_seconds
PLEG 中重新列出之间的间隔(以秒为单位)。
- ALPHA
- 直方图
kubelet_pod_resources_endpoint_errors_get
向 PodResource Get 端点发出的返回错误的请求数量。按服务器 API 版本细分。
- ALPHA
- 计数器
kubelet_pod_resources_endpoint_errors_get_allocatable
向 PodResource GetAllocatableResources 端点发出的返回错误的请求数量。按服务器 API 版本细分。
- ALPHA
- 计数器
kubelet_pod_resources_endpoint_errors_list
向 PodResource List 端点发出的返回错误的请求数量。按服务器 API 版本细分。
- ALPHA
- 计数器
kubelet_pod_resources_endpoint_requests_get
向 PodResource Get 端点发出的请求数量。按服务器 API 版本细分。
- ALPHA
- 计数器
kubelet_pod_resources_endpoint_requests_get_allocatable
向 PodResource GetAllocatableResources 端点发出的请求数量。按服务器 API 版本细分。
- ALPHA
- 计数器
kubelet_pod_resources_endpoint_requests_list
向 PodResource List 端点发出的请求数量。按服务器 API 版本细分。
- ALPHA
- 计数器
kubelet_pod_resources_endpoint_requests_total
向 PodResource 端点发出的请求的累计数量。按服务器 API 版本细分。
- ALPHA
- 计数器
kubelet_pod_start_duration_seconds
从 kubelet 第一次看到 Pod 到 Pod 开始运行的时长(以秒为单位)。
- ALPHA
- 直方图
kubelet_pod_start_sli_duration_seconds
启动 Pod 的时长(以秒为单位),不包括拉取镜像和运行初始化容器的时间,从 Pod 创建时间戳到所有容器报告为已启动并通过 watch 观察到的时间进行测量。
- ALPHA
- 直方图
kubelet_pod_start_total_duration_seconds
从创建开始启动 Pod 的时长(以秒为单位),包括拉取镜像和运行初始化容器的时间,从 Pod 创建时间戳到所有容器报告为已启动并通过 watch 观察到的时间进行测量。
- ALPHA
- 直方图
kubelet_pod_status_sync_duration_seconds
同步 Pod 状态更新的时长(以秒为单位)。测量从检测到 Pod 状态更改到 API 成功更新该 Pod 的时间,即使在此期间发生了多个 Pod 状态更改。
- ALPHA
- 直方图
kubelet_pod_worker_duration_seconds
同步单个 Pod 的时长(以秒为单位)。按操作类型细分:创建、更新或同步。
- ALPHA
- 直方图
kubelet_pod_worker_start_duration_seconds
从 kubelet 看到 Pod 到启动工作器的时长(以秒为单位)。
- ALPHA
- 直方图
kubelet_preemptions
通过抢占资源抢占 Pod 的累计次数。
- ALPHA
- 计数器
kubelet_restarted_pods_total
由于 kubelet 在观察这些 Pod 时被删除并使用相同的 UID 重新创建而被重新启动的 Pod 数量(静态 Pod 很常见,API Pod 极其罕见)。
- ALPHA
- 计数器
kubelet_run_podsandbox_duration_seconds
run_podsandbox 操作的时长(以秒为单位)。按 RuntimeClass.Handler 细分。
- ALPHA
- 直方图
kubelet_run_podsandbox_errors_total
按 RuntimeClass.Handler 统计的 run_podsandbox 操作错误的累计数量。
- ALPHA
- 计数器
kubelet_running_containers
当前正在运行的容器数量。
- ALPHA
- 仪表
kubelet_running_pods
具有正在运行的 Pod 沙箱的 Pod 数量。
- ALPHA
- 仪表
kubelet_runtime_operations_duration_seconds
运行时操作的时长(以秒为单位)。按操作类型细分。
- ALPHA
- 直方图
kubelet_runtime_operations_errors_total
按操作类型统计的运行时操作错误的累计数量。
- ALPHA
- 计数器
kubelet_runtime_operations_total
按操作类型统计的运行时操作的累计数量。
- ALPHA
- 计数器
kubelet_server_expiration_renew_errors
证书续订错误计数器。
- ALPHA
- 计数器
kubelet_sleep_action_terminated_early_total
生命周期睡眠处理程序在完成之前被终止的次数。
- ALPHA
- 计数器
kubelet_started_containers_errors_total
启动容器时发生的错误的累计数量。
- ALPHA
- 计数器
kubelet_started_containers_total
启动的容器的累计数量。
- ALPHA
- 计数器
kubelet_started_host_process_containers_errors_total
启动主机进程容器时发生的错误的累计数量。此指标仅在 Windows 上收集。
- ALPHA
- 计数器
kubelet_started_host_process_containers_total
启动的主机进程容器的累计数量。此指标仅在 Windows 上收集。
- ALPHA
- 计数器
kubelet_started_pods_errors_total
启动 Pod 时发生的错误的累计数量。
- ALPHA
- 计数器
kubelet_started_pods_total
启动的 Pod 的累计数量。
- ALPHA
- 计数器
kubelet_topology_manager_admission_duration_ms
为 Pod 准入请求提供服务的时长(以毫秒为单位)。
- ALPHA
- 直方图
kubelet_topology_manager_admission_errors_total
无法对齐资源的准入请求失败次数。
- ALPHA
- 计数器
kubelet_topology_manager_admission_requests_total
需要对齐资源的准入请求次数。
- ALPHA
- 计数器
kubelet_volume_metric_collection_duration_seconds
计算卷统计信息所花费的时长(以秒为单位)。
- ALPHA
- 直方图
kubelet_volume_stats_available_bytes
卷中可用字节数。
- ALPHA
- 自定义
kubelet_volume_stats_capacity_bytes
卷的容量(以字节为单位)。
- ALPHA
- 自定义
kubelet_volume_stats_health_status_abnormal
异常的卷运行状况。计数为 1 或 0。1 表示卷不健康,0 表示卷健康。
- ALPHA
- 自定义
kubelet_volume_stats_inodes
卷中 inode 的最大数量。
- ALPHA
- 自定义
kubelet_volume_stats_inodes_free
卷中空闲 inode 的数量。
- ALPHA
- 自定义
kubelet_volume_stats_inodes_used
卷中已使用 inode 的数量。
- ALPHA
- 自定义
kubelet_volume_stats_used_bytes
卷中已使用的字节数。
- ALPHA
- 自定义
kubelet_working_pods
kubelet 实际运行的 Pod 数量,按生命周期阶段细分,包括 Pod 是否为预期 Pod、孤立 Pod 或仅限运行时(也是孤立 Pod)以及 Pod 是否为静态 Pod。孤立 Pod 已从本地配置中删除或在 API 中被强制删除,并使用无法以其他方式看到资源。
- ALPHA
- 仪表
kubeproxy_network_programming_duration_seconds
集群网络编程延迟(以秒为单位)。
- ALPHA
- 直方图
kubeproxy_proxy_healthz_total
代理 healthz HTTP 状态的累计数量。
- ALPHA
- 计数器
kubeproxy_proxy_livez_total
代理 livez HTTP 状态的累计数量。
- ALPHA
- 计数器
kubeproxy_sync_full_proxy_rules_duration_seconds
完全重新同步时 SyncProxyRules 的延迟(以秒为单位)。
- ALPHA
- 直方图
kubeproxy_sync_partial_proxy_rules_duration_seconds
部分重新同步时 SyncProxyRules 的延迟(以秒为单位)。
- ALPHA
- 直方图
kubeproxy_sync_proxy_rules_duration_seconds
SyncProxyRules 的延迟(以秒为单位)。
- ALPHA
- 直方图
kubeproxy_sync_proxy_rules_endpoint_changes_pending
待处理的代理规则端点更改。
- ALPHA
- 仪表
kubeproxy_sync_proxy_rules_endpoint_changes_total
代理规则端点更改的累计数量。
- ALPHA
- 计数器
kubeproxy_sync_proxy_rules_iptables_last
上次同步时 kube-proxy 写入的 iptables 规则数量。
- ALPHA
- 仪表
kubeproxy_sync_proxy_rules_iptables_partial_restore_failures_total
代理 iptables 部分恢复失败的累计次数。
- ALPHA
- 计数器
kubeproxy_sync_proxy_rules_iptables_restore_failures_total
代理 iptables 恢复失败的累计次数。
- ALPHA
- 计数器
kubeproxy_sync_proxy_rules_iptables_total
kube-proxy 拥有的 iptables 规则总数。
- ALPHA
- 仪表
kubeproxy_sync_proxy_rules_last_queued_timestamp_seconds
上次排队同步代理规则的时间。
- ALPHA
- 仪表
kubeproxy_sync_proxy_rules_last_timestamp_seconds
上次成功同步代理规则的时间。
- ALPHA
- 仪表
kubeproxy_sync_proxy_rules_no_local_endpoints_total
具有本地流量策略但没有端点的服务数量。
- ALPHA
- 仪表
kubeproxy_sync_proxy_rules_service_changes_pending
待处理的代理规则服务更改。
- ALPHA
- 仪表
kubeproxy_sync_proxy_rules_service_changes_total
代理规则服务更改的累计数量。
- ALPHA
- 计数器
kubernetes_build_info
一个值为常量“1”的指标,用主版本、次版本、Git 版本、Git 提交、Git 树状态、构建日期、Go 版本和编译器(从中构建了 Kubernetes)以及运行它的平台进行标记。
- ALPHA
- 仪表
leader_election_master_status
指示报告系统是否是相关租约的主机的度量,0 表示备用,1 表示主机。“name”是用于标识租约的字符串。请确保按名称分组。
- ALPHA
- 仪表
leader_election_slowpath_total
在续订领导者租约时执行的慢速路径的总数。“name”是用于标识租约的字符串。请确保按名称分组。
- ALPHA
- 计数器
node_authorizer_graph_actions_duration_seconds
节点授权器中图操作的持续时间的直方图。
- ALPHA
- 直方图
node_collector_unhealthy_nodes_in_zone
测量每个区域中未就绪节点数量的指标。
- ALPHA
- 仪表
node_collector_update_all_nodes_health_duration_seconds
NodeController 更新所有节点运行状况的时长(以秒为单位)。
- ALPHA
- 直方图
node_collector_update_node_health_duration_seconds
NodeController 更新单个节点运行状况的时长(以秒为单位)。
- ALPHA
- 直方图
node_collector_zone_health
测量每个区域中健康节点百分比的指标。
- ALPHA
- 仪表
node_collector_zone_size
测量每个区域中已注册节点数量的指标。
- ALPHA
- 仪表
node_controller_cloud_provider_taint_removal_delay_seconds
节点创建后 NodeController 删除单个节点的云提供商污染的时间(以秒为单位)。
- ALPHA
- 直方图
node_controller_initial_node_sync_delay_seconds
节点创建后 NodeController 完成单个节点的初始同步的时间(以秒为单位)。
- ALPHA
- 直方图
node_ipam_controller_cidrset_allocation_tries_per_request
每次服务同步添加的端点数量
- ALPHA
- 直方图
node_ipam_controller_cidrset_cidrs_allocations_total
测量 CIDR 分配总数的计数器。
- ALPHA
- 计数器
node_ipam_controller_cidrset_cidrs_releases_total
测量 CIDR 释放总数的计数器。
- ALPHA
- 计数器
node_ipam_controller_cidrset_usage_cidrs
测量已分配 CIDR 百分比的指标。
- ALPHA
- 仪表
node_ipam_controller_cirdset_max_cidrs
可以分配的 CIDR 的最大数量。
- ALPHA
- 仪表
node_swap_usage_bytes
节点的当前交换使用量(以字节为单位)。仅在非 Windows 系统上报告。
- ALPHA
- 自定义
number_of_l4_ilbs
L4 ILB 的数量。
- ALPHA
- 仪表
plugin_manager_total_plugins
插件管理器中的插件数量。
- ALPHA
- 自定义
pod_gc_collector_force_delete_pod_errors_total
Pod GC Controller 启动后,强制删除 Pod 时遇到的错误数量。
- ALPHA
- 计数器
pod_gc_collector_force_delete_pods_total
Pod GC Controller 启动后,正在被强制删除的 Pod 数量。
- ALPHA
- 计数器
pod_security_errors_total
阻止正常评估的错误数量。非致命错误可能导致使用最新的受限配置文件进行评估。
- ALPHA
- 计数器
pod_security_evaluations_total
不计忽略或豁免请求的策略评估次数。
- ALPHA
- 计数器
pod_security_exemptions_total
豁免请求数,不包括忽略的或超出范围的请求。
- ALPHA
- 计数器
pod_swap_usage_bytes
Pod 交换使用量的当前字节数。仅在非 Windows 系统上报告
- ALPHA
- 自定义
prober_probe_duration_seconds
探针响应的持续时间(秒)。
- ALPHA
- 直方图
prober_probe_total
容器的存活性、就绪性或启动探针的累积次数,按结果分类。
- ALPHA
- 计数器
pv_collector_bound_pv_count
衡量当前已绑定持久卷数量的 Gauge。
- ALPHA
- 自定义
pv_collector_bound_pvc_count
衡量当前已绑定持久卷声明数量的 Gauge。
- ALPHA
- 自定义
pv_collector_total_pv_count
衡量持久卷总数的 Gauge。
- ALPHA
- 自定义
pv_collector_unbound_pv_count
衡量当前未绑定持久卷数量的 Gauge。
- ALPHA
- 自定义
pv_collector_unbound_pvc_count
衡量当前未绑定持久卷声明数量的 Gauge。
- ALPHA
- 自定义
reconstruct_volume_operations_errors_total
在 kubelet 启动期间,从操作系统重建失败的卷数。
- ALPHA
- 计数器
reconstruct_volume_operations_total
在 kubelet 启动期间,尝试从操作系统重建的卷数。这包括成功和失败的重建。
- ALPHA
- 计数器
replicaset_controller_sorting_deletion_age_ratio
选定的已删除 Pod 的年龄与当前最年轻 Pod 的年龄之比(当时)。应该小于 2。此指标的目的是衡量 LogarithmicScaleDown 特性门对副本集缩容时 Pod 排序(和删除)的影响的粗略效率。这仅在计算和报告时考虑 Ready Pod。
- ALPHA
- 直方图
resourceclaim_controller_create_attempts_total
资源声明创建请求的数量
- ALPHA
- 计数器
resourceclaim_controller_create_failures_total
资源声明创建请求失败的数量
- ALPHA
- 计数器
rest_client_dns_resolution_duration_seconds
DNS 解析器延迟(秒)。按主机细分。
- ALPHA
- 直方图
rest_client_exec_plugin_call_total
对 exec 插件的调用次数,按遇到的事件类型(no_error、plugin_execution_error、plugin_not_found_error、client_internal_error)和可选的退出代码进行划分。如果插件调用成功,则退出代码将设置为 0。
- ALPHA
- 计数器
rest_client_exec_plugin_certificate_rotation_age
最后一次身份验证 exec 插件客户端证书在轮换之前存在的秒数的直方图。如果身份验证 exec 插件客户端证书未使用,则直方图将不包含任何数据。
- ALPHA
- 直方图
rest_client_exec_plugin_ttl_seconds
身份验证 exec 插件管理的客户端证书的最小 TTL(生存时间)的 Gauge。该值为证书过期之前的秒数(如果已过期,则为负数)。如果身份验证 exec 插件未使用或不管理任何 TLS 证书,则该值将为 +INF。
- ALPHA
- 仪表
rest_client_rate_limiter_duration_seconds
客户端端速率限制器延迟(秒)。按动词和主机细分。
- ALPHA
- 直方图
rest_client_request_duration_seconds
请求延迟(秒)。按动词和主机细分。
- ALPHA
- 直方图
rest_client_request_retries_total
请求重试次数,按状态代码、动词和主机进行划分。
- ALPHA
- 计数器
rest_client_request_size_bytes
请求大小(字节)。按动词和主机细分。
- ALPHA
- 直方图
rest_client_requests_total
HTTP 请求次数,按状态代码、方法和主机进行划分。
- ALPHA
- 计数器
rest_client_response_size_bytes
响应大小(字节)。按动词和主机细分。
- ALPHA
- 直方图
rest_client_transport_cache_entries
内部缓存中的传输条目数。
- ALPHA
- 仪表
rest_client_transport_create_calls_total
获取新传输的调用次数,按操作结果进行划分:hit:从缓存中获取,miss:创建并添加到缓存中,uncacheable:创建但未缓存
- ALPHA
- 计数器
retroactive_storageclass_errors_total
对持久卷声明执行的追溯存储类分配失败的总数
- ALPHA
- 计数器
retroactive_storageclass_total
对持久卷声明执行的追溯存储类分配的总数
- ALPHA
- 计数器
root_ca_cert_publisher_sync_duration_seconds
根 CA 证书发布者中发生的命名空间同步次数。
- ALPHA
- 直方图
root_ca_cert_publisher_sync_total
根 CA 证书发布者中发生的命名空间同步次数。
- ALPHA
- 计数器
running_managed_controllers
指示控制器实例当前运行的位置
- ALPHA
- 仪表
scheduler_goroutines
正在运行的 goroutine 数量,按它们执行的工作(例如绑定)进行划分。
- ALPHA
- 仪表
scheduler_permit_wait_duration_seconds
等待许可的持续时间。
- ALPHA
- 直方图
scheduler_plugin_evaluation_total
每个插件和扩展点(仅在 PreFilter、Filter、PreScore 和 Score 中可用)尝试调度 Pod 的次数。
- ALPHA
- 计数器
scheduler_plugin_execution_duration_seconds
在特定扩展点运行插件的持续时间。
- ALPHA
- 直方图
scheduler_scheduler_cache_size
调度程序缓存中的节点、Pod 和假定(绑定)Pod 数量。
- ALPHA
- 仪表
scheduler_scheduling_algorithm_duration_seconds
调度算法延迟(秒)
- ALPHA
- 直方图
scheduler_unschedulable_pods
按插件名称细分的无法调度 Pod 的数量。一个 Pod 将为所有导致它无法调度的插件增加 Gauge 的值,因此该指标只有在按插件细分时才有意义。
- ALPHA
- 仪表
scheduler_volume_binder_cache_requests_total
请求卷绑定缓存的总数
- ALPHA
- 计数器
scheduler_volume_scheduling_stage_error_total
卷调度阶段错误计数
- ALPHA
- 计数器
scrape_error
如果获取容器指标时出错,则为 1;否则为 0。
- ALPHA
- 自定义
- 1.29.0
service_controller_loadbalancer_sync_total
一个指标,统计了由于集群中的服务/节点更改而配置任何负载均衡器的次数
- ALPHA
- 计数器
service_controller_nodesync_error_total
一个指标,统计了由于集群中的节点更改而配置任何负载均衡器并出错的次数
- ALPHA
- 计数器
service_controller_nodesync_latency_seconds
一个指标,衡量节点同步的延迟,该节点同步在集群节点更新时更新负载均衡器主机。
- ALPHA
- 直方图
service_controller_update_loadbalancer_host_latency_seconds
一个指标,衡量更新每个负载均衡器主机的延迟。
- ALPHA
- 直方图
serviceaccount_invalid_legacy_auto_token_uses_total
使用的自动生成的旧版令牌的累积无效次数
- ALPHA
- 计数器
serviceaccount_legacy_auto_token_uses_total
使用的自动生成的旧版令牌的累积次数
- ALPHA
- 计数器
serviceaccount_legacy_manual_token_uses_total
使用的手动创建的旧版令牌的累积次数
- ALPHA
- 计数器
serviceaccount_legacy_tokens_total
使用的旧版服务帐户令牌的累积次数
- ALPHA
- 计数器
serviceaccount_stale_tokens_total
使用的过期的投影服务帐户令牌的累积次数
- ALPHA
- 计数器
serviceaccount_valid_tokens_total
使用的有效的投影服务帐户令牌的累积次数
- ALPHA
- 计数器
storage_count_attachable_volumes_in_use
衡量正在使用的卷数
- ALPHA
- 自定义
storage_operation_duration_seconds
存储操作持续时间
- ALPHA
- 直方图
taint_eviction_controller_pod_deletion_duration_seconds
Pod 的污点效应被激活到 TaintEvictionController 通过污点将其删除之间的时间(秒)。
- ALPHA
- 直方图
taint_eviction_controller_pod_deletions_total
自 TaintEvictionController 启动以来,被 TaintEvictionController 删除的 Pod 的总数。
- ALPHA
- 计数器
ttl_after_finished_controller_job_deletion_duration_seconds
作业变为可删除后删除该作业所花费的时间
- ALPHA
- 直方图
volume_manager_selinux_container_errors_total
kubelet 无法为容器计算 SELinux 上下文时的错误数量。kubelet 无法启动此类 Pod,然后将重试,因此此指标的值可能不代表容器的实际数量。
- ALPHA
- 仪表
volume_manager_selinux_container_warnings_total
kubelet 无法为容器计算 SELinux 上下文但被忽略的错误数量。当 SELinuxMountReadWriteOncePod 特性扩展到所有卷访问模式时,它们将成为真正的错误。
- ALPHA
- 仪表
volume_manager_selinux_pod_context_mismatch_errors_total
Pod 为使用相同卷的容器定义不同的 SELinux 上下文时的错误数量。kubelet 无法启动此类 Pod,然后将重试,因此此指标的值可能不代表 Pod 的实际数量。
- ALPHA
- 仪表
volume_manager_selinux_pod_context_mismatch_warnings_total
Pod 为使用相同卷的容器定义不同的 SELinux 上下文时的错误数量。它们还不是错误,但当 SELinuxMountReadWriteOncePod 特性扩展到所有卷访问模式时,它们将成为真正的错误。
- ALPHA
- 仪表
volume_manager_selinux_volume_context_mismatch_errors_total
Pod 使用的卷已使用与 Pod 所需不同的 SELinux 上下文挂载时的错误数量。kubelet 无法启动此类 Pod,然后将重试,因此此指标的值可能不代表 Pod 的实际数量。
- ALPHA
- 仪表
volume_manager_selinux_volume_context_mismatch_warnings_total
Pod 使用的卷已使用与 Pod 所需不同的 SELinux 上下文挂载时的错误数量。它们还不是错误,但当 SELinuxMountReadWriteOncePod 特性扩展到所有卷访问模式时,它们将成为真正的错误。
- ALPHA
- 仪表
volume_manager_selinux_volumes_admitted_total
SELinux 上下文正常的卷数,将使用 mount -o context 选项挂载。
- ALPHA
- 仪表
volume_manager_total_volumes
卷管理器中的卷数
- ALPHA
- 自定义
volume_operation_total_errors
卷操作总错误数
- ALPHA
- 计数器
volume_operation_total_seconds
存储操作端到端持续时间(秒)
- ALPHA
- 直方图
watch_cache_capacity
按资源类型划分的监视缓存的总容量。
- ALPHA
- 仪表
watch_cache_capacity_decrease_total
按资源类型划分的监视缓存容量减少事件的总数。
- ALPHA
- 计数器
watch_cache_capacity_increase_total
按资源类型划分的监视缓存容量增加事件的总数。
- ALPHA
- 计数器
workqueue_adds_total
工作队列处理的添加总数
- ALPHA
- 计数器
workqueue_depth
工作队列的当前深度
- ALPHA
- 仪表
workqueue_longest_running_processor_seconds
工作队列的最长运行处理器运行了多少秒。
- ALPHA
- 仪表
workqueue_queue_duration_seconds
项目在被请求之前在工作队列中停留的时间(秒)。
- ALPHA
- 直方图
workqueue_retries_total
工作队列处理的重试总数
- ALPHA
- 计数器
workqueue_unfinished_work_seconds
正在进行且尚未由 work_duration 观察到的工作时间(秒)。较大的值表示线程卡住。可以通过观察此值增加的速率来推断卡住的线程数量。
- ALPHA
- 仪表
workqueue_work_duration_seconds
从工作队列处理一个项目需要多少秒。
- ALPHA
- 直方图
此页面是自动生成的。
如果您要报告此页面存在问题,请在您的问题描述中提及该页面是自动生成的。修复可能需要在 Kubernetes 项目的其他地方进行。
上次修改时间:2024 年 7 月 29 日下午 4:52 PST:更新 v1.30 的已记录指标 (6891bf59e3)