k8s知识体系

1. k8s知识体系

以下整理了k8s涉及的相关知识体系。

k8s体系

思维导图:k8s体系

2. k8s重点开源项目

大类 小类 项目及链接 简介
🧭 核心调度与资源管理 核心调度器 kube-scheduler 默认调度器,支持亲和性、优先级等策略
批处理调度 Volcano 支持 AI 训练、大数据任务 Gang 调度、队列管理
混部调度 Koordinator 支持离在线混部、QoS 管理、NUMA 亲和等能力
多集群调度 Karmada 多集群资源调度和统一控制
Pod 优化调度 Descheduler 定期检测资源不均衡并重新调度
🌐 网络与服务网格 网络插件(CNI) Calico
Cilium
Flannel
Pod 网络连接,Cilium 基于 eBPF 支持 L7 策略
服务网格 Istio
Linkerd
微服务通信控制:认证、流量治理、可观测性
DNS 服务 CoreDNS Kubernetes 默认 DNS 插件
LoadBalancer MetalLB 裸金属集群中提供 LoadBalancer 类型服务
Gateway 网关 Apache APISIX Ingress
Kong Ingress
NGINX Ingress
Envoy Gateway
支持 Ingress/Gateway API,提供流量入口、认证、限流等
🔐 安全与策略控制 策略控制 Kyverno
Gatekeeper
对资源进行策略校验、合规控制
密钥管理 VaultSealed Secrets 管理和加密存储 Kubernetes 密钥和凭据
运行时安全 Falco 实时监控容器中可疑行为
镜像签名 cosign 为容器镜像提供签名与验证功能
💾 存储与数据保护 CSI 存储 Longhorn
Rook
提供持久化块存储或对象存储能力
备份与恢复 Velero Pod 和卷的备份、恢复、集群迁移
卷调度组件 external-provisioner Kubernetes 官方 CSI 卷调度器
📊 监控与可观测性 指标采集 Prometheus
kube-state-metrics
收集节点/Pod 状态与业务指标
可视化展示 Grafana 指标、日志、链路追踪可视化
日志系统 Loki
Fluent Bit
日志采集与聚合,低资源占用
链路追踪 Jaeger
OpenTelemetry
追踪服务调用链路、性能瓶颈
🧪 CI/CD 与 GitOps 工作流引擎 Argo Workflows
Tekton
原生工作流与流水线管理
GitOps Argo CDFlux Git 驱动的自动部署与管理
镜像构建 Kaniko
BuildKit
无需 Docker daemon 的镜像构建工具
应用包管理 Helm Kubernetes 最主流的应用部署工具,支持模板化部署
⚙️ 集群运维与扩展 快速部署 kubeadm
kind
k3s
轻量化和本地环境 Kubernetes 集群安装工具
节点扩缩容 Cluster Autoscaler 根据 Pod 排队与资源使用率自动扩缩容节点
多集群互联 Submariner 跨集群的网络互通方案
故障检测 Node Problem Detector 检测节点硬件、系统异常并上报 K8s
混沌测试 Chaos Mesh
Litmus
注入网络/CPU/磁盘等故障模拟场景
Workload 扩展 OpenKruise 扩展原生 workload 控制器能力,如 Sidecar、InPlace 升级
应用交付平台 KubeVela 基于 OAM 模型,提供开发者友好、平台团队可控的应用交付能力
🤖 AI 与大数据 AI 平台 Kubeflow 支持训练、调度、模型管理的机器学习平台
联邦学习 KubeFATE 基于 K8s 的联邦学习调度与部署平台
模型推理 Triton Inference Server
vLLM
高性能大模型/AI 模型推理服务
分布式调度器 Volcano 支持 AI 大数据任务的 batch 资源调度
⚡ GPU 与硬件加速 GPU 驱动插件 NVIDIA device plugin 为 K8s 提供 GPU 发现、分配与隔离能力
GPU 监控工具 DCGM Exporter GPU 状态指标(温度、利用率、内存)采集器,用于 Prometheus
GPU 虚拟化 vGPU manager 管理 GPU 分片、vGPU 分配
GPU 调度增强 Koordinator
Volcano
支持 NUMA-aware、GPU topology-aware 的任务调度策略

最后修改 December 25, 2022: deploy by blog source (a162b04)