k8s知识体系
1. k8s知识体系
以下整理了k8s涉及的相关知识体系。
思维导图:k8s体系
2. k8s重点开源项目
大类 | 小类 | 项目及链接 | 简介 |
---|---|---|---|
🧭 核心调度与资源管理 | 核心调度器 | kube-scheduler | 默认调度器,支持亲和性、优先级等策略 |
批处理调度 | Volcano | 支持 AI 训练、大数据任务 Gang 调度、队列管理 | |
混部调度 | Koordinator | 支持离在线混部、QoS 管理、NUMA 亲和等能力 | |
多集群调度 | Karmada | 多集群资源调度和统一控制 | |
Pod 优化调度 | Descheduler | 定期检测资源不均衡并重新调度 | |
🌐 网络与服务网格 | 网络插件(CNI) | Calico Cilium Flannel |
Pod 网络连接,Cilium 基于 eBPF 支持 L7 策略 |
服务网格 | Istio Linkerd |
微服务通信控制:认证、流量治理、可观测性 | |
DNS 服务 | CoreDNS | Kubernetes 默认 DNS 插件 | |
LoadBalancer | MetalLB | 裸金属集群中提供 LoadBalancer 类型服务 | |
Gateway 网关 | Apache APISIX Ingress Kong Ingress NGINX Ingress Envoy Gateway |
支持 Ingress/Gateway API,提供流量入口、认证、限流等 | |
🔐 安全与策略控制 | 策略控制 | Kyverno Gatekeeper |
对资源进行策略校验、合规控制 |
密钥管理 | VaultSealed Secrets | 管理和加密存储 Kubernetes 密钥和凭据 | |
运行时安全 | Falco | 实时监控容器中可疑行为 | |
镜像签名 | cosign | 为容器镜像提供签名与验证功能 | |
💾 存储与数据保护 | CSI 存储 | Longhorn Rook |
提供持久化块存储或对象存储能力 |
备份与恢复 | Velero | Pod 和卷的备份、恢复、集群迁移 | |
卷调度组件 | external-provisioner | Kubernetes 官方 CSI 卷调度器 | |
📊 监控与可观测性 | 指标采集 | Prometheus kube-state-metrics |
收集节点/Pod 状态与业务指标 |
可视化展示 | Grafana | 指标、日志、链路追踪可视化 | |
日志系统 | Loki Fluent Bit |
日志采集与聚合,低资源占用 | |
链路追踪 | Jaeger OpenTelemetry |
追踪服务调用链路、性能瓶颈 | |
🧪 CI/CD 与 GitOps | 工作流引擎 | Argo Workflows Tekton |
原生工作流与流水线管理 |
GitOps | Argo CDFlux | Git 驱动的自动部署与管理 | |
镜像构建 | Kaniko BuildKit |
无需 Docker daemon 的镜像构建工具 | |
应用包管理 | Helm | Kubernetes 最主流的应用部署工具,支持模板化部署 | |
⚙️ 集群运维与扩展 | 快速部署 | kubeadm kind k3s |
轻量化和本地环境 Kubernetes 集群安装工具 |
节点扩缩容 | Cluster Autoscaler | 根据 Pod 排队与资源使用率自动扩缩容节点 | |
多集群互联 | Submariner | 跨集群的网络互通方案 | |
故障检测 | Node Problem Detector | 检测节点硬件、系统异常并上报 K8s | |
混沌测试 | Chaos Mesh Litmus |
注入网络/CPU/磁盘等故障模拟场景 | |
Workload 扩展 | OpenKruise | 扩展原生 workload 控制器能力,如 Sidecar、InPlace 升级 | |
应用交付平台 | KubeVela | 基于 OAM 模型,提供开发者友好、平台团队可控的应用交付能力 | |
🤖 AI 与大数据 | AI 平台 | Kubeflow | 支持训练、调度、模型管理的机器学习平台 |
联邦学习 | KubeFATE | 基于 K8s 的联邦学习调度与部署平台 | |
模型推理 | Triton Inference Server vLLM |
高性能大模型/AI 模型推理服务 | |
分布式调度器 | Volcano | 支持 AI 大数据任务的 batch 资源调度 | |
⚡ GPU 与硬件加速 | GPU 驱动插件 | NVIDIA device plugin | 为 K8s 提供 GPU 发现、分配与隔离能力 |
GPU 监控工具 | DCGM Exporter | GPU 状态指标(温度、利用率、内存)采集器,用于 Prometheus | |
GPU 虚拟化 | vGPU manager | 管理 GPU 分片、vGPU 分配 | |
GPU 调度增强 | Koordinator Volcano |
支持 NUMA-aware、GPU topology-aware 的任务调度策略 |
Feedback
Was this page helpful?
Glad to hear it! Please tell us how we can improve.
Sorry to hear that. Please tell us how we can improve.
最后修改 December 25, 2022: deploy by blog source (a162b04)