ภาพรวม
บทความนี้รวบรวมปัญหาที่พบบ่อยและแนวทางการแก้ไขปัญหาบน Sangfor Kubernetes Engine (SKE) v2.2.0 เพื่อช่วยให้ Administrator สามารถ Troubleshoot และแก้ไขปัญหาได้อย่างรวดเร็ว
ปัญหาเกี่ยวกับ Cluster
ปัญหา: Cluster Status แสดง "Abnormal"
สาเหตุที่เป็นไปได้:
- Controller Node หรือ Worker Node ไม่สามารถเชื่อมต่อได้
- etcd Service บน Controller Node หยุดทำงาน
- Resource ของ Control Plane ไม่เพียงพอ
แนวทางแก้ไข:
- ตรวจสอบ Network Connectivity ระหว่าง Node
- ตรวจสอบ Status ของ etcd Service บน Controller Node
- ตรวจสอบ CPU/Memory Usage ของ Control Plane VM
- ดู Events ใน O&M Center เพื่อหาสาเหตุ
ปัญหา: ไม่สามารถสร้าง Cluster ใหม่ได้
สาเหตุที่เป็นไปได้:
- จำนวน Cluster เกิน Quota ที่กำหนดตาม SKE Specifications
- Kubernetes Package ยังไม่ได้ Upload
- Resource บน SCP ไม่เพียงพอ (CPU, Memory, Storage)
แนวทางแก้ไข:
- ตรวจสอบจำนวน Cluster ปัจจุบันเทียบกับ Specifications
- Upload Kubernetes Package ที่ Settings > Kubernetes Packages
- ตรวจสอบ Resource ที่เหลืออยู่บน SCP
ปัญหาเกี่ยวกับ Node
ปัญหา: Node Status แสดง "NotReady"
สาเหตุที่เป็นไปได้:
- kubelet Service หยุดทำงานบน Node
- Node ไม่สามารถเชื่อมต่อกับ API Server ได้
- Disk Space เต็มบน Node
- Memory ไม่เพียงพอ (OOM)
แนวทางแก้ไข:
- SSH เข้า Node แล้วตรวจสอบ kubelet Service:
systemctl status kubelet - ตรวจสอบ Network Connectivity ไปยัง API Server
- ตรวจสอบ Disk Usage:
df -h - ตรวจสอบ Memory Usage:
free -m
ปัญหาเกี่ยวกับ Pod
ปัญหา: Pod อยู่ในสถานะ "Pending"
สาเหตุที่เป็นไปได้:
- Resource ไม่เพียงพอในการ Schedule Pod
- PersistentVolume (PV) ไม่พร้อมใช้งาน
- Node Affinity หรือ Taint/Toleration ไม่ตรงกัน
แนวทางแก้ไข:
- ตรวจสอบ Events ของ Pod:
kubectl describe pod <pod-name> - ตรวจสอบ Resource ที่เหลืออยู่บน Node
- ตรวจสอบ PVC/PV Status
ปัญหา: Pod อยู่ในสถานะ "CrashLoopBackOff"
สาเหตุที่เป็นไปได้:
- Application ภายใน Container เกิด Error หรือ Crash
- Configuration ผิดพลาด (เช่น Environment Variables, ConfigMap)
- Liveness/Readiness Probe ล้มเหลว
แนวทางแก้ไข:
- ตรวจสอบ Log ของ Container:
kubectl logs <pod-name> - ตรวจสอบ Events:
kubectl describe pod <pod-name> - ตรวจสอบ Configuration ของ Application
ปัญหาเกี่ยวกับ Image Registry
ปัญหา: ไม่สามารถ Pull Image จาก Harbor ได้
แนวทางแก้ไข:
- ตรวจสอบว่า Image Registry Certificate ถูกติดตั้งแล้ว
- ตรวจสอบ Network Connectivity ระหว่าง Node กับ Harbor
- ตรวจสอบ Image Name และ Tag ว่าถูกต้อง
- ตรวจสอบ ImagePullSecret ว่าถูกกำหนดใน Pod Spec
ปัญหาเกี่ยวกับ Storage
ปัญหา: PVC อยู่ในสถานะ "Pending"
แนวทางแก้ไข:
- ตรวจสอบว่า StorageClass ถูกสร้างแล้ว
- ตรวจสอบว่า CSI Plugin ถูกติดตั้งแล้ว
- ตรวจสอบ Storage Backend (EDS, aSAN, NFS) ว่าพร้อมใช้งาน
- ตรวจสอบ Capacity ของ Storage Backend
ปัญหาเกี่ยวกับ Network
ปัญหา: Pod ไม่สามารถเชื่อมต่อกับ Service อื่นได้
แนวทางแก้ไข:
- ตรวจสอบ Network Policy ว่ามีการ Block Traffic หรือไม่
- ตรวจสอบ DNS Resolution:
kubectl exec -it <pod> -- nslookup <service-name> - ตรวจสอบ Service และ Endpoint ว่าถูกต้อง
หมายเหตุ
- หากปัญหาไม่สามารถแก้ไขได้ กรุณาติดต่อ Sangfor Technical Support
ข้อคิดเห็น
0 ข้อคิดเห็น
โปรด ลงชื่อเข้าใช้ เพื่อแสดงข้อคิดเห็น