본문 바로가기

공부/MLOps

WSL에서 kubeflow 설치 Trouble Shooting

kubectl cluster-info

 

To further debug and diagnose cluster problems, use 'kubectl cluster-info dump'.

The connection to the server 127.0.0.1:6443 was refused - did you specify the right host or port?

 

이런 오류가 나오면서 쿠버네티스가 작동을 안할때 

 

sudo systemctl status k3s

 

으로 일단 서비스 상태를 확인하고 

 

Jan 16 10:47:32 notebiz53 k3s[25253]: {"level":"warn","ts":"2026-01-16T10:47:32.039512+0900","logger":"etcd-client","caller":"v3@v3.6.6-k3s1/retry_interceptor.go:65","msg":"retrying of unary invoker failed","target":"etcd-endpoints://0xc0029de1e0/kine.sock","method":"/etcdserverpb.KV/Range","attempt":46,"error":"rpc error: code = Canceled desc = grpc: the client connection is closing"}

이런 로그가 많이 뜨고 

sudo journalctl -u k3s -n 100 --no-pager

 

이거로 더 자세하게 확인해보면 

Jan 16 10:54:17 notebiz53 k3s[33757]: E0116 10:54:17.266522   33757 kubelet.go:1704] "Failed to start ContainerManager" err="system validation failed - wrong number of fields (expected 6, got 7)"

 

이렇게 에러가 뜨네요 K3s(Kubelet)가 리눅스 시스템 파일(주로 /proc/mounts 또는 /proc/swaps)을 읽다가 형식이 맞지 않아서(칸 수가 달라서) 발생하는 파싱 에러입니다. 

 

이럴때는 문제가 되는 부분의 마운트를 해제하면 해결됩니다.

 

cat /proc/mounts | awk 'NF != 6 {print $0}'

마운트 문제가 되는 부분을 찾으면 

 

C:\134Program\040Files\134Docker\134Docker\134resources /Docker/host 9p rw,noatime,aname=drvfs;path=C:\Program Files\Docker\Docker\resources;symlinkroot=/mnt/,cache=5,access=client,msize=65536,trans=fd,rfd=3,wfd=3 0 

 

C:\134Program\040Files\134Docker\134Docker\134resources /Docker/host 이 부분이 문제네요

 

Program\040Files 띄어쓰기가 포함된 폴더 명 때문에 문제가 발생했습니다

 

sudo umount /Docker/host 이 명령어로 마운트를 해제하고 

sudo systemctl restart k3s 재시작하면 실행이됩니다.