IT/CKA

CKA 준비과정 - Cluster Maintenance (1) / OS 업그레이드

Primes 2023. 6. 11. 14:41
728x90

노드가 다운되면, 노드 내 파드에도 접근이 불가능해진다. 따라서 실 서비스에도 영향을 미치게된다.

그렇다면 관리자는 파드를 어떻게 배치하느냐에 따라 서비스가 끊김없이 제공될 수 있을지 고민해야 한다.

 

노드 하나가 다운되어 파란/초록 파드가 접근할 수 없더라도, 3번째 노드에 복제본이 있기 때문에 해당 어플리케이션으로의 접근은 문제가 없다. 하지만 초록 파드는 복제본이 없으므로 서비스에 접근할 수 없게된다.

 

5분(기본값, 지정가능) 이상 노드의 다운이 지속되면, 쿠버네티스는 노드와 노드 내 파드가 죽은 것으로 판단하고 ReplicaSet을 통해 다른 노드에 파드를 재생성한다. 만일, ReplicaSet에 죽은 파드가 포함되어 있지 않다면 복구가 되지 않을 것이니 유의하자.

 

만일, 5분이 지난 후에 노드가 돌아온다고 해도 노드 내 파드들은 삭제 명령이 이미 내려진 터라 노드는 비어있는 상태로 돌아오게 된다. 이렇게 프로세스가 진행된다면, 초록 파드는 소실되어 복구할 수 없어 서비스에 큰 문제가 생긴다.

 

이러할 경우, drain 작업을 통해 대처할 수 있다.

drain 작업은 노드의 파드들을 종료하고 다른 노드에 올린다. 이후 노드를 종료 후 재부팅하여 복구하고, 파드들을 다시 재부팅된 원래의 노드로 돌려놓는다.

 

drain : 다른 노드로 파드를 옮김

uncordon : 다시 원래의 노드로 파드를 돌려놓음

cordon : 종료 후 재부팅된 문제 노드에 새로은 파드가 스케줄링 되지 않도록 막음

 

반응형