728x90
노드가 다운되면, 노드 내 파드에도 접근이 불가능해진다. 따라서 실 서비스에도 영향을 미치게된다.
그렇다면 관리자는 파드를 어떻게 배치하느냐에 따라 서비스가 끊김없이 제공될 수 있을지 고민해야 한다.
노드 하나가 다운되어 파란/초록 파드가 접근할 수 없더라도, 3번째 노드에 복제본이 있기 때문에 해당 어플리케이션으로의 접근은 문제가 없다. 하지만 초록 파드는 복제본이 없으므로 서비스에 접근할 수 없게된다.
5분(기본값, 지정가능) 이상 노드의 다운이 지속되면, 쿠버네티스는 노드와 노드 내 파드가 죽은 것으로 판단하고 ReplicaSet을 통해 다른 노드에 파드를 재생성한다. 만일, ReplicaSet에 죽은 파드가 포함되어 있지 않다면 복구가 되지 않을 것이니 유의하자.
만일, 5분이 지난 후에 노드가 돌아온다고 해도 노드 내 파드들은 삭제 명령이 이미 내려진 터라 노드는 비어있는 상태로 돌아오게 된다. 이렇게 프로세스가 진행된다면, 초록 파드는 소실되어 복구할 수 없어 서비스에 큰 문제가 생긴다.
이러할 경우, drain 작업을 통해 대처할 수 있다.
drain 작업은 노드의 파드들을 종료하고 다른 노드에 올린다. 이후 노드를 종료 후 재부팅하여 복구하고, 파드들을 다시 재부팅된 원래의 노드로 돌려놓는다.
drain : 다른 노드로 파드를 옮김
uncordon : 다시 원래의 노드로 파드를 돌려놓음
cordon : 종료 후 재부팅된 문제 노드에 새로은 파드가 스케줄링 되지 않도록 막음
반응형
'IT > CKA' 카테고리의 다른 글
CKA 준비과정 - Cluster Maintenance (3) / 백업과 복구 (0) | 2023.06.13 |
---|---|
CKA 준비과정 - Cluster Maintenance (2) / 클러스터 업그레이드 (0) | 2023.06.11 |
CKA 준비과정 - Application Lifecycle Management (5) / Container (0) | 2023.06.06 |
CKA 준비과정 - Application Lifecycle Management (4) / Secrets (0) | 2023.06.04 |
CKA 준비과정 - Application Lifecycle Management (3) / Configmap (0) | 2023.06.04 |