GPU 노드에서 디바이스 확인
NVIDIA 드라이버 설치
NVIDIA 드라이버는 사전에 설치되어 있어야 합니다.
지원하는 NVIDIA 드라이버는 아래 링크 참조하세요.
https://catalog.ngc.nvidia.com/orgs/nvidia/containers/driver/tags
폐쇄망 설치일 경우 GPU Addon 이미지 및 차트 업로드합니다.
관련 파일 및 업로드 방법은 escho@acornsoft.io 로 문의 바랍니다.
설치 가능한 애드온 명칭 및 profile 조회
--kubeconfig 미입력 시 기본값 : ${CUBE_HOME}/config/{{CLUSTER}}/acloud-client-kubeconfig
--profile 미입력 시 기본 적용 파일 : ${CUBE_HOME}/extends/addon/profile/gpu-operator/default.yaml
${CUBE_HOME}/extends/addon/profile/gpu-operator/default.yaml
설치하려는 OSEXT의 yaml 수정
default.yaml은 ubuntu와 동일합니다.
redhat.yaml을 적용하려면 profile 인자값에 해당 파일명을 입력합니다.
ex) bin/cubectl addon enable gpu-operator --profile redhat
폐쇄망 설치 시 repository 값 앞부분에 "{{ registry_domain }}/" 을 추가합니다.
repository: repository: nvcr.io/nvidia
-> repository: {{ registry_domain }}/repository: nvcr.io/nvidia
repository: nvcr.io/nvidia/cloud-native
-> repository: {{ registry_domain }}/nvcr.io/nvidia/cloud-native
repository: nvcr.io/nvidia/k8s
-> repository: {{ registry_domain }}/nvcr.io/nvidia/k8s
Addon 설치
Addon 설치 확인
Addon 삭제
MIG를 지원하는 GPU인 경우
GPU별 지원되는 프로필 확인
NVIDIA Supported MIG Profiles 공식 가이드 에서 GPU별 지원되는 프로필을 확인합니다.
MIG 프로필은 configmap/default-mig-parted-config
에서도 확인 가능합니다.
kubectl describe cm default-mig-parted-config -n gpu-operator
GPU노드에 label에 프로필명 적용
적용 확인 예
자세한 내용은 NVIDIA MIG 공식 가이드 참조하세요.
MIG를 지원하지 않는 장비에서 하나의 GPU 분할 사용
ConfigMap 생성
Time slicing을 어떻게 나눌지 정의하는 configmap 작성합니다.
NVIDIA ClusterPolicy 객체에 생성된 configmap 지정
적용 확인
적용 후 gpu-feature-discovery, nvidia-device-plugin-daemonset pod가 자동으로 재시작되고 그 후에 gpu-node의 describe로 정상적으로 적용되었는지 확인가능합니다.
자세한 내용은 NVIDIA Time-Slicing 공식 가이드 참조하세요.
설치 가능한 애드온 명칭 및 profile 조회
--kubeconfig 미입력 시 기본값 : ${CUBE_HOME}/config/{{CLUSTER}}/acloud-client-kubeconfig
--profile 미입력 시 기본값 : ${CUBE_HOME}/extends/addon/profile/csi-driver-nfs/default.yaml
${CUBE_HOME}/extends/addon/profile/csi-driver-nfs/default.yaml
수정
server: '{{ NFS node IP }}' IP 수정
Addon 설치
Addon 설치 확인
Addon 삭제
필수 인자값
ACCOUNT = NAS계정 PASSWD = NAS계정암호 NAME = ADDON종류(nfs | gpu | kore)
옵션인자값
VERSION = ADDON버전(단수값지원) OSEXT = GPU ADDON설치시 설치대상서버의 OS종류(default=ubuntu2004)
ADDON Download시 $CUBE_HOME 에 저장합니다.
만일 $CUBE_HOME 이 설정되어 있지 않은 경우 명령어를 실행한 디렉토리에 Download 받습니다.
ADDON Download시 기존 ADDON폴더에 profile폴더가 존재 할 경우 기존 profile 폴더를 현재 시각을 붙여 백업하고 Download받습니다