메인 콘텐츠로 건너뛰기
AirCloud에서 사용할 수 있는 인프라 유형과 리소스 타입을 정리한 문서입니다.

Cloud Type

AirCloud에서는 워크로드 특성에 따라 서로 다른 Cloud Type을 선택할 수 있습니다.

AirCloud

비용 효율과 유연성이 중요한 워크로드에 적합한 인프라 옵션입니다.

AirCloud+

더 높은 수준의 안정성, 성능, 예측 가능한 운영 환경이 중요한 워크로드에 적합합니다.

AirCloud 0

개인, PC방, 공급 파트너사 기반 인프라를 활용하는 옵션입니다.

인스턴스 타입

컨테이너 배포 시 워크로드에 맞는 GPU 인스턴스 타입을 선택할 수 있습니다. 예시는 다음과 같습니다.
  • RTX 4070 Ti Super
  • RTX 4070 Super
  • RTX 4090
  • RTX 5090
  • RTX PRO 6000

선택 시 고려할 사항

  • 필요한 응답 속도
  • 모델 크기와 메모리 요구사항
  • 예상 요청량
  • Replica 운영 계획
  • Autoscaling 사용 여부

관련 문서

컨테이너 배포

컨테이너 배포 단계와 주요 설정 흐름을 안내합니다.

오토스케일링 및 스케줄링

Autoscaling/Scheduled Scaling 설정을 정리합니다.