메인 콘텐츠로 건너뛰기
Air Container는 사용자가 직접 준비한 컨테이너 이미지를 AirCloud에 배포하고 운영할 수 있는 방식입니다. 런타임, 의존성, 포트, 환경 변수, 리소스, 오토스케일링 설정을 직접 제어해야 하는 경우에 적합합니다.

Air Container 기본 흐름

  1. 프로젝트 선택
  2. 컨테이너 생성 시작
  3. Container Image 설정
  4. Resource 설정
  5. Advanced 설정
  6. Review 및 Deploy
  7. 컨테이너 시작
  8. 사용량과 로그 확인

Quickstart: Air Container로 시작하기

Air Container는 직접 컨테이너 이미지를 배포하려는 경우에 적합합니다.

1. 프로젝트 선택

생성한 조직 안에서 컨테이너를 배포할 프로젝트를 선택합니다. 프로젝트 개요 페이지에서는 현재 엔드포인트 현황도 함께 확인할 수 있습니다. 모든 조직은 반드시 하나 이상의 프로젝트를 포함합니다.

2. 컨테이너 생성 시작

Air Container 메뉴에서 + 생성을 눌러 컨테이너 생성 페이지로 이동합니다. 먼저 컨테이너 이름을 입력한 뒤 다음 단계로 이동합니다.

3. Container Image 설정

컨테이너 이미지 정보를 입력합니다. 입력 시 확인해야 할 항목은 다음과 같습니다.
  • 컨테이너 이미지
  • 레지스트리 공급자 선택
    • GCP Artifact Registry (레지스트리 지역 입력 필수)
    • AWS ECR (레지스트리 지역 입력 필수)
    • GitHub Container Registry
    • Docker Hub
  • 레지스트리 액세스 유형 선택 (공개 또는 비공개)
  • 비공개 레지스트리 선택 시 사용자명과 비밀번호 또는 토큰 입력

4. Resource 설정

사용할 인프라 유형과 리소스를 선택합니다. 설정 가능한 주요 항목은 다음과 같습니다.
  • Cloud Type 선택
    • AirCloud+ (자사 보유 디바이스 기반 인프라)
    • AirCloud (개인, PC방, 공급 파트너사 기반 인프라)
  • 인스턴스 타입 선택
    • RTX 4070 Ti Super
    • RTX 4070 Super
    • RTX 4090
    • RTX 5090
    • RTX PRO 6000
  • Autoscaling 활성화 여부
  • Replica 개수 설정
Autoscaling을 사용하는 경우 최소 유지 Replica 수와 최대 확장 가능 Replica 수를 함께 설정할 수 있습니다.

5. Advanced 설정

추가 옵션은 기본값이 있거나 필수 입력이 아닙니다. 필요한 경우 아래 항목을 설정할 수 있습니다.
  • 시작 명령
  • 포트
  • 헬스 체크 URL
  • 최대 대기 시간
  • 부팅 대기 시간
  • 환경 변수
  • 엔드포인트 ID

6. Review 및 Deploy

입력한 배포 정보를 검토한 뒤 컨테이너를 배포합니다. 이미지 크기와 Registry 성능에 따라 초기 다운로드 시간은 달라질 수 있습니다. 한 번 다운로드된 이미지는 노드에 캐시되므로 이후에는 더 빠르게 실행될 수 있습니다.

7. 컨테이너 시작

배포 직후 컨테이너는 대기중 상태로 표시됩니다. 대기중 상태에서는 과금이 발생하지 않으며, 실제로 사용하려면 반드시 컨테이너 시작을 눌러 실행 상태로 전환해야 합니다.

이런 경우에 적합합니다

  • 자체 모델 서버나 애플리케이션 이미지를 배포하려는 경우
  • GPU 스펙과 Replica 수를 직접 설정해야 하는 경우
  • Autoscaling과 Scheduled Scaling을 함께 운영하려는 경우
  • API 기반 시작보다 더 높은 수준의 운영 제어가 필요한 경우

다음에 읽으면 좋은 문서

컨테이너 배포

컨테이너 배포 단계와 주요 설정 항목을 안내합니다.

오토스케일링 및 스케줄링

Autoscaling과 Scheduled Scaling 설정 방법을 정리합니다.

모니터링 및 문제 해결

Usage, Logs, Settings, 스케줄링 등 운영 중 확인할 항목을 안내합니다.