메인 콘텐츠로 건너뛰기

Documentation Index

Fetch the complete documentation index at: https://docs.aieev.com/llms.txt

Use this file to discover all available pages before exploring further.

Air Container를 사용해 컨테이너를 배포하는 기본 흐름을 안내합니다.

1. 프로젝트 선택

생성한 Organization 안에서 컨테이너를 배포할 프로젝트를 선택합니다. 프로젝트 개요 페이지에서는 현재 엔드포인트 현황도 함께 확인할 수 있습니다. 프로젝트 선택 화면

2. 컨테이너 생성 시작

Air Container 메뉴에서 + 생성을 눌러 컨테이너 생성 페이지로 이동합니다. 먼저 컨테이너 이름을 입력한 뒤 다음 단계로 이동합니다. 컨테이너 페이지 일반 정보 입력

3. Container Image 설정

컨테이너 이미지 설정 아래 항목을 입력합니다.
  • 컨테이너 이미지
  • 레지스트리 공급자
  • 레지스트리 액세스 유형 (공개 또는 비공개)
  • 비공개 레지스트리 사용 시 사용자명과 비밀번호 또는 토큰
지원되는 레지스트리 공급자 예시는 다음과 같습니다.
  • GCP Artifact Registry
  • AWS ECR
  • GitHub Container Registry
  • Docker Hub

4. Resource 설정

리소스 설정 리소스 단계에서는 아래 항목을 설정합니다.
  • Cloud Type
  • 인스턴스 타입
  • Autoscaling 활성화 여부
  • Replica 수
워크로드 특성에 따라 비용 효율과 응답 성능을 함께 고려해 설정하는 것을 권장합니다.

5. Advanced 설정

Advanced 설정 필요한 경우 아래 항목을 추가로 설정할 수 있습니다.
  • 시작 명령
  • 포트
  • 헬스 체크 URL
  • 최대 대기 시간
  • 부팅 대기 시간
  • 환경 변수
  • 엔드포인트 ID

6. Review 및 Deploy

Review 페이지 입력한 배포 정보를 검토한 뒤 배포를 진행합니다. 이미지 크기와 Registry 성능에 따라 초기 다운로드 시간은 달라질 수 있으며, 한 번 다운로드된 이미지는 노드에 캐시되어 이후에는 더 빠르게 실행될 수 있습니다.

7. 컨테이너 시작

배포 완료 화면 배포 직후 컨테이너는 대기중 상태로 표시될 수 있습니다.
대기중 상태에서는 과금이 발생하지 않으며, 실제 사용을 위해서는 반드시 컨테이너 시작을 눌러 실행 상태로 전환해야 합니다.

다음 단계

오토스케일링 및 스케줄링

Autoscaling과 Scheduled Scaling 설정 방법을 정리합니다.

모니터링 및 문제 해결

Usage/Logs/Settings 등 운영 중 확인할 항목을 안내합니다.