모델 ID:
qwen/qwen3-tts-customvoice | 파라미터: 1.7B | 출시일: 2026-01-22개요
Qwen3-TTS-12Hz-1.7B-CustomVoice는 Qwen3 계열의 다국어 텍스트 음성 변환 모델입니다. 17억 개의 파라미터로 영어, 중국어, 일본어, 한국어에서 고품질 음성 합성을 제공합니다. 9개의 프리셋 음성과 커스텀 보이스 클로닝을 지원하여 다양한 활용이 가능합니다. 12Hz 토큰 레이트로 자연스러운 음성 출력을 유지하면서 효율적인 오디오 생성을 제공합니다.Air API Playground
플레이그라운드에서 모델을 체험하세요.
AIR Container로 배포
AIR Container로 배포하세요.
API 사용 가이드
API 사용법을 알아보세요.
가격
| 입력 | 출력 |
|---|---|
| $0 / 1M 토큰 | $0 / 1M 토큰 |
주요 기능
- 1.7B 파라미터 모델로 고품질 다국어 음성 합성
- 영어, 중국어, 일본어, 한국어 지원
- 9개의 다양한 프리셋 음성과 커스텀 보이스 지원
- 12Hz 토큰 레이트로 효율적인 오디오 생성
- Qwen3 아키텍처 기반의 강력한 언어 이해 능력
활용 사례
나레이션 생성
비디오 콘텐츠 및 오디오북을 위한 자연스러운 음성 나레이션을 생성합니다. 입력 텍스트:Life is like a box of chocolates. You never know what you’re gonna get.
음성 안내
다양한 음성 스타일로 음성 안내 및 알림을 생성합니다. 입력 텍스트:Your order has been confirmed and will be delivered within 3 business days.
대화형 AI 음성
챗봇 및 가상 어시스턴트를 위한 자연스러운 음성 응답을 생성합니다. 입력 텍스트:I’d be happy to help you with that! Let me check your account details.
파라미터
| 파라미터 | 타입 | 필수 | 기본값 | 설명 |
|---|---|---|---|---|
input | string | 필수 | - | 음성으로 변환할 텍스트 |
voice | enum | 선택 | "serena" | 음성 프리셋 |
response_format | enum | 선택 | "mp3" | 출력 오디오 포맷 |
speed | number | 선택 | 1 | 음성 속도 배율 (0.25-4.0) |
시작하기
API 키 발급하기
AirCloud 계정에서 API 키를 발급받습니다.
태그
open-source tts 1.7B custom-voice multilingual multi-voice
