SRT, VTT, ASS 자막 파일 차이점 총정리
SRT (SubRip Text)
가장 널리 사용되는 자막 포맷. 1990년대에 만들어졌지만 단순한 구조 덕에 사실상의 표준.
파일 구조
1
00:00:01,000 --> 00:00:04,000
안녕하세요, 오늘 영상에 오신 것을 환영합니다.
2
00:00:04,500 --> 00:00:07,000
오늘은 AI 자막에 대해 알아보겠습니다.
각 블록: 번호 → 타이밍(시:분:초,밀리초) → 텍스트 → 빈 줄.
지원 플랫폼
유튜브·넷플릭스·아마존 프라임·틱톡·Vimeo 등 거의 모든 영상 플랫폼. VLC·Windows Media Player·MX Player 등 대부분 플레이어.
장단점
장점: 보편적 호환성, 단순 구조(메모장으로도 편집), 작은 파일 크기.
단점: 기본 스타일(굵게·기울임)만 지원, 위치·폰트·색상 제한적.
적합한 사용처
- 유튜브·소셜 업로드
- 영상 편집 프로그램 임포트
- 번역 작업(텍스트가 단순해서)
VTT (WebVTT)
HTML5 웹 표준용. 구조는 SRT와 유사하나 웹 환경 최적화 기능 추가.
파일 구조
WEBVTT
00:00:01.000 --> 00:00:04.000 align:center
안녕하세요, 오늘 영상에 오신 것을 환영합니다.
00:00:04.500 --> 00:00:07.000
오늘은 AI 자막에 대해 알아보겠습니다.
SRT와의 차이:
- 첫 줄에
WEBVTT헤더 필수 - 타임스탬프 구분자: SRT는 쉼표, VTT는 마침표
- position·align·size 같은 속성 지원
지원 플랫폼
- Vimeo — 기본 권장
- Wistia — 지원
- HTML5
<track>— 네이티브 파싱 - 트위터/X — 지원
- 유튜브 — SRT와 함께 지원
장단점
장점: 자막 위치·정렬 설정 가능, 웹 브라우저 네이티브 파싱, CSS 스타일 연동(일부), 챕터·메타데이터 지원.
단점: SRT보다 덜 보편적, 일부 구형 소프트웨어 미지원.
적합한 사용처
- 웹사이트 영상 embed
- Vimeo 업로드
- 강의·이러닝 플랫폼
- 미래 지향 웹 표준 자막
SRT → VTT 무료 변환기 열기타임스탬프 구분자·WEBVTT 헤더까지 자동 처리
ASS/SSA (Advanced SubStation Alpha)
고급 스타일링 전용. 원래 SubStation Alpha(SSA)에서 발전. 애니 팬섭 커뮤니티의 표준.
특징
ASS는 단순 자막이 아니라 폰트·색상·크기·위치·애니메이션을 모두 정의. 사실상의 자막 프로그래밍 언어.
구조(일부):
[Script Info]
ScriptType: v4.00+
PlayResX: 1920
PlayResY: 1080
[V4+ Styles]
Format: Name, Fontname, Fontsize, PrimaryColour...
Style: Default,Arial,40,&H00FFFFFF,&H000000FF...
[Events]
Format: Layer, Start, End, Style, Name, Text
Dialogue: 0,0:00:01.00,0:00:04.00,Default,,안녕하세요
지원 기능
- 폰트 종류·크기·굵기·기울임
- 텍스트·테두리·그림자 색상
- 화면 좌표 기반 위치
- 페이드·이동 애니메이션
- 화자별 다른 스타일
- 카라오케 효과(음절별 색상 변화)
지원 플랫폼
PC 미디어 플레이어 중심 — VLC, MPC-HC, mpv, Aegisub(편집기).
유튜브·넷플릭스 같은 스트리밍 플랫폼은 미지원.
장단점
장점: 가장 강력한 스타일링, 애니메이션·카라오케 구현 가능, 화자별 스타일 분리.
단점: 복잡한 구조(수동 편집 어려움), 스트리밍 미지원, 전문 편집 도구 필요.
적합한 사용처
- 애니 팬 자막 제작
- PC 미디어 플레이어용 고품질 자막
- 카라오케 효과 필요한 음악 영상
포맷별 비교표
| 특성 | SRT | VTT | ASS |
|---|---|---|---|
| 호환성 | 매우 높음 | 높음(웹) | 낮음(PC) |
| 스타일링 | 기본 | 중간 | 고급 |
| 편집 난이도 | 쉬움 | 쉬움 | 어려움 |
| 파일 크기 | 작음 | 작음 | 중간 |
| 웹 표준 | X | O | X |
| 애니메이션 | X | X | O |
| 유튜브 지원 | O | O | X |
| 스트리밍 지원 | O | O | X |
자막 파일 변환 방법
온라인 변환
- Picute — 자막 생성 시 원하는 포맷으로 다운로드 + SRT ↔ VTT 변환기 제공
- Subtitle Edit Online — 다양한 포맷 지원
- Convertio — 간단한 변환
소프트웨어
- Subtitle Edit (Windows, 무료) — 거의 모든 포맷 간 변환
- Aegisub (무료) — ASS 특화
- FFmpeg (CLI, 무료) —
ffmpeg -i input.srt output.vtt
변환 시 주의
- SRT → VTT: 타임스탬프 구분자(쉼표 → 마침표) 자동 변환 확인
- ASS → SRT/VTT: 스타일 정보 손실 — 텍스트만 보존
- 한국어 인코딩: UTF-8(BOM 없음)로 저장
어떤 포맷을 선택해야 할까
| 사용 목적 | 권장 포맷 |
|---|---|
| 유튜브 업로드 | SRT 또는 VTT |
| 웹사이트 영상 embed | VTT |
| 영상 편집 프로그램 | SRT |
| 애니 팬섭 | ASS |
| PC 미디어 플레이어 | ASS 또는 SRT |
| 소셜 미디어 | SRT |
| 넷플릭스 제출 | SRT(TTML도 지원) |
Picute에서 포맷 선택
Picute는 자막 생성 완료 후 SRT·VTT·ASS·플레인 텍스트 중 원하는 포맷으로 다운로드할 수 있습니다. 사용 목적에 맞는 포맷을 선택하면 별도 변환 없이 바로 활용 가능합니다.
Picute에서 자막 생성하기SRT · VTT · ASS · 텍스트 — 85개 언어
결론
- 유튜브·소셜 → SRT
- 웹 기반 서비스·embed → VTT
- 고급 스타일·애니메이션 → ASS
포맷 선택보다 먼저 중요한 건 정확한 자막 텍스트입니다. Picute에서 AI 자막을 생성한 뒤 필요한 포맷으로 받으세요.
자주 묻는 질문
유튜브에는 SRT와 VTT 중 뭘 올려야 하나요?
둘 다 지원하지만 SRT가 가장 보편적이고 실수 여지가 적습니다. VTT는 position·align 같은 속성을 지정할 수 있어 세밀한 자막 위치 제어가 필요할 때 유리합니다. 실무에서는 SRT로 올리고, 스타일을 제어해야 할 때만 VTT로 올리는 것을 권장합니다.
ASS 파일은 왜 유튜브·넷플릭스에서 안 보이나요?
ASS는 원래 PC 미디어 플레이어(VLC·MPC-HC·mpv)를 위해 설계된 형식으로, 스트리밍 플랫폼은 파싱을 지원하지 않습니다. 애니 팬섭이나 카라오케 영상처럼 ASS의 고급 스타일·애니메이션이 필요한 콘텐츠가 아니면 굳이 ASS를 쓸 이유가 없습니다. 유튜브에 올리려면 SRT로 변환하세요(단, 스타일·애니메이션 정보는 손실).
SRT를 VTT로 변환할 때 가장 자주 놓치는 부분은?
타임코드 구분자입니다. SRT는 00:00:04,500처럼 쉼표, VTT는 00:00:04.500처럼 마침표를 씁니다. 또 VTT는 첫 줄에 반드시 WEBVTT 헤더가 있어야 합니다. 이 두 가지만 지키면 대부분 호환됩니다. Picute의 SRT → VTT 변환기는 이 과정을 자동 처리합니다.
한국어 자막을 변환했더니 글자가 깨져요.
거의 100% 인코딩 문제입니다. 변환 전후 파일을 UTF-8(BOM 없음)로 저장하세요. 구형 윈도우 메모장은 ANSI(CP949)로 저장해 버리는 경우가 있는데, Notepad++ 등에서 인코딩을 명시적으로 UTF-8로 변환하면 해결됩니다.
Picute에서 어떤 자막 포맷을 뽑을 수 있나요?
자막 생성 완료 후 SRT·VTT·ASS·플레인 텍스트 중에서 선택해 다운로드할 수 있습니다. 사용 목적에 맞는 포맷을 고르면 별도 변환 없이 바로 활용 가능합니다. 단어 수준 타임스탬프가 필요한 카라오케 자막은 ASS로 내보내면 Aegisub로 바로 편집할 수 있습니다.