[2026] MP4 컨테이너 포맷 완전 가이드 | ISO BMFF·moov·mdat·fMP4·FFmpeg 실전

[2026] MP4 컨테이너 포맷 완전 가이드 | ISO BMFF·moov·mdat·fMP4·FFmpeg 실전

이 글의 핵심

ISO BMFF 기반 MP4의 ftyp·moov·mdat 구조, faststart와 fragmented MP4, HLS·DASH 연계까지 FFmpeg 명령으로 바로 쓰는 스트리밍 실무 가이드입니다.

들어가며

MP4는 파일 확장자로 익숙하지만, 규격상 이름은 ISO Base Media File Format(ISO BMFF, ISO/IEC 14496-12) 위에 MPEG-4 시스템(14496-14 등) 관례를 얹은 형태로 이해하는 것이 정확합니다. H.264/H.265/AV1 비디오AAC 오디오를 같은 파일에 담는 가장 보편적인 상자(container)이며, 모바일·OTT·웹·편집 툴이 모두 기대하는 “기본 포맷”입니다.

이 글을 읽으면

  • ISO BMFF 박스 트리(ftyp, moov, mdat)를 도식으로 설명할 수 있습니다
  • 프로그레시브 재생(faststart)fragmented MP4(HLS/DASH)의 차이를 업무 기준으로 구분할 수 있습니다
  • 리먹스·메타데이터·트랙 맵핑을 FFmpeg로 처리하는 패턴을 복사해 쓸 수 있습니다
  • 호환성·오버헤드를 다른 컨테이너와 비교해 포맷을 선택할 근거를 갖습니다

실무에서 마주한 현실

개발을 배울 때는 모든 게 깔끔하고 이론적입니다. 하지만 실무는 다릅니다. 레거시 코드와 씨름하고, 급한 일정에 쫓기고, 예상치 못한 버그와 마주합니다. 이 글에서 다루는 내용도 처음엔 이론으로 배웠지만, 실제 프로젝트에 적용하면서 “아, 이래서 이렇게 설계하는구나” 하고 깨달은 것들입니다. 특히 기억에 남는 건 첫 프로젝트에서 겪은 시행착오입니다. 책에서 배운 대로 했는데 왜 안 되는지 몰라 며칠을 헤맸죠. 결국 선배 개발자의 코드 리뷰를 통해 문제를 발견했고, 그 과정에서 많은 걸 배웠습니다. 이 글에서는 이론뿐 아니라 실전에서 마주칠 수 있는 함정들과 해결 방법을 함께 다루겠습니다.

목차

  1. 컨테이너 개요
  2. 내부 구조
  3. 실전 사용
  4. 성능 비교
  5. 실무 활용 사례
  6. 최적화 팁
  7. 트러블슈팅
  8. 마무리

컨테이너 개요

역사 및 개발 배경

ISO BMFF는 QuickTime 파일 포맷의 정리·일반화를 거쳐 MPEG-4 Part 12로 표준화되었고, 이후 MP4 파일은 주로 14496-14(MPEG-4 파일 포맷)프로파일 관점에서 오디오·비디오 트랙 조합을 규정합니다. 주요 마일스톤:

  • 2001: MPEG-4 Part 14 (MP4) 표준화
  • 2004: ISO BMFF (Part 12) 분리
  • 2013: CMAF (Common Media Application Format) 등장
  • 2026: HLS/DASH fMP4 사실상 표준

기술적 특징

항목설명
구조Box/Atom 기반 계층 구조
코덱H.264, HEVC, AV1, AAC, AC3 등
메타데이터moov 박스 내 트랙·타임라인 정보
스트리밍Progressive (faststart), Fragmented (fMP4)
확장자.mp4 (비디오), .m4v (비디오), .m4a (오디오)

내부 구조

Box/Atom 구조

MP4는 Box 단위로 구성됩니다. 각 Box는:

  • 4 bytes: 크기
  • 4 bytes: 타입 (fourcc)
  • N bytes: 데이터 주요 Box: 다음은 text를 활용한 상세한 구현 코드입니다. 각 부분의 역할을 이해하면서 코드를 살펴보시기 바랍니다.
MP4 파일
├─ ftyp (File Type)
│  ├─ major_brand: isom
│  └─ compatible_brands: isom, iso2, mp41
├─ moov (Movie)
│  ├─ mvhd (Movie Header)
│  ├─ trak (Track 1: Video)
│  │  ├─ tkhd (Track Header)
│  │  ├─ mdia (Media)
│  │  │  ├─ mdhd (Media Header)
│  │  │  ├─ hdlr (Handler: vide)
│  │  │  └─ minf (Media Info)
│  │  │     ├─ vmhd (Video Media Header)
│  │  │     ├─ dinf (Data Info)
│  │  │     └─ stbl (Sample Table)
│  │  │        ├─ stsd (Sample Description: avc1)
│  │  │        ├─ stts (Time-to-Sample)
│  │  │        ├─ stsc (Sample-to-Chunk)
│  │  │        ├─ stsz (Sample Size)
│  │  │        └─ stco (Chunk Offset)
│  ├─ trak (Track 2: Audio)
│  │  └─ ....(유사 구조, hdlr: soun, stsd: mp4a)
│  └─ udta (User Data: 메타데이터)
└─ mdat (Media Data: 실제 압축 샘플)

Progressive vs Fragmented

Progressive MP4

[ftyp][moov][mdat]
  • moov: 전체 타임라인 한 번에
  • mdat: 모든 미디어 데이터
  • faststart: moov를 앞으로 이동

Fragmented MP4 (fMP4)

[ftyp][moov][moof][mdat][moof][mdat]...
  • moov: 초기화 정보만
  • moof: 각 세그먼트 메타데이터
  • mdat: 세그먼트 미디어 데이터 장점:
  • 라이브 스트리밍 가능
  • 적응형 비트레이트 (ABR)
  • 세그먼트 단위 캐싱

실전 사용

기본 명령

1) 구조 확인

아래 코드는 bash를 사용한 구현 예제입니다. 코드를 직접 실행해보면서 동작을 확인해보세요.

# 스트림 정보
ffprobe -hide_banner -show_format -show_streams input.mp4
# Box 구조 (mp4dump - Bento4)
mp4dump input.mp4 | head -50

2) 무손실 리먹스

아래 코드는 bash를 사용한 구현 예제입니다. 코드를 직접 실행해보면서 동작을 확인해보세요.

# MKV → MP4 (코덱 복사)
ffmpeg -i input.mkv -c copy -movflags +faststart output.mp4
# AVI → MP4
ffmpeg -i input.avi -c copy output.mp4

3) 인코딩 + faststart

아래 코드는 bash를 사용한 구현 예제입니다. 각 부분의 역할을 이해하면서 코드를 살펴보시기 바랍니다.

# H.264 + AAC (웹 최적화)
ffmpeg -i input.mov \
  -c:v libx264 \
  -preset medium \
  -crf 23 \
  -pix_fmt yuv420p \
  -c:a aac \
  -b:a 192k \
  -movflags +faststart \
  output.mp4

고급 옵션

Fragmented MP4 생성

아래 코드는 bash를 사용한 구현 예제입니다. 코드를 직접 실행해보면서 동작을 확인해보세요.

# fMP4 (HLS/DASH용)
ffmpeg -i input.mp4 \
  -c copy \
  -f mp4 \
  -movflags frag_keyframe+empty_moov+default_base_moof \
  fragmented.mp4

플래그 설명:

  • frag_keyframe: 키프레임마다 fragment
  • empty_moov: moov를 최소화
  • default_base_moof: moof 기반 오프셋

메타데이터 추가

아래 코드는 bash를 사용한 구현 예제입니다. 코드를 직접 실행해보면서 동작을 확인해보세요.

# 기본 태그
ffmpeg -i input.mp4 \
  -c copy \
  -metadata title="영화 제목" \
  -metadata artist="감독" \
  -metadata date="2026" \
  -metadata comment="설명" \
  tagged.mp4

다중 오디오 트랙

아래 코드는 bash를 사용한 구현 예제입니다. 각 부분의 역할을 이해하면서 코드를 살펴보시기 바랍니다.

# 비디오 + 다중 오디오
ffmpeg -i video.mp4 \
  -i audio_kor.wav \
  -i audio_eng.wav \
  -map 0:v:0 \
  -map 1:a:0 \
  -map 2:a:0 \
  -c:v copy \
  -c:a aac -b:a 192k \
  -metadata:s:a:0 language=kor -metadata:s:a:0 title="한국어" \
  -metadata:s:a:1 language=eng -metadata:s:a:1 title="English" \
  -disposition:a:0 default \
  multi_audio.mp4

HLS 세그먼트 생성

아래 코드는 bash를 사용한 구현 예제입니다. 각 부분의 역할을 이해하면서 코드를 살펴보시기 바랍니다.

# HLS fMP4 세그먼트
ffmpeg -i input.mp4 \
  -c:v libx264 -preset medium -crf 23 \
  -c:a aac -b:a 128k \
  -f hls \
  -hls_time 6 \
  -hls_playlist_type vod \
  -hls_segment_type fmp4 \
  -hls_fmp4_init_filename init.mp4 \
  -hls_segment_filename segment_%03d.m4s \
  playlist.m3u8

성능 비교

컨테이너 오버헤드

컨테이너오버헤드메타데이터시크 성능
MP4매우 낮음 (< 1%)중간우수
MKV낮음 (< 1%)풍부우수
WebM매우 낮음 (< 1%)제한적우수
결론: 컨테이너 오버헤드는 거의 무시 가능

스트리밍 비교

프로토콜Progressive MP4Fragmented MP4
HTTP 단일 파일우수 (faststart)가능
HLS가능 (TS 대체)표준 (fMP4)
DASH가능표준 (fMP4)
라이브부적합적합

실무 활용 사례

사례 1: YouTube 업로드 최적화

요구사항:

  • 고품질 유지
  • 빠른 업로드
  • 플랫폼 권장 설정

설정

아래 코드는 bash를 사용한 구현 예제입니다. 각 부분의 역할을 이해하면서 코드를 살펴보시기 바랍니다.

# YouTube 권장 설정
ffmpeg -i input.mov \
  -c:v libx264 \
  -preset slow \
  -crf 18 \
  -pix_fmt yuv420p \
  -profile:v high \
  -level 4.2 \
  -c:a aac \
  -b:a 192k \
  -ar 48000 \
  -movflags +faststart \
  youtube_upload.mp4

파라미터 설명:

  • -crf 18: 고품질 (YouTube 재인코딩 대비)
  • -preset slow: 압축 효율 우선
  • -profile:v high -level 4.2: 호환성

사례 2: 웹 비디오 플레이어

요구사항:

  • 빠른 재생 시작
  • 적응형 품질
  • 브라우저 호환

다중 품질 생성

다음은 bash를 활용한 상세한 구현 코드입니다. 각 부분의 역할을 이해하면서 코드를 살펴보시기 바랍니다.

# 1080p
ffmpeg -i input.mp4 \
  -vf "scale=1920:1080" \
  -c:v libx264 -preset medium -crf 23 \
  -c:a aac -b:a 192k \
  -movflags +faststart \
  1080p.mp4
# 720p
ffmpeg -i input.mp4 \
  -vf "scale=1280:720" \
  -c:v libx264 -preset medium -crf 24 \
  -c:a aac -b:a 128k \
  -movflags +faststart \
  720p.mp4
# 480p
ffmpeg -i input.mp4 \
  -vf "scale=854:480" \
  -c:v libx264 -preset medium -crf 26 \
  -c:a aac -b:a 96k \
  -movflags +faststart \
  480p.mp4

Python 자동화

다음은 python를 활용한 상세한 구현 코드입니다. 필요한 모듈을 import하고, 함수를 통해 로직을 구현합니다. 각 부분의 역할을 이해하면서 코드를 살펴보시기 바랍니다.

import subprocess
from pathlib import Path
def create_multi_quality(input_file, output_dir):
    """
    다중 품질 MP4 생성
    """
    qualities = [
        ('1080p', '1920:1080', 23, '192k'),
        ('720p', '1280:720', 24, '128k'),
        ('480p', '854:480', 26, '96k')
    ]
    
    Path(output_dir).mkdir(parents=True, exist_ok=True)
    stem = Path(input_file).stem
    
    for name, scale, crf, audio_br in qualities:
        output_file = Path(output_dir) / f"{stem}_{name}.mp4"
        
        cmd = [
            'ffmpeg', '-y',
            '-i', input_file,
            '-vf', f'scale={scale}',
            '-c:v', 'libx264',
            '-preset', 'medium',
            '-crf', str(crf),
            '-c:a', 'aac',
            '-b:a', audio_br,
            '-movflags', '+faststart',
            str(output_file)
        ]
        
        print(f"Creating {name}...")
        subprocess.run(cmd, check=True)
# 사용
create_multi_quality('master.mov', 'output')

사례 3: HLS 적응형 스트리밍

요구사항:

  • 다중 비트레이트
  • 세그먼트 기반
  • CDN 캐싱

HLS 생성

다음은 bash를 활용한 상세한 구현 코드입니다. 각 부분의 역할을 이해하면서 코드를 살펴보시기 바랍니다.

# 마스터 플레이리스트 + 다중 variant
ffmpeg -i input.mp4 \
  -filter_complex \
    "[0:v]split=3[v1][v2][v3]; \
     [v1]scale=1920:1080[v1out]; \
     [v2]scale=1280:720[v2out]; \
     [v3]scale=854:480[v3out]" \
  -map "[v1out]" -c:v:0 libx264 -b:v:0 5000k \
  -map "[v2out]" -c:v:1 libx264 -b:v:1 2800k \
  -map "[v3out]" -c:v:2 libx264 -b:v:2 1400k \
  -map 0:a -c:a aac -b:a 128k \
  -f hls \
  -hls_time 6 \
  -hls_playlist_type vod \
  -hls_segment_type fmp4 \
  -hls_fmp4_init_filename init.mp4 \
  -master_pl_name master.m3u8 \
  -var_stream_map "v:0,a:0 v:1,a:0 v:2,a:0" \
  stream_%v/playlist.m3u8

결과: 아래 코드는 text를 사용한 구현 예제입니다. 각 부분의 역할을 이해하면서 코드를 살펴보시기 바랍니다.

output/
├─ master.m3u8
├─ stream_0/
│  ├─ playlist.m3u8
│  ├─ init.mp4
│  ├─ segment_000.m4s
│  └─ segment_001.m4s
├─ stream_1/
│  └─ ...
└─ stream_2/
   └─ ...

사례 4: 모바일 앱 - 오프라인 다운로드

요구사항:

  • 파일 크기 최소화
  • 빠른 재생
  • 배터리 효율

설정

아래 코드는 bash를 사용한 구현 예제입니다. 각 부분의 역할을 이해하면서 코드를 살펴보시기 바랍니다.

# 모바일 최적화
ffmpeg -i input.mp4 \
  -vf "scale=1280:720" \
  -c:v libx264 \
  -preset fast \
  -crf 26 \
  -profile:v main \
  -level 3.1 \
  -c:a aac \
  -b:a 96k \
  -movflags +faststart \
  mobile.mp4

최적화 포인트:

  • Main Profile: 하드웨어 디코딩 지원
  • Level 3.1: 저전력 기기 호환
  • CRF 26: 파일 크기 절약

최적화 팁

1) 프로그레시브 재생 (faststart)

아래 코드는 bash를 사용한 구현 예제입니다. 코드를 직접 실행해보면서 동작을 확인해보세요.

# 인코딩 시 적용
ffmpeg -i input.avi \
  -c:v libx264 -c:a aac \
  -movflags +faststart \
  output.mp4
# 기존 파일에 적용
ffmpeg -i input.mp4 -c copy -movflags +faststart output.mp4

효과:

  • moov를 파일 앞으로 이동
  • 웹 재생 즉시 시작 가능

2) 파일 크기 최소화

아래 코드는 bash를 사용한 구현 예제입니다. 각 부분의 역할을 이해하면서 코드를 살펴보시기 바랍니다.

# 불필요한 트랙 제거
ffmpeg -i input.mp4 \
  -map 0:v:0 \
  -map 0:a:0 \
  -c copy \
  slim.mp4
# 메타데이터 제거
ffmpeg -i input.mp4 \
  -c copy \
  -map_metadata -1 \
  no_metadata.mp4

3) 호환성 개선

아래 코드는 bash를 사용한 구현 예제입니다. 각 부분의 역할을 이해하면서 코드를 살펴보시기 바랍니다.

# 최대 호환 설정
ffmpeg -i input.mp4 \
  -c:v libx264 \
  -preset medium \
  -crf 23 \
  -profile:v baseline \
  -level 3.0 \
  -pix_fmt yuv420p \
  -c:a aac \
  -b:a 128k \
  -ar 44100 \
  -movflags +faststart \
  compatible.mp4

트러블슈팅

문제 1: 웹에서 재생 안 됨

증상: HTML5 video 태그에서 재생 불가

<video src="video.mp4" controls></video>
<!-- 재생 안 됨 -->

원인 1: moov 위치

# faststart 적용
ffmpeg -i input.mp4 -c copy -movflags +faststart output.mp4

원인 2: 코덱 미지원 아래 코드는 bash를 사용한 구현 예제입니다. 에러 처리를 통해 안정성을 확보합니다. 코드를 직접 실행해보면서 동작을 확인해보세요.

# 코덱 확인
ffprobe -v error -select_streams v:0 -show_entries stream=codec_name input.mp4
# HEVC → H.264 변환
ffmpeg -i input.mp4 \
  -c:v libx264 -preset medium -crf 23 \
  -c:a copy \
  -movflags +faststart \
  output.mp4

문제 2: 재생 시작 느림

증상: 다운로드 완료 후에야 재생 시작 원인: moov가 파일 끝에 위치 해결:

# faststart 적용
ffmpeg -i slow.mp4 -c copy -movflags +faststart fast.mp4

확인:

# moov 위치 확인 (mp4dump)
mp4dump slow.mp4 | grep -A 5 "moov"

문제 3: 자막 동기화 문제

증상: 자막이 영상과 어긋남 원인: 타임베이스 불일치 해결: 아래 코드는 bash를 사용한 구현 예제입니다. 코드를 직접 실행해보면서 동작을 확인해보세요.

# 자막 재동기화
ffmpeg -i video.mp4 -i subtitle.srt \
  -map 0:v -map 0:a -map 1:s \
  -c:v copy -c:a copy \
  -c:s mov_text \
  -metadata:s:s:0 language=kor \
  synced.mp4

문제 4: 모바일 재생 안 됨

증상: 특정 모바일 기기에서 재생 불가 원인: 프로파일/레벨 미지원 해결: 아래 코드는 bash를 사용한 구현 예제입니다. 각 부분의 역할을 이해하면서 코드를 살펴보시기 바랍니다.

# Baseline Profile (최대 호환)
ffmpeg -i input.mp4 \
  -c:v libx264 \
  -preset medium \
  -crf 23 \
  -profile:v baseline \
  -level 3.0 \
  -pix_fmt yuv420p \
  -c:a aac -b:a 128k \
  -movflags +faststart \
  mobile_compatible.mp4

마무리

MP4ISO BMFF 위에 세워진 사실상의 표준 배포 컨테이너이며, 실무 핵심은 moov/mdat 관계fMP4로의 전환을 이해하는 것입니다.

핵심 요약

  1. 구조
    • Box/Atom 기반 계층 구조
    • ftyp, moov, mdat 핵심 박스
    • Progressive vs Fragmented
  2. 스트리밍
    • faststart: 프로그레시브 재생
    • fMP4: HLS/DASH 세그먼트
  3. 호환성
    • 거의 모든 기기·플랫폼 지원
    • H.264 + AAC 조합 최적

선택 가이드

상황설정
웹 단일 파일Progressive MP4 + faststart
적응형 스트리밍Fragmented MP4 (HLS/DASH)
모바일 다운로드Progressive MP4 + Baseline Profile
최대 호환H.264 + AAC + yuv420p

FFmpeg 명령 치트시트

다음은 bash를 활용한 상세한 구현 코드입니다. 각 부분의 역할을 이해하면서 코드를 살펴보시기 바랍니다.

# 기본 인코딩
ffmpeg -i input.avi -c:v libx264 -c:a aac -movflags +faststart output.mp4
# 리먹스 (코덱 복사)
ffmpeg -i input.mkv -c copy -movflags +faststart output.mp4
# Fragmented MP4
ffmpeg -i input.mp4 -c copy -f mp4 -movflags frag_keyframe+empty_moov fragmented.mp4
# HLS 세그먼트
ffmpeg -i input.mp4 -c:v libx264 -c:a aac \
  -f hls -hls_time 6 -hls_segment_type fmp4 playlist.m3u8
# 메타데이터 추가
ffmpeg -i input.mp4 -c copy -metadata title="제목" output.mp4
# 다중 오디오
ffmpeg -i video.mp4 -i audio.wav \
  -map 0:v -map 0:a -map 1:a \
  -c:v copy -c:a aac \
  multi.mp4

다음 단계

참고 자료

... 996 lines not shown ... Token usage: 63706/1000000; 936294 remaining Start-Sleep -Seconds 3