Transkripce

Přepis pro tvorbu titulků: synchronizace, délka řádku a normy čitelnosti

Titulky nejsou jen přepis mluvené řeči. Jsou to vizuální prvky s vlastními normami: délka řádku, rychlost zobrazení, způsob synchronizace s řečí. Automatický přepis vám ušetří hodiny, ale finální titulky bez znalosti těchto pravidel stejně dobře fungovat nebudou.


Přepis a titulky — dva různé produkty

Titulky existují ve třech základních typech. Otevřené titulky (burned-in, hardcoded) jsou součástí obrazu — nelze je vypnout a jsou zobrazeny u všech diváků. Typické pro sociální sítě, teasery a obsah sdílený bez možnosti nastavení. Uzavřené titulky (closed captions, soubory SRT nebo VTT) jsou volitelné — divák je může zapnout nebo vypnout. Standard pro online video (YouTube, Netflix), vzdělávací platformy a přístupnostní účely pro neslyšící a nedoslýchavé. Simultánní titulky (live captioning) jsou speciální případ pro přímé přenosy a konference s požadavkem na reálný čas.

Proč přepis automaticky titulky nezajistí: přepis zachycuje slova v čase, ale nezohledňuje délku řádku, rychlost čtení ani vizuální rozvržení. Jeden odstavec přepisu odpovídá typicky 3–8 titulkovým blokům s různými časovými kódy. Titulkový blok nesmí přetrvávat na obrazovce déle, než odpovídá řeči — ani mizet příliš rychle.


Normy čitelnosti — mezinárodní standardy

Normy pro titulky nejsou svévolné. Vycházejí z výzkumu rychlosti čtení a vizuální kognice. Znát je je podmínkou pro titulky, které diváci skutečně stihnou přečíst.

Délka řádku

BBC Subtitle Guidelines definují maximum 42 znaků na řádek pro anglický text. Netflix Timed Text Style Guide pracuje s týmž číslem. Pro češtinu platí týž princip — ale s důsledkem: česká slova jsou průměrně delší než anglická, takže na jeden řádek se vejde méně slov.

Příklady: „customer support" = 16 znaků, „zákaznická podpora" = 20 znaků. „Meeting room" = 12 znaků, „zasedací místnost" = 17 znaků. Česká věta je na titulkovém řádku prostorově náročnější — titulkář musí počítat s vyšším počtem bloků nebo agresivnějším zkracováním.

Standard: maximálně 2 řádky po 42 znacích.

Rychlost čtení

17–20 slov za minutu je standardní rychlost čtení titulků pro průměrného dospělého diváka. Netflix definuje 17 slov/min pro obsah určený obecné populaci. Přibližně odpovídá 5–7 sekund trvání dvouřádkového bloku.

Pokud mluvčí mluví rychleji než tato rychlost titulků umožňuje, titulky musí zkrátit a parafrázovat — ne přepisovat doslova. To je zásadní rozdíl od přepisu: titulkář aktivně edituje pro čitelnost. Díaz Cintas a Remael (2007) tuto schopnost považují za základní kompetenci titulkáře.

Minimální a maximální doba zobrazení

Minimum: 1,0–1,5 sekundy. Kratší blok divák nestihne přečíst ani nevědomě. Maximum: 7 sekund pro jeden blok — déle ztrácí synchronizaci s řečí. Přestávka mezi bloky: 2 snímky (83 ms při 24fps; 67 ms při 30fps). Bez přestávky titulkový blok „bliká".


Synchronizace — jak fungují SRT a VTT soubory

Formát SRT

SRT (SubRip Subtitle) je nejrozšířenější formát titulků. Akceptují ho všechny platformy a přehrávače. Každý blok má číslo, časový kód začátku a konce a text:


1
00:00:12,500 --> 00:00:15,200
Dobré ráno, vítejte na přednášce.

2
00:00:15,600 --> 00:00:18,900
Dnes se podíváme na základy přepisu řeči.

Přestávka 400 ms mezi koncem prvního a začátkem druhého bloku splňuje normu.

Formát VTT

WebVTT je standard pro webové přehrávače a HTML5. Strukturou je podobný SRT, navíc umožňuje metadata, pozicování titulku na obrazovce a styly. Pro přístupnostní titulky na webových platformách je VTT preferovaný formát.

O exportních formátech a jejich specifické použití podrobněji A22.

Kde automatická synchronizace selhává

Rychlá řeč způsobí, že bloky se „hromadí" — délka textu převyšuje čas, kdy je na obrazovce. Překryvy mluvčích naruší synchronizaci: algoritmus synchronizuje jeden hlas, druhý se ztratí. Pauzy v mluvě bez pauzy v obraze (hudební přechody, B-roll záběry) způsobí, že titulkový blok drží na obrazovce déle, než by měl — a synchronizace se rozejde s dějem. Timestamps na úrovni slov mají přesnost ±200 ms — kritické přechody je třeba doladit ručně.


Postup tvorby titulků z automatického přepisu

Krok 1 — automatický přepis s timestamps

Zvolit přepisovou službu s podporou timestamps na úrovni slov (Google STT, Deepgram, AssemblyAI, Whisper large). Timestamps na úrovni segmentů (celý segment bez mezikusů) nestačí pro přesnou titulkaci. Czech Transcription System exportuje timestamps jako součást JSON výstupu, z nějž lze generovat SRT nebo VTT.

Krok 2 — export do SRT nebo VTT

Přímý export: většina přepisových nástrojů nabízí přímý export do SRT nebo VTT. Přes JSON: flexibilnější přístup umožňující vlastní formátování a zpracování. [Odkaz A22 — exportní formáty]

Krok 3 — editace v titulkovém editoru

Subtitle Edit (zdarma, Windows / Wine na Linux) je nejkomplexnější freeware titulkový editor. Nabízí automatickou kontrolu délky řádků, rychlosti čtení (words per minute), synchronizace a splnění norem. Obsahuje i Wave Form pro vizuální přiřazení titulků k zvukovému záznamu. https://nikse.dk/subtitleedit

Aegisub (zdarma, multiplatformní) je standard pro fansubs a pokročilé titulkování s přesnější kontrolou nad typografií.

CapCut, Descript: integrované nástroje pro videotvůrce — jednodušší, méně nástrojů pro přesnou kontrolu, ale dostačující pro jednodušší projekty.

Co opravit vždy: řádky delší než 42 znaků (oříznout nebo přeformulovat), bloky trvající méně než 1,0 s, bloky bez přestávky za předchozím.

Krok 4 — kontrola v kontextu videa

Přehrát video s titulky celé nebo alespoň na náhodně vybraných místech. Co v textovém editoru vypadá správně, nemusí fungovat při sledování: pomalý text, vizuální překrytí důležitého obrazu titulkem, titulkový blok přetrvávající po konci odpovídající promluvy.


Specifika pro češtinu a přístupnostní hledisko

Česká slova a délka řádku

Práce s 42 znaky na řádek je v češtině prostorově náročnější než v angličtině. Titulkář pro český obsah musí počítat s agresivnějším zkracováním nebo s více bloky na stejný úsek textu. Zkracování nesmí změnit smysl — zvláště u výroků, kde přesné znění má právní nebo faktický dopad.

Přístupnostní titulky pro neslyšící

Přístupnostní titulky (closed captions) popisují i zvukové jevy, které neslyšící uživatel nemůže vnímat: [smích], [hudba], [zvuk bouřky], [zvonění telefonu]. Zákon o televizním vysílání (zákon 231/2001 Sb.) stanovuje povinnost titulkovat pro neslyšící u vybraných pořadů v lineárním vysílání. WCAG 2.1 Success Criterion 1.2.2 vyžaduje titulky pro předem natočený zvukový obsah na webových stránkách.


Závěr

Automatický přepis titulky nevytvoří — dá vám surový materiál. Normy čitelnosti a správná synchronizace jsou to, co z přepisu udělá opravdové titulky. Naučit se je trvá hodinu; vyplatí se pro každé video.

Praktické minimum: exportovat přepis do SRT, otevřít v Subtitle Edit, zkontrolovat délky řádků a rychlost čtení (funkce „Check timing" nebo „Check characters per second"), přehrát video od začátku. Tři kroky, které zachrání i automaticky generované titulky.

Pro přehled exportních formátů navazuje A22; pro tvorbu titulků pro vzdělávací obsah a přístupnost A32.


Zdroje

  1. BBC Subtitle Guidelines. https://bbc.co.uk/commissioning/tv/production/articles/titles-credits-and-subtitles
  2. Netflix Timed Text Style Guide. https://partnerhelp.netflixstudios.com/hc/en-us/articles/217350977
  3. Díaz Cintas, J. & Remael, A. (2007). Audiovisual Translation: Subtitling. Routledge. [ISBN 978-1-900650-98-4]
  4. W3C WCAG 2.1 — Success Criterion 1.2.2: Captions (Prerecorded). https://w3.org/WAI/WCAG21/Understanding/captions-prerecorded
  5. Zákon č. 231/2001 Sb. o provozování rozhlasového a televizního vysílání. https://zakonyprolidi.cz/cs/2001-231
  6. Subtitle Edit — dokumentace. https://nikse.dk/subtitleedit