Přepis pro tvorbu titulků: synchronizace, délka řádku a normy čitelnosti
Titulky nejsou jen přepis mluvené řeči. Jsou to vizuální prvky s vlastními normami: délka řádku, rychlost zobrazení, způsob synchronizace s řečí. Automatický přepis vám ušetří hodiny, ale finální titulky bez znalosti těchto pravidel stejně dobře fungovat nebudou.
Přepis a titulky — dva různé produkty
Titulky existují ve třech základních typech. Otevřené titulky (burned-in, hardcoded) jsou součástí obrazu — nelze je vypnout a jsou zobrazeny u všech diváků. Typické pro sociální sítě, teasery a obsah sdílený bez možnosti nastavení. Uzavřené titulky (closed captions, soubory SRT nebo VTT) jsou volitelné — divák je může zapnout nebo vypnout. Standard pro online video (YouTube, Netflix), vzdělávací platformy a přístupnostní účely pro neslyšící a nedoslýchavé. Simultánní titulky (live captioning) jsou speciální případ pro přímé přenosy a konference s požadavkem na reálný čas.
Proč přepis automaticky titulky nezajistí: přepis zachycuje slova v čase, ale nezohledňuje délku řádku, rychlost čtení ani vizuální rozvržení. Jeden odstavec přepisu odpovídá typicky 3–8 titulkovým blokům s různými časovými kódy. Titulkový blok nesmí přetrvávat na obrazovce déle, než odpovídá řeči — ani mizet příliš rychle.
Normy čitelnosti — mezinárodní standardy
Normy pro titulky nejsou svévolné. Vycházejí z výzkumu rychlosti čtení a vizuální kognice. Znát je je podmínkou pro titulky, které diváci skutečně stihnou přečíst.
Délka řádku
BBC Subtitle Guidelines definují maximum 42 znaků na řádek pro anglický text. Netflix Timed Text Style Guide pracuje s týmž číslem. Pro češtinu platí týž princip — ale s důsledkem: česká slova jsou průměrně delší než anglická, takže na jeden řádek se vejde méně slov.
Příklady: „customer support" = 16 znaků, „zákaznická podpora" = 20 znaků. „Meeting room" = 12 znaků, „zasedací místnost" = 17 znaků. Česká věta je na titulkovém řádku prostorově náročnější — titulkář musí počítat s vyšším počtem bloků nebo agresivnějším zkracováním.
Standard: maximálně 2 řádky po 42 znacích.
Rychlost čtení
17–20 slov za minutu je standardní rychlost čtení titulků pro průměrného dospělého diváka. Netflix definuje 17 slov/min pro obsah určený obecné populaci. Přibližně odpovídá 5–7 sekund trvání dvouřádkového bloku.
Pokud mluvčí mluví rychleji než tato rychlost titulků umožňuje, titulky musí zkrátit a parafrázovat — ne přepisovat doslova. To je zásadní rozdíl od přepisu: titulkář aktivně edituje pro čitelnost. Díaz Cintas a Remael (2007) tuto schopnost považují za základní kompetenci titulkáře.
Minimální a maximální doba zobrazení
Minimum: 1,0–1,5 sekundy. Kratší blok divák nestihne přečíst ani nevědomě. Maximum: 7 sekund pro jeden blok — déle ztrácí synchronizaci s řečí. Přestávka mezi bloky: 2 snímky (83 ms při 24fps; 67 ms při 30fps). Bez přestávky titulkový blok „bliká".
Synchronizace — jak fungují SRT a VTT soubory
Formát SRT
SRT (SubRip Subtitle) je nejrozšířenější formát titulků. Akceptují ho všechny platformy a přehrávače. Každý blok má číslo, časový kód začátku a konce a text:
1
00:00:12,500 --> 00:00:15,200
Dobré ráno, vítejte na přednášce.
2
00:00:15,600 --> 00:00:18,900
Dnes se podíváme na základy přepisu řeči.
Přestávka 400 ms mezi koncem prvního a začátkem druhého bloku splňuje normu.
Formát VTT
WebVTT je standard pro webové přehrávače a HTML5. Strukturou je podobný SRT, navíc umožňuje metadata, pozicování titulku na obrazovce a styly. Pro přístupnostní titulky na webových platformách je VTT preferovaný formát.
O exportních formátech a jejich specifické použití podrobněji A22.
Kde automatická synchronizace selhává
Rychlá řeč způsobí, že bloky se „hromadí" — délka textu převyšuje čas, kdy je na obrazovce. Překryvy mluvčích naruší synchronizaci: algoritmus synchronizuje jeden hlas, druhý se ztratí. Pauzy v mluvě bez pauzy v obraze (hudební přechody, B-roll záběry) způsobí, že titulkový blok drží na obrazovce déle, než by měl — a synchronizace se rozejde s dějem. Timestamps na úrovni slov mají přesnost ±200 ms — kritické přechody je třeba doladit ručně.
Postup tvorby titulků z automatického přepisu
Krok 1 — automatický přepis s timestamps
Zvolit přepisovou službu s podporou timestamps na úrovni slov (Google STT, Deepgram, AssemblyAI, Whisper large). Timestamps na úrovni segmentů (celý segment bez mezikusů) nestačí pro přesnou titulkaci. Czech Transcription System exportuje timestamps jako součást JSON výstupu, z nějž lze generovat SRT nebo VTT.
Krok 2 — export do SRT nebo VTT
Přímý export: většina přepisových nástrojů nabízí přímý export do SRT nebo VTT. Přes JSON: flexibilnější přístup umožňující vlastní formátování a zpracování. [Odkaz A22 — exportní formáty]
Krok 3 — editace v titulkovém editoru
Subtitle Edit (zdarma, Windows / Wine na Linux) je nejkomplexnější freeware titulkový editor. Nabízí automatickou kontrolu délky řádků, rychlosti čtení (words per minute), synchronizace a splnění norem. Obsahuje i Wave Form pro vizuální přiřazení titulků k zvukovému záznamu. https://nikse.dk/subtitleedit
Aegisub (zdarma, multiplatformní) je standard pro fansubs a pokročilé titulkování s přesnější kontrolou nad typografií.
CapCut, Descript: integrované nástroje pro videotvůrce — jednodušší, méně nástrojů pro přesnou kontrolu, ale dostačující pro jednodušší projekty.
Co opravit vždy: řádky delší než 42 znaků (oříznout nebo přeformulovat), bloky trvající méně než 1,0 s, bloky bez přestávky za předchozím.
Krok 4 — kontrola v kontextu videa
Přehrát video s titulky celé nebo alespoň na náhodně vybraných místech. Co v textovém editoru vypadá správně, nemusí fungovat při sledování: pomalý text, vizuální překrytí důležitého obrazu titulkem, titulkový blok přetrvávající po konci odpovídající promluvy.
Specifika pro češtinu a přístupnostní hledisko
Česká slova a délka řádku
Práce s 42 znaky na řádek je v češtině prostorově náročnější než v angličtině. Titulkář pro český obsah musí počítat s agresivnějším zkracováním nebo s více bloky na stejný úsek textu. Zkracování nesmí změnit smysl — zvláště u výroků, kde přesné znění má právní nebo faktický dopad.
Přístupnostní titulky pro neslyšící
Přístupnostní titulky (closed captions) popisují i zvukové jevy, které neslyšící uživatel nemůže vnímat: [smích], [hudba], [zvuk bouřky], [zvonění telefonu]. Zákon o televizním vysílání (zákon 231/2001 Sb.) stanovuje povinnost titulkovat pro neslyšící u vybraných pořadů v lineárním vysílání. WCAG 2.1 Success Criterion 1.2.2 vyžaduje titulky pro předem natočený zvukový obsah na webových stránkách.
Závěr
Automatický přepis titulky nevytvoří — dá vám surový materiál. Normy čitelnosti a správná synchronizace jsou to, co z přepisu udělá opravdové titulky. Naučit se je trvá hodinu; vyplatí se pro každé video.
Praktické minimum: exportovat přepis do SRT, otevřít v Subtitle Edit, zkontrolovat délky řádků a rychlost čtení (funkce „Check timing" nebo „Check characters per second"), přehrát video od začátku. Tři kroky, které zachrání i automaticky generované titulky.
Pro přehled exportních formátů navazuje A22; pro tvorbu titulků pro vzdělávací obsah a přístupnost A32.
Zdroje
- BBC Subtitle Guidelines. https://bbc.co.uk/commissioning/tv/production/articles/titles-credits-and-subtitles
- Netflix Timed Text Style Guide. https://partnerhelp.netflixstudios.com/hc/en-us/articles/217350977
- Díaz Cintas, J. & Remael, A. (2007). Audiovisual Translation: Subtitling. Routledge. [ISBN 978-1-900650-98-4]
- W3C WCAG 2.1 — Success Criterion 1.2.2: Captions (Prerecorded). https://w3.org/WAI/WCAG21/Understanding/captions-prerecorded
- Zákon č. 231/2001 Sb. o provozování rozhlasového a televizního vysílání. https://zakonyprolidi.cz/cs/2001-231
- Subtitle Edit — dokumentace. https://nikse.dk/subtitleedit