Transkripce

Právní přepis: požadavky na přesnost, formát a archivaci

V právním přepisu každé slovo nese váhu. Přeřeknutí, které v podcastovém přepisu opravíte jednou větou, může v soudním protokolu změnit smysl výpovědi. Kde jsou specifické požadavky na přesnost, formát a archivaci — a kde automatizace pomáhá, ale nestačí.


Co dělá právní přepis odlišným

Právní přepis je verbatim záznam. Vše, co bylo řečeno, musí být zaznamenáno: přeřeknutí, korekce, nedokončené věty, váhání, výplňová slova. „Ehm, tedy, nemyslím — myslím tím, že v té době jsem..." je pro soud relevantní informace o způsobu, jakým svědek výpověď formuloval. Kontrast je výrazný: redakční přepis pro novináře nebo tvůrce obsahu slovní vatu odstraňuje. Právní přepis ji zachovává jako součást důkazního materiálu.

Verbatim přepis není jen metodologické rozhodnutí — je to právní požadavek. Každá editace je potenciálním pozměněním důkazu. V případě sporu o obsah výpovědi je jediným spolehlivým referenčním bodem nahrávka + přepis, který jí věrně odpovídá.

Identifikace mluvčích

Soudní protokol musí jasně označit každou repliku: soudce, žalobce, obhájce, svědek, tlumočník. Záměna mluvčích je formální chybou s potenciálními právními důsledky — odkazování na konkrétní výrok konkrétní osoby musí být spolehlivé.

Automatická diarizace přiřadí číslované indexy (Mluvčí 1, Mluvčí 2), nikoli jména a procesní role. Přiřazení jmen a rolí mluvčím je vždy manuální krok — přepisovač nebo soudní pracovník musí identifikaci provést na základě znalosti konkrétního řízení.


Formátové požadavky právního přepisu

Soudní protokol má standardizovanou strukturu, která umožňuje přesné odkazování na konkrétní místa textu — základ pro efektivní práci u soudu.

Záhlaví dokumentu obsahuje: datum a místo konání, číslo věci nebo řízení, soud nebo instituce, přítomné osoby a jejich role, čas zahájení a ukončení jednání.

Číslování stran a řádků je základem pro odkaz. V anglosaské soudní praxi je standardem 30 řádků na stranu, číslovány každý nebo každý pátý. Výsledkem je přesná adresovatelnost: „str. 14, řádek 3" — bez vyhledávání v textu. Česká procesní praxe má vlastní konvence, ale princip je stejný: přepis musí umožnit přesný odkaz na konkrétní místo.

Timestamps ve formátu HH:MM:SS u každého segmentu umožňují dohledání v nahrávce. Při sporu o obsah nebo kontext výroku stačí jít na konkrétní čas — namísto přehrávání celého záznamu.

Archivace

Pro dlouhodobou archivaci právních dokumentů je standardem PDF/A (ISO 19005) — archivní varianta PDF zaručující čitelnost bez závislosti na konkrétní verzi softwaru. Metadata dokumentu identifikují nahrávku, datum přepisu a verzi dokumentu. Řetěz správy (chain of custody) zaznamenává, kdo měl k nahrávce a přepisu přístup a kdy — základ pro prokázání integrity důkazního materiálu v případě zpochybnění.


Kde automatický přepis pomůže

Certifikovaný soudní přepisovač pracuje historicky v poměru přibližně 1:3 — hodina záznamu znamená tři hodiny práce. Automatický přepis tento poměr výrazně mění.

Prvotní přepis s timestamps vznikne za minuty. Přepisovač pak opravuje a ověřuje místo toho, aby psal od začátku. Realistická úspora: 60 až 70 % pracovní doby přepisovače. Stejný výsledek za výrazně kratší čas nebo stejný čas na vyšší objem případů.

Timestamps jako přidaná hodnota jsou relevantní samy o sobě: automaticky generovaná časová razítka eliminují manuální zaznamenávání časů. Každý segment přepisu má přesný čas — dohledání sporného místa v nahrávce trvá sekundy.


Kde automatický přepis nestačí

Přesnost pod 99 % je v právním kontextu příliš nízká. Na hodinovém záznamu (přibližně 9 000 slov) WER 3 % — jeden z nejlepších výsledků dnešních modelů — znamená přibližně 270 chybně přepsaných slov. Každé chybné slovo je potenciálním sporným bodem. Žádný současný model nedosahuje 99 %+ přesnosti na spontánní právní češtině.

Odborná terminologie a procesní jazyk

Latinské právní termíny (habeas corpus, actus reus, in rem), procesní obraty (namítám, vyhrazuji si právo odvolání, přijato jako důkaz č. 14), jména stran a svědků — model přepisuje foneticky bez znalosti právního kontextu. Výsledky jsou nepředvídatelné a chybí jim konzistentnost, kterou právní dokument vyžaduje.

Zvlášť nebezpečná je skupina foneticky podobných právních termínů s různým smyslem. Model může v kontextu slyšet jedno a myslet druhé. Editor musí právní terminologii znát, aby chybu vůbec rozpoznal.

Ověření a odpovědnost

Soudní protokol jako úřední dokument vyžaduje podpis ověřující osoby. Žádný automatický přepis nemůže být podepsán jako ověřená soudní listina bez lidského ověření. Právní odpovědnost za obsah protokolu leží vždy na certifikovaném přepisovači nebo soudním pracovníkovi — automatizace tuto odpovědnost nepřebírá.


Praktický model, který v právním kontextu dává smysl: automatický přepis dodá prvotní text s timestamps za minuty. Certifikovaný přepisovač text zkontroluje, opraví terminologii, ověří atribuci mluvčích a podepíše. Výsledkem je protokol, který je zároveň rychlejší a právně platný.

Czech Transcription System lze v tomto modelu použít pro prvotní přepis — jako základ pro práci certifikovaného přepisovače, nikoli jako náhradu za jeho ověření a podpis.


Pro přepis citlivých právních nahrávek přes cloudové API je relevantní přehled GDPR a bezpečnosti dat A18. Metodologické paralely verbatim přepisu sdílí výzkumný rozhovor A10.


Zdroje: