Transkripce

Slovní vata v záznamu: jak vzniká, proč vadí a kdy ji nechat být

„Takže, ehm, vlastně bych řekl, že..." — každý to říká, málokdo si to uvědomuje. Slovní vata je přirozená součást mluvené řeči, ale v přepisu může zakrývat smysl a ztěžovat čtení. Otázka není jen jak ji odstranit, ale jestli vůbec má. Záleží na tom, k čemu přepis slouží.


Co je slovní vata a odkud pochází

Lingvisté ji nazývají různě: výplňová slova, diskurzní markery, disfluence. V češtině patří do této kategorie výplňové zvuky jako „ehm" a „mmm", fráze jako „takže", „vlastně", „jako", „no", „prostě", „hele" nebo „víte", ale také opakování slov, nedokončené věty a opravné sekvence — „šel jsem, tedy jela jsem tam".

Tyto jevy nejsou chybou. Mají v mluvené řeči konkrétní funkce: drží mluvčímu slovo, zatímco formuluje myšlenku; signalizují posluchačům, že projev ještě neskončil; mohou naznačovat nejistotu nebo citlivost tématu; udržují kontakt s posluchačem. Clark a Fox Tree (2002) v klasické studii dokládají, že „uh" a „um" nejsou náhodné — jsou záměrné a nesou informaci o délce plánované pauzy.

Proč ale vata v záznamu tak překvapí? Mluvená řeč je produkována v reálném čase. Chyby, váhání a opravy jsou v spontánním projevu normou — a mozek posluchače je při živém rozhovoru automaticky filtruje. Přepis tuto filtraci odstraní. Zmrazí mluvenou řeč do textu a odhalí to, co při poslechu zůstalo nepovšimnuto.


Proč slovní vata v přepisu vadí

Odstavec plný vaty je obtížně čitelný. „Ehm, takže vlastně myslím, že ehm, jo, ten projekt, víte, byl tak nějak celkem, ehm, zajímavý" — tato věta říká málo, zabírá hodně místa a čtenáři vyžaduje výrazně více soustředění než její ekvivalent bez vaty.

V novinářském přepisu je citovatelnost zásadní. Přímá citace respondenta musí odpovídat tomu, co řekl — ale musí být také čitelná. „Ehm, takže, víte, myslím, že ten projekt byl vlastně celkem, ehm, zajímavý" je obtížně použitelná jako novinářský citát.

Vata komplikuje i automatické zpracování textu. Nástroje pro extrakci informací, sumarizaci nebo strojový překlad pracují lépe s čistými větami. Přebytek vaty zkresluje statistické modely a snižuje kvalitu výstupu.

Praktický dopad: výrazná vata může prodloužit přepis o 10–20 % bez přidané informační hodnoty. Delší přepis = více času na editaci, více místa v dokumentu, méně přehledný výsledek.


Jak algoritmy slovní vatu rozpoznávají

Detekce slovní vaty je samostatný úkol strojového učení. Modely trénované na označených datech — každé slovo označeno jako „vata" nebo „obsah" — dokáží výplňová slova v kontextu rozlišovat.

Ale naráží na zásadní problém: slovo „vlastně" je vata ve větě „vlastně, ehm, to je složité", ale obsah ve větě „to je vlastně správné řešení". Algoritmus potřebuje kontext — a kontext v češtině je komplikovaný.

Confidence score (skóre jistoty, které model přiřazuje každému přepsanému slovu) může pomoci jako pomocný signál. Výplňové zvuky jako „ehm" mají zpravidla nízké skóre — model si není jistý, zda šlo o slovo nebo jen zvuk. Ale toto není spolehlivý ukazatel: nízké skóre může mít i správně přepsané slovo v šumné části záznamu.

Detekční modely trénované na anglické vatě nefungují dobře na češtině. „Uh" a „um" v angličtině mají jiný akustický profil než „ehm" v češtině. Systémy s možností konfigurace výrazů ke korekci nebo odstranění dávají uživateli přímou kontrolu — lze definovat seznam slov, která mají být z přepisu odstraněna nebo opravena.


Kdy slovní vatu odstranit — a kdy ne

Správné rozhodnutí závisí na účelu přepisu. Neexistuje univerzální odpověď.

Novinářský citát — s uvážením

Etické pravidlo v novinářské práci: citát musí věrně zachycovat smysl výpovědi, ale nemusí být doslova přesný, pokud vata smysl nezkresluje. Závorka „(…)" označuje vynechání části výpovědi.

Co je přípustné: odstranit „ehm" a „takže" na začátku věty, kde jde o časové zaplnění bez informační hodnoty. Co přípustné není: měnit slova, zkracovat větu tak, aby ztratila původní smysl, nebo kombinovat části různých výpovědí bez označení.

Přímá řeč musí obstát jako věrné zachycení toho, co respondent řekl. Editace pro čitelnost je v novinářství přijatá praxe — falzifikace nikoli.

Akademický výzkum — kdy vata je data

Pro konverzační analýzu, diskurzní analýzu nebo narativní výzkum je vata plnohodnotným materiálem. „Ehm" před odpovědí na citlivou otázku může signalizovat nejistotu nebo tabu téma. „Takže" na začátku repliky signalizuje převzetí slova. Způsob, jak respondent formuluje svou výpověď — s váháním, opravami, odbočkami — je součástí dat, ne šum.

V těchto disciplínách se používá verbatim přepis zachovávající transkripční konvenci (například Jefferson notation) s přesnými délkami pauz, intonačními značkami a přeslechy. Odstranit vatu by znamenalo zničit výzkumně relevantní informaci.

Pro tematickou analýzu nebo výzkum obsahu — kde zajímá, co respondent říkal, nikoliv jak to říkal — je čistý přepis bez vaty plně oprávněný.

Firemní přepis porad — čistota textu vítězí

V záznamu z porady prioritou je obsah: rozhodnutí, úkoly, termíny a závěry. Novinářská citovatelnost zde není na pořadu dne. Čistý přepis bez vaty je výrazně čitelnější — a automatické odstranění předem definovaných výrazů je zde plně oprávněné.

Přepis pro titulky — místo je omezené

V titulcích je prostor omezený (přibližně 42 znaků na řádek). Vata se téměř vždy vypouští. Výjimkou je dokumentární film nebo pořad, kde autenticita projevu je součástí záměru — tehdy lze zvolit zachování vaty na úkor délky bloku.


Závěr

Slovní vata není nepřítel. Je to přirozená součást toho, jak mluvíme — signál, že myšlení probíhá v reálném čase. Problém nastává, když se ocitne v médiu, pro které nebyla určena: v čitelném textu.

Tři otázky před editací přepisu:

  1. Slouží přepis jako novinářský citát nebo jako záznam k analýze obsahu?
  2. Mění odstranění vaty smysl výpovědi?
  3. Musí výsledný text obstát jako přímá řeč, nebo jde o parafrázi?

Pokud jde o citaci nebo analýzu projevu — zachovat. Pokud jde o obsah a čitelnost — odstranit. A pokud si nejste jistí: nechte si přepis v obou verzích. Originál s vatou je možné mít jako zálohu, editovanou verzi jako pracovní dokument.


Zdroje

  1. Clark, H.H. & Fox Tree, J.E. (2002). Using uh and um in spontaneous speaking. Cognition, 84(1), 73–111. [doi:10.1016/S0010-0277(02)00017-3]
  2. Hough, J. & Schlangen, D. (2017). Joint incremental disfluency detection and utterance segmentation from speech. EACL 2017.
  3. Jefferson, G. (2004). Glossary of transcript symbols with an introduction. In G. Lerner (Ed.), Conversation Analysis: Studies from the First Generation. John Benjamins.
  4. Etický kodex Syndikátu novinářů ČR. https://syndikat-novinar.cz/eticky-kodex
  5. Corpus of Spoken Czech (ČNK) — Český národní korpus, sekce mluvené češtiny. https://korpus.cz