Možnosti využitia počítačovej analýzy reči vo výučbe

using computer speech analysis in teaching

Viera Smoláková

Inštitút slovakistiky a mediálnych štúdií FF PU v Prešove

Príspevok predstavuje praktické možnosti použitia počítačovej analýzy rečového signálu vo výučbe pri nácviku výslovnosti. Predstavené metódy rečovej analýzy sú zjednodušené pre širšie využitie vo výučbe aj pre pedagógov, ktorí sa nevenujú primárne experimentálnej fonetike. Zvolený počítačový program (Praat) slúžiaci na analýzu reči je voľne dostupný s pomerne jednoduchým ovládaním. Vďaka svojim kvalitatívnym parametrom je využiteľný aj vo fonetických laboratóriách. Ukážky v príspevku sú vytvorené v predstavenom programe a približujú možnosti jednotlivých nástrojov prakticky využiteľných pri nácviku korektnej výslovnosti.

The contribution presents practical ways of using computer speech analysis in practising pronunciation. These methods are simplified for wider use in teaching and for teachers who do not specialize in experimental phonetics. The chosen speech analysis computer programme (Praat) is freely available and relatively easy to operate. Thanks to its high-quality parameters, it can be used in audio labs. The samples in the contribution were created using this programme and demonstrate how individual tools can be used for practising correct pronunciation.

Kľúčové slová: ortoepické chyby, počítačová analýza, výslovnosť, výučba

Key words: pronunciation mistakes, computer analysis, pronunciation, teaching

Na rozdiel od ortografických chýb v písanom prejave sa chyby vo výslovnosti často prehliadajú. Skúsenosť zo školskej praxe taktiež vyzdvihuje ortografiu pred ortoepiou. Žiaci sa o pravidlách zvukovej roviny dozvedajú len okrajovo, napriek tomu, že pri bežnej komunikácii viac rozprávajú ako píšu. Nemožnosť návratu k vyslovenej informácii v prirodzenej komunikácii upriamuje našu pozornosť na obsah rečovej komunikácie, inak povedané, môže sa zdať, že postačí, ak budeme rozprávať správne do takej miery, aby sme si rozumeli. Laxnosť v prístupe k ortoepickým chybám môže v krajnom prípade viesť k nenaplneniu komunikačného zámeru tým, že si komunikanti nebudú rozumieť. Zvládnutie ortoepie materinského jazyka sa ukazuje ako proces, ktorý nekončí vývinovým štádiom reči detí v predškolskom veku. Dôsledne zvládnutá zvuková rovina je nevyhnutnou súčasťou aj výučby cudzích jazykov. Práve preto chceme predstaviť dostupný program na analýzu reči a ponúknuť možnosti interpretácie zvukových javov.

Nároky na zvyšovanie praktických zručností absolventov vysokých škôl si vynucujú implementáciu stále nových didaktických metód do výučby. Hľadanie inovatívnych spôsobov, ktoré by študentovi prinášali komplexnú informáciu o problémovom jave a možnostiach jeho praktického uplatnenia, sa stáva výzvou pre každého pedagóga.

Naša pedagogická skúsenosť sa spája so študentmi mediálnych štúdií, pre ktorých je dôležité prakticky zvládnuť techniku reči. Výsledný rečový prejav musí byť kultivovaný, očakáva sa, že budú dodržiavať všetky jazykové normy. Nácvik techniky reči je dôležitou súčasťou vyučovacieho predmetu Akusticko-auditívna komunikácia. V rámci tohto predmetu sa študenti oboznamujú s kauzálnymi vzťahmi artikulácie a akustiky. Na to, aby zvládli ortofonickú, ortoepickú a modulačnú zložku prejavu, im pomáha poznanie jednotlivých akustických parametrov segmentálnej a suprasegmentálnej roviny. Výučba Akusticko-auditívnej komunikácie sa realizuje vo fonetickom laboratóriu, ktoré má vo svojej výbave počítače s profesionálnym softvérom slúžiacim na analýzu zvuku a zvukotesnú nahrávaciu kabínku. Pre študentov je však pri príprave na výučbu dôležité nahradiť tieto profesionálne zariadenia dostupnými spôsobmi. S uplatnením poznatkov z iných predmetov, ktoré podporujú digitálne kompetencie (porov. Kraviarová, 2015), sa ukazuje ako veľmi efektívny nástroj vhodný aj pre profesionálnu analýzu reči voľne dostupný program Praat (Boersma - Weenink, 2009)[1].

Základná informačná báza

Pre potreby analýzy reči, ktorá by viedla k praktickým záverom je nevyhnutné poznanie základných akustických parametrov a nástrojov. Jednou z foriem zobrazenia rečového signálu, s ktorou sa pracuje v programe PRAAT, je oscilogram. Ide pravdepodobne o najznámejší spôsob zobrazenia rečového signálu vo všeobecnosti. Oscilogram zaznamenáva časový priebeh zmien akustického tlaku a môžeme sa s ním stretnúť v programoch, ktoré editujú zvuk. Vodorovná os je časovou osou, vertikálna os určuje amplitúdu (výchylku) rečového signálu.

$Popis: Popis: C:\Users\Janka\Desktop\akusticko - auditivna\aj k oltaru obr.jpg$

Obrázok 1: Ukážka oscilogramu v programe Praat

Na oscilograme môžeme ľahko zmerať napr. trvanie páuz. Časové trvanie segmentov je závislé na poznaní jednotlivých akustických veličín a ich prejavov (podrobnejšie Zimmermann, 2002). Pre laika je však oscilogram vhodným doplňujúcim nástrojom pri uplatnení dôsledného počúvania[2]. Zvyšujúcou sa skúsenosťou s priebehom krivky zvukového signálu sa oscilogram ako nástroj počítačovej analýzy zvuku stáva vhodným doplnením kontroly korektnej výslovnosti.

Ďalším spôsobom zobrazenia rečového signálu, s ktorým pracuje Praat, je spektogram (označovaný aj ako sonagram), ktorý zaznamenáva zmeny frekvenčného spektra v procese realizácie reči. Ide v podstate o trojrozmerný graf, na vodorovnej osi je čas, zvislá os určuje frekvenciu a samotná sýtosť výsledného grafu (priestorová os) zobrazuje energiu. Spektogram je druhým najčastejšie využívaným nástrojom pri digitálnej analýze rečového signálu. Profesionál dokáže vhodnými nastaveniami spektrálnej analýzy jednotlivo pristúpiť k skúmaniu segmentov. Štandardné nastavenia programu Praat zobrazujú frekvenčný rozsah od 0 Hz do 5000 Hz (tieto nastavenia je možné pre potreby analýzy meniť, napr. pri skúmaní frikatív sa odporúča zvýšiť hornú hranicu na 8000 Hz). Začiatočník si môže na spektograme všimnúť zmeny súvisiace s priebehom reči: napr. zistí, že vokály majú v istých frekvenčných oblastiach zvýraznené tmavé pruhy (tieto energetické maximá zodpovedajú veličinám, ktoré sa nazývajú formanty). Tie môžu slúžiť ako pomôcka pri vymedzovaní vokálov a konsonantov.

$Popis: Popis: C:\Users\Janka\Desktop\akusticko - auditivna\aj k oltaru obr.jpg$

Obrázok 2: Ukážka spektogramu v programe PRAAT

Spektrogram a oscilogram je vhodné generovať súčasne na rovnakej vzorke. Keďže výsledné zobrazenia sa znázorňujú v oknách pod sebou, x-ová os zaznamenávajúca časový priebeh signálu, je zhodná. To umožňuje používateľovi jednoduchšiu interpretáciu zobrazeného javu.

Praktické použitie

Od rečových profesionálov, akými sú napríklad aj mediálni pracovníci, sa očakáva, že aj formálna stránka prejavu bude bezchybná. Na cvičeniach z Akusticko-auditívnej komunikácie študenti nahrávajú vlastné príspevky, ktoré následne analyzujú. Najskôr prebehne percepčná analýza reči, výsledkom ktorej je fonetický prepis slúžiaci pre potreby ďalšej analýzy. Študenti vyhodnocujú miesta, kde nastala kolízia medzi ortoepickou normou a realizovanou výslovnosťou. Tieto miesta sa stávajú predmetom analýzy v programe Praat. Po vložení vybraného zvukového súboru do programu Praat[3], je možné využitím jednotlivých nástrojov pristúpiť k samotnej analýze. Študenti majú základné poznatky o vokalických a konsonantických štruktúrach, poznajú základné zobrazovacie metódy – oscilogram a spektogram – ktoré sme predstavili vyššie. Vymedzovaním hraníc jednotiek vo väčších celkoch, či už ide o hranice slov vo vetách alebo o hranice hlások v slovách, si študenti uvedomujú komplexnosť reči, z ktorej plynie náročnosť určovania hraníc zvukov reči. Zisťujú opodstatnenosť použitia viacerých nástrojov a metód pri vymedzovaní hraníc, kde okrem sluchového analyzátora zapájajú aj objektívne výsledky zobrazené prostredníctvom oscilogramu a spektogramu (obr. 3a, obr. 3b).

Popis: Popis: 03

Obrázok 3a: Ukážka zo študentskej práce S. T.: vymedzenie hraníc slov vo výpovedi

Popis: Popis: 03detail

Obrázok 3b: Ukážka zo študentskej práce S. T.: vymedzenie hraníc slov vo výpovedi
a použitie časovej lupy na vymedzenie hlásky v

Metodologickým usmernením a zjednotením postupov pri vymedzovaní hraníc hlások (porov. Machač - Skarnitzl, 2009) ako najmenších vysloviteľných jednotiek súvislej reči sa môžeme dostať k analýze segmentálnych chýb. Študenti môžu porovnať chybne vyslovené hlásky s ortoepicky korektnými, nachádzajú chyby prejavujúce sa neuplatňovaním znelostnej asimilácie a pod. Na obrázku 4 a 5 máme v hornej časti znázornený oscilogram strereofónne nahrávaného rečového prejavu (pri jednokanálovom nahrávaní by sme dospeli len k jednému oscilogramu). Pre potreby analýzy je jednokanálové nahrávanie postačujúce (oscilogram pri dvojkanálovom zázname je zhodný ako môžeme vidieť na obr. 4 a 5). Zvýraznené pole v oscilograme vymedzuje priestor realizácie skúmaných segmentov (na obr. 4 je to vokál í, na obr. 5 hiát i-i), pričom nad vymedzením miestom máme časovú informáciu o trvaní udávanú v sekundách (pri interpretácii výsledkov dávame prednosť číselnému vyjadreniu v milisekundách). Pri vymedzovaní hraníc nám okrem sluchového analyzátora slúži aj súčasne vygenerovaný spektogram. Modré linky v spektograme zobrazujú priebeh melódie, červené body kopírujú energetické maximá.

Obrázok 4: Ukážka zobrazenia časového trvania dlhého vokálu í = 122 ms v slove koalícii

Obrázok 5: Ukážka zobrazenia časového trvania hiátového spojenia i-i = 107 ms v slove koalícii

V ďalšej analýza na obrázku 6 máme znázornený oscilogram s vyselektovanou časťou realizácie neznelého konsonantu k spoločne s prechodovou fázou. Cieľom tejto analýzy bolo jednoznačné identifikovanie chybnej výslovnosti neznelého konsonantu pod vplyvom nedodržania znelostnej asimilácie. Podľa pravidiel spodobovania by na tomto mieste mal zaznieť znelý segment g, keďže ide o slovné spojenie k oltáru, ktoré bolo realizované bez pauzy splývavou výslovnosťou.

$Popis: Popis: C:\Users\Janka\Desktop\akusticko - auditivna\aj k oltaru obr.jpg$

Obrázok 6: Ukážka zo študentskej práce J.G.: identifikovanie chybnej asimilácie

Vo väčších celkoch môžeme prostredníctvom programu Praat pozorovať pauzy, realizáciu nádychov, prípadné hezitačné zvuky či upriamiť pozornosť na realizáciu melódie koncového vetného úseku.

Na obr. 7 máme zaznamenanú nefunkčnú pauzu (trvajúcu 58 ms), ktorá bola realizovaná v spojení vašej ruky. Poslucháč pri dôslednom počúvaní identifikoval nenáležité uplatnenie pauzy, prostredníctvom počítačovej analýzy ju však dokáže verifikovať a exaktne vyjadriť jej parametre.

$Popis: Popis: C:\Users\Janka\Desktop\akusticko - auditivna\keď sa vašej ruky obr.jpg$

Obrázok 7: Ukážka zo študentskej práce J. G.: realizácia nefunkčnej pauzy

Po vykonaní takejto analýzy si študenti vo väčšej miere uvedomujú svoje nedostatky v rečovom prejave a môžu pracovať na ich odstránení. Opätovné nahrávania a opätovné analýzy vlastných ale aj cudzích rečových prejavov tak zvyšujú citlivosť študentov na korektnú výslovnosť. Takáto forma kultivácie rečového prejavu napĺňa podmienky, ktoré sa od vysokoškolského štúdia očakávajú: praktický výsledok vyplýva z poznania všeobecnejších atribútov.

Možnosti počítačovej analýzy rečového signálu sa dajú paralelne využiť aj pri výučbe cudzích jazykov. Nácvik výslovnosti hlások, slov a viet tak môže byť okrem subjektívneho sluchového vnemu podporený aj objektívnou analýzou reči. Prostredníctvom počítačovej analýzy, ktorej predchádza nahrávanie rečových prehovorov, je možné zvyšovať komunikačné kompetencie používateľov jazyka bez ohľadu na jazykový kód.

Literatúra a použité zdroje

Boersma, P. – Weening, D. 2009. Praat: doing phonetics by computer (Version 5.1). [online].[cit. 2016-06-02]. Dostupné na internete: <http://www.praat.org>.

Grušková, J. (2016): Seminárna práca z predmetu Akusticko-auditívna komunikácia.

Kraviarová, M. 2015: Digitalizácia médií a tvorba audiovizuálneho diela študentmi masmediálnych štúdií na Filozofickej fakulte Prešovskej univerzity v Prešove. In: Gogová, l. (ed.), Kľúčové kompetencie pre celoživotné vzdelávanie IV. Prešov, s. 173–179. ISSN 1338-3388.

Machač, P. – Skarnitzl, R. 2009. Fonetická segmentace hlásek. Praha: Epocha. ISBN 978-80-7425-031-6.

Tokárová, S. 2016: Seminárna práca z predmetu Akusticko-auditívna komunikácia.

Zimmermann, J. 2002. Spektografická a škálografická analýza akustického rečového signálu. Prešov: Náuka. ISBN 80-89038-22-0.

[1] Praat – voľne dostupný počítačový program slúžiaci na analýzu rečového signálu

[2] Metóda dôsledného počúvania je nevyhnutná pri fonetickom výskume. Vlastný sluchový analyzátor - ucho - slúži bádateľovi ako primárna pomôcka pri analýze zvuku.

[3] Vloženie zvukového súboru v našom prípade prebieha po selektívnom procese nahratého prejavu, kde v programe Audacity vystrihneme skúmané slovo, slovné spojenie alebo vetu. Do programu Praat vyberáme už existujúci súbor zo zoznamu editovaných zvukových súborov. Praat umožňuje aj priame nahrávanie rečového signálu, čo je vhodné pri nahrávaní slov príp. slovných spojení.