Možnosti využitia
počítačovej analýzy reči vo výučbe
using computer speech
analysis in teaching
Viera Smoláková
Inštitút slovakistiky
a mediálnych štúdií FF PU v Prešove
Príspevok
predstavuje praktické možnosti použitia počítačovej analýzy rečového signálu vo
výučbe pri nácviku výslovnosti. Predstavené metódy rečovej analýzy sú
zjednodušené pre širšie využitie vo výučbe aj pre pedagógov, ktorí sa nevenujú
primárne experimentálnej fonetike. Zvolený počítačový program (Praat) slúžiaci na analýzu reči je voľne dostupný
s pomerne jednoduchým ovládaním. Vďaka svojim kvalitatívnym parametrom je
využiteľný aj vo fonetických laboratóriách. Ukážky v príspevku sú
vytvorené v predstavenom programe a približujú možnosti jednotlivých
nástrojov prakticky využiteľných pri nácviku korektnej výslovnosti.
The contribution presents practical ways of using computer
speech analysis in practising pronunciation. These methods are simplified for wider use in teaching
and for teachers who do not specialize
in experimental phonetics. The chosen speech analysis computer programme (Praat) is freely available
and relatively easy to operate. Thanks to its high-quality parameters, it can be used
in audio labs. The samples in the contribution were created using this
programme and demonstrate how individual tools can be
used for practising correct pronunciation.
Kľúčové slová: ortoepické chyby, počítačová analýza, výslovnosť,
výučba
Key words: pronunciation mistakes, computer analysis, pronunciation, teaching
Na
rozdiel od ortografických chýb v písanom prejave sa chyby vo výslovnosti
často prehliadajú. Skúsenosť zo školskej praxe taktiež vyzdvihuje ortografiu
pred ortoepiou. Žiaci sa o pravidlách zvukovej roviny dozvedajú len
okrajovo, napriek tomu, že pri bežnej komunikácii viac rozprávajú ako píšu.
Nemožnosť návratu k vyslovenej informácii v prirodzenej komunikácii
upriamuje našu pozornosť na obsah rečovej komunikácie, inak povedané, môže sa
zdať, že postačí, ak budeme rozprávať správne do takej miery, aby sme si
rozumeli. Laxnosť v prístupe k ortoepickým chybám môže v krajnom
prípade viesť k nenaplneniu komunikačného zámeru tým, že si komunikanti nebudú rozumieť. Zvládnutie ortoepie
materinského jazyka sa ukazuje ako proces, ktorý nekončí vývinovým štádiom reči
detí v predškolskom veku. Dôsledne zvládnutá zvuková rovina je nevyhnutnou
súčasťou aj výučby cudzích jazykov. Práve preto chceme predstaviť dostupný
program na analýzu reči a ponúknuť možnosti interpretácie zvukových javov.
Nároky
na zvyšovanie praktických zručností absolventov vysokých škôl si vynucujú
implementáciu stále nových didaktických metód do výučby. Hľadanie inovatívnych
spôsobov, ktoré by študentovi prinášali komplexnú informáciu o problémovom
jave a možnostiach jeho praktického uplatnenia, sa stáva výzvou pre
každého pedagóga.
Naša
pedagogická skúsenosť sa spája so študentmi mediálnych štúdií, pre ktorých je
dôležité prakticky zvládnuť techniku reči. Výsledný rečový prejav musí byť
kultivovaný, očakáva sa, že budú dodržiavať všetky jazykové normy. Nácvik
techniky reči je dôležitou súčasťou vyučovacieho predmetu Akusticko-auditívna
komunikácia. V rámci tohto predmetu sa študenti oboznamujú
s kauzálnymi vzťahmi artikulácie a akustiky. Na to, aby zvládli ortofonickú, ortoepickú a modulačnú zložku prejavu, im
pomáha poznanie jednotlivých akustických parametrov segmentálnej a suprasegmentálnej roviny. Výučba Akusticko-auditívnej
komunikácie sa realizuje vo fonetickom laboratóriu, ktoré má vo svojej výbave
počítače s profesionálnym softvérom slúžiacim na analýzu zvuku
a zvukotesnú nahrávaciu kabínku. Pre študentov je však pri príprave na
výučbu dôležité nahradiť tieto profesionálne zariadenia dostupnými spôsobmi.
S uplatnením poznatkov z iných predmetov, ktoré podporujú digitálne
kompetencie (porov. Kraviarová,
2015), sa ukazuje ako veľmi efektívny nástroj vhodný aj pre profesionálnu
analýzu reči voľne dostupný program Praat (Boersma - Weenink, 2009)[1].
Základná informačná báza
Pre
potreby analýzy reči, ktorá by viedla k praktickým záverom je nevyhnutné
poznanie základných akustických parametrov a nástrojov. Jednou
z foriem zobrazenia rečového signálu, s ktorou sa pracuje
v programe PRAAT, je oscilogram. Ide pravdepodobne
o najznámejší spôsob zobrazenia rečového signálu vo všeobecnosti. Oscilogram zaznamenáva
časový priebeh zmien akustického tlaku a môžeme sa s ním stretnúť
v programoch, ktoré editujú zvuk. Vodorovná os je časovou osou, vertikálna
os určuje amplitúdu (výchylku) rečového signálu.
|
Obrázok 1: Ukážka oscilogramu v
programe Praat |
Na
oscilograme môžeme ľahko zmerať napr. trvanie páuz.
Časové trvanie segmentov je závislé na poznaní jednotlivých akustických veličín
a ich prejavov (podrobnejšie Zimmermann, 2002).
Pre laika je však oscilogram vhodným doplňujúcim
nástrojom pri uplatnení dôsledného počúvania[2].
Zvyšujúcou sa skúsenosťou s priebehom krivky zvukového signálu sa oscilogram ako nástroj počítačovej analýzy zvuku stáva
vhodným doplnením kontroly korektnej výslovnosti.
Ďalším
spôsobom zobrazenia rečového signálu, s ktorým pracuje Praat,
je spektogram (označovaný aj ako sonagram),
ktorý zaznamenáva zmeny frekvenčného spektra v procese realizácie reči.
Ide v podstate o trojrozmerný graf, na vodorovnej osi je čas, zvislá
os určuje frekvenciu a samotná sýtosť výsledného grafu (priestorová os)
zobrazuje energiu. Spektogram je druhým najčastejšie
využívaným nástrojom pri digitálnej analýze rečového signálu. Profesionál dokáže
vhodnými nastaveniami spektrálnej analýzy jednotlivo pristúpiť k skúmaniu
segmentov. Štandardné nastavenia programu Praat
zobrazujú frekvenčný rozsah od 0 Hz do 5000 Hz (tieto nastavenia je možné pre
potreby analýzy meniť, napr. pri skúmaní frikatív sa
odporúča zvýšiť hornú hranicu na 8000 Hz). Začiatočník si môže na spektograme všimnúť zmeny súvisiace s priebehom reči:
napr. zistí, že vokály majú v istých frekvenčných oblastiach zvýraznené
tmavé pruhy (tieto energetické maximá zodpovedajú veličinám, ktoré sa nazývajú
formanty). Tie môžu slúžiť ako pomôcka pri vymedzovaní vokálov
a konsonantov.
|
Obrázok 2: Ukážka spektogramu v
programe PRAAT |
Spektrogram a oscilogram je vhodné generovať súčasne na rovnakej vzorke. Keďže
výsledné zobrazenia sa znázorňujú v oknách pod sebou, x-ová
os zaznamenávajúca časový priebeh signálu, je zhodná. To umožňuje používateľovi
jednoduchšiu interpretáciu zobrazeného javu.
Praktické použitie
Od
rečových profesionálov, akými sú napríklad aj mediálni pracovníci, sa očakáva,
že aj formálna stránka prejavu bude bezchybná. Na cvičeniach
z Akusticko-auditívnej komunikácie študenti nahrávajú vlastné príspevky,
ktoré následne analyzujú. Najskôr prebehne percepčná analýza reči, výsledkom ktorej
je fonetický prepis slúžiaci pre potreby ďalšej analýzy. Študenti vyhodnocujú
miesta, kde nastala kolízia medzi ortoepickou normou a realizovanou
výslovnosťou. Tieto miesta sa stávajú predmetom analýzy v programe Praat. Po vložení vybraného zvukového súboru do programu Praat[3],
je možné využitím jednotlivých nástrojov pristúpiť k samotnej analýze.
Študenti majú základné poznatky o vokalických a konsonantických
štruktúrach, poznajú základné zobrazovacie metódy – oscilogram
a spektogram – ktoré sme predstavili vyššie.
Vymedzovaním hraníc jednotiek vo väčších celkoch, či už ide o hranice slov
vo vetách alebo o hranice hlások v slovách, si študenti uvedomujú
komplexnosť reči, z ktorej plynie náročnosť určovania hraníc zvukov reči.
Zisťujú opodstatnenosť použitia viacerých nástrojov a metód pri
vymedzovaní hraníc, kde okrem sluchového analyzátora zapájajú aj objektívne
výsledky zobrazené prostredníctvom oscilogramu
a spektogramu (obr. 3a, obr. 3b).
|
Obrázok 3a: Ukážka zo študentskej práce S. T.: vymedzenie
hraníc slov vo výpovedi |
|
Obrázok 3b: Ukážka zo študentskej práce S. T.: vymedzenie
hraníc slov vo výpovedi |
Metodologickým
usmernením a zjednotením postupov pri vymedzovaní hraníc hlások (porov. Machač - Skarnitzl, 2009) ako najmenších vysloviteľných jednotiek
súvislej reči sa môžeme dostať k analýze segmentálnych chýb. Študenti môžu
porovnať chybne vyslovené hlásky s ortoepicky korektnými, nachádzajú chyby
prejavujúce sa neuplatňovaním znelostnej asimilácie
a pod. Na obrázku 4 a 5 máme v hornej časti znázornený oscilogram strereofónne
nahrávaného rečového prejavu (pri jednokanálovom nahrávaní by sme dospeli len
k jednému oscilogramu). Pre potreby analýzy je
jednokanálové nahrávanie postačujúce (oscilogram pri
dvojkanálovom zázname je zhodný ako môžeme vidieť na obr. 4 a 5).
Zvýraznené pole v oscilograme vymedzuje priestor
realizácie skúmaných segmentov (na obr. 4 je to vokál í, na obr. 5 hiát i-i), pričom nad vymedzením miestom máme časovú informáciu
o trvaní udávanú v sekundách (pri interpretácii výsledkov dávame
prednosť číselnému vyjadreniu v milisekundách). Pri vymedzovaní hraníc nám
okrem sluchového analyzátora slúži aj súčasne vygenerovaný spektogram.
Modré linky v spektograme zobrazujú priebeh
melódie, červené body kopírujú energetické maximá.
|
Obrázok 4: Ukážka zobrazenia časového trvania dlhého vokálu
í = 122 ms v slove koalícii |
|
Obrázok 5: Ukážka zobrazenia časového trvania hiátového
spojenia i-i = 107 ms v
slove koalícii |
V ďalšej
analýza na obrázku 6 máme znázornený oscilogram
s vyselektovanou časťou realizácie neznelého konsonantu k spoločne s prechodovou
fázou. Cieľom tejto analýzy bolo jednoznačné identifikovanie chybnej
výslovnosti neznelého konsonantu pod vplyvom nedodržania znelostnej
asimilácie. Podľa pravidiel spodobovania by na tomto mieste mal zaznieť znelý
segment g, keďže ide o slovné
spojenie k oltáru, ktoré bolo
realizované bez pauzy splývavou výslovnosťou.
|
Obrázok 6: Ukážka zo študentskej práce J.G.:
identifikovanie chybnej asimilácie |
Vo
väčších celkoch môžeme prostredníctvom programu Praat
pozorovať pauzy, realizáciu nádychov, prípadné hezitačné
zvuky či upriamiť pozornosť na realizáciu melódie koncového vetného úseku.
Na
obr. 7 máme zaznamenanú nefunkčnú pauzu (trvajúcu 58 ms),
ktorá bola realizovaná v spojení vašej
ruky. Poslucháč pri dôslednom počúvaní identifikoval nenáležité uplatnenie
pauzy, prostredníctvom počítačovej analýzy ju však dokáže verifikovať
a exaktne vyjadriť jej parametre.
|
Obrázok 7: Ukážka zo študentskej práce J. G.: realizácia
nefunkčnej pauzy |
Po
vykonaní takejto analýzy si študenti vo väčšej miere uvedomujú svoje nedostatky
v rečovom prejave a môžu pracovať na ich odstránení. Opätovné
nahrávania a opätovné analýzy vlastných ale aj cudzích rečových prejavov
tak zvyšujú citlivosť študentov na korektnú výslovnosť. Takáto forma kultivácie
rečového prejavu napĺňa podmienky, ktoré sa od vysokoškolského štúdia
očakávajú: praktický výsledok vyplýva z poznania všeobecnejších atribútov.
Možnosti
počítačovej analýzy rečového signálu sa dajú paralelne využiť aj pri výučbe
cudzích jazykov. Nácvik výslovnosti hlások, slov a viet tak môže byť okrem
subjektívneho sluchového vnemu podporený aj objektívnou analýzou reči.
Prostredníctvom počítačovej analýzy, ktorej predchádza nahrávanie rečových
prehovorov, je možné zvyšovať komunikačné kompetencie používateľov jazyka bez
ohľadu na jazykový kód.
Literatúra
a použité zdroje
Boersma, P. – Weening, D. 2009. Praat: doing phonetics
by computer (Version 5.1).
[online].[cit. 2016-06-02]. Dostupné na internete:
<http://www.praat.org>.
Grušková, J. (2016): Seminárna práca z predmetu
Akusticko-auditívna komunikácia.
Kraviarová, M. 2015: Digitalizácia médií
a tvorba audiovizuálneho diela študentmi masmediálnych štúdií na
Filozofickej fakulte Prešovskej univerzity v Prešove. In: Gogová, l. (ed.), Kľúčové
kompetencie pre celoživotné vzdelávanie IV. Prešov, s. 173–179. ISSN 1338-3388.
Machač, P. – Skarnitzl, R. 2009. Fonetická
segmentace hlásek. Praha:
Epocha. ISBN 978-80-7425-031-6.
Tokárová, S. 2016: Seminárna práca z predmetu
Akusticko-auditívna komunikácia.
Zimmermann, J. 2002. Spektografická
a škálografická analýza akustického rečového
signálu. Prešov: Náuka. ISBN 80-89038-22-0.
[1] Praat – voľne dostupný
počítačový program slúžiaci na analýzu
rečového signálu
[2] Metóda
dôsledného počúvania je nevyhnutná pri fonetickom výskume. Vlastný sluchový
analyzátor - ucho - slúži bádateľovi ako primárna pomôcka pri analýze zvuku.
[3] Vloženie
zvukového súboru v našom prípade prebieha po selektívnom procese nahratého
prejavu, kde v programe Audacity vystrihneme
skúmané slovo, slovné spojenie alebo vetu. Do programu Praat
vyberáme už existujúci súbor zo zoznamu editovaných zvukových súborov. Praat umožňuje aj priame nahrávanie rečového signálu, čo je
vhodné pri nahrávaní slov príp. slovných spojení.