Kinematika hlasivek - nové parametry hodnocení


Vocal Cord Kinematics – New Evaluation Parameters

This study deals with new findings about vocal folds kinematics acquired by using High–Speed Video camera. The parameters usually applied to measuring vocal folds kinematics are supplemented with new ones which are based on detection of glottis and determination of its main axis. Parameters of glottis symmetry and parameters of motion of glottis center point against its main axis are illustrated on selected case reports.

Keywords:
laryngology, vocal folds, glottis, voice quality, laryngoscopy, speech production measurement


Autoři: J. Pešta 1;  J. Slípka 1;  M. Vohlídková 1;  T. Ettler 2;  P. Nový 2;  F. Vávra 3
Působiště autorů: ORL klinika FN Plzeň, přednosta kliniky doc. MUDr. J. Slípka, CSc. 1;  Fakulta aplikovaných věd ZČU Plzeň, Katedra informatiky a výpočetní techniky, vedoucí katedry doc. Ing. P. Brada, MSc., Ph. D. 2;  Fakulta aplikovaných věd ZČU Plzeň, Katedra matematiky, vedoucí katedry prof. RNDr. P. Drábek, DrSc. souhrn 3
Vyšlo v časopise: Otorinolaryngol Foniatr, 65, 2016, No. 2, pp. 88-96.
Kategorie: Původní práce

Souhrn

V práci jsou shrnuty nové poznatky o kinematice hlasivek, získané užitím vysokorychlostní kamery HSV. Standardně používané parametry hodnocení hlasivkové kinematiky jsou rozšířeny o nové, získané použitím metod, vycházejících z detekce hlasivkové štěrbiny a stanovení její hlavní osy. Na vybraných kazuistikách jsou dokumentovány parametry symetrie štěrbiny a pohybu těžiště hlasivkové štěrbiny vzhledem k její ose.

Klíčová slova:
laryngologie, hlasové ústrojí, glottis, kvalita hlasu, laryngoskopie, měření tvorby hlasu

1. ÚVOD

Vyšetření kinematiky hlasivek pomocí vysokorychlostní kamery (HSV) provádíme na naší klinice již 10 let. Záznam vyšetření nám umožňuje sledovat ve zpomalené, časově rozložené formě, reálný pohyb hlasivek. K ohodnocení kinematiky hlasivek nemusí být vždy ale samotné pozorování dostatečné. Zdá se, že by bylo účelné definovat takové parametry, které charakterizují změny tvaru hlasivkové štěrbiny v čase v průběhu jedné nebo více period. Na základě těchto parametrů by mohla být stanovena kritéria pro hodnocení kvality kinematiky hlasivek.

Pro analýzu videozáznamů HSV je v současnosti k dispozici nejrozšířenější firemní software společností Richard Wolf GmbH [23] a KayPENTAX [24]. Tyto software umožňují většinou vytvoření videokymogramu v libovolném místě hlasivkové štěrbiny, ruční nebo poloautomatickou detekci hlasivkové štěrbiny, ruční definování hlavní osy hlasivek a výpočet a zobrazení průběhu časových změn v kinematice pevně zadaných bodů hranice a velikosti plochy hlasivkové štěrbiny. Dále umožňují vizualizaci a seřazení jednotlivých snímků z videosekvence na jednu obrazovku tak, že lze pozorováním určit okamžik otevření a uzavření hlasivkové štěrbiny, resp. dobu otevírání a uzavírání hlasivek. Lze vypočítat tzv. Open Quotient (OQ), popř. zachytit změnu jasu v předem definovaných bodech na hlasivce v průběhu jedné nebo více period. Při hodnocení některých výsledků, které splňují nutné předpoklady, se používá pro získání další třídy parametrů Fourierova analýza (FFT).

Dlouholeté zkušenosti s analýzou parametrů hlasového pole (VRP), multidimenzionální analýzou (MDVA) a analýzou kvality závěru glottis (SCORE) (viz např. 13, 14, 17), nás vedly k myšlence rozšířit soubor parametrů, které jsou součástí komerčních software HSV s cílem dále hledat vhodná kritéria hodnocení kvality kinematiky hlasivek. Abychom mohli takové parametry definovat, testovat a dávat do vzájemných souvislostí a korelací s výsledky vyšetření VRP, MDVA a SCORE, bylo nutné nejprve s dostatečnou mírou spolehlivosti automaticky detekovat hlasivkovou štěrbinu v jednotlivých snímcích videosekvence a stanovit odhad parametrů osy symetrie hlasivkové štěrbiny.

Tato práce proto obsahuje popisy detekce hlasivkové štěrbiny a odhadu osy symetrie hlasivkové štěrbiny a definuje paramet­ry hlasivkové štěrbiny, které jsou od osy symetrie odvozené. Zejména se jedná o nové parametry polohy těžiště hlasivkové štěrbiny a popisy jeho trajektorie ve videosekvenci HSV.

2. ZPŮSOBY DETEKCE HLASIVKOVÉ ŠTĚRBINY

V současné době se hlasivková štěrbina detekuje ručně nebo poloautomaticky se vstupem uživatele. Poloautomatické metody jsou většinou obsažené v proprietárním softwaru, většinou však nejsou přesně popisovány. Nejpoužívanější jsou segmentace typu watershed (4) Gabor filtering (15), region merging (16) a automatické prahování (18). Tyto metody samostatně aplikované ale nemají velkou úspěšnost u komplikovaných snímků s nižší kvalitou. Proto jsou celou řadou autorů používány kombinované metody, viz výběr některých přístupů (1, 2, 3, 11, 20).

My v našich aplikacích pro automatickou detekci hlasivkové štěrbiny používáme dvě metody, metodu Max-Min-Thresholding a metodu shlukové analýzy. Tyto metody pouze informativně představíme.

2.1  Metoda Max-Min-Thresholding

Metoda Max-Min-Thresholding je tvořena posloupností na sebe navazujících procesů a je výsledkem testování řady přístupů a jejich modifikací. Jedná se o procesy z oboru bodových transformací, filtrace, automatického prahování (7, 12) a konstrukce souvislých oblastí ve snímku (19). Jednotlivé procesy jsou aplikovány jak na jednotlivé snímky, tak na celou videosekvenci.

2.2  Metoda shlukové analýzy

Po vyčerpání možností metody Max-Min-Thresholding jsme zvolili pro klasifikaci obrazových bodů metodu shlukové analýzy. Shluková analýza reprezentuje postupy seskupování objektů do více či méně homogenních skupin podle jejich vzájemné podobnosti. Nejpoužívanější metodou shlukové analýzy je MacQueenův algoritmus „učení bez učitele“, tzv. metoda K-means (9).

Při její aplikaci jsme vycházeli ze skutečnosti, že je ve snímku hlasivková štěrbina tmavší než její okolí. To se nejvýrazněji projevuje v červené složce barevného modelu RGB. Jednotlivé obrazové body ve snímku proto považujeme za klasifikované objekty xxi, = 1 až n, kde n je počet těchto obrazových bodů. Parametry použité pro popis vlastností obrazových bodů vychází z barevného modelu RGB. Obrazové body rozdělujeme do stanoveného počtu k klasifikačních tříd CLASSj, pro j = 1 až k. K přiřazování bodů do tříd CLASSj používáme iterační metodu K-means, jejíž jednotlivé iterační cykly opakujeme, dokud nedosáhneme ustáleného stavu, požadované přesnosti nebo stanového počtu cyklů, tzv. STOP podmínka.

Před zahájením iteračních cyklů je pro každou předpokládanou třídu CLASSj definován její počáteční hodnotový představitel, tzv. centrum Centerj, pro j = 1 až k (obr. 1a). Dále je provedeno počáteční rozdělení obrazových bodů do klasifikačních tříd CLASSj (obr. 1b) podle kritéria nejmenší vzdálenosti parametrů bodu, vztah (1) vůči prvotně definovaným centrům Centerj (22),

 Prvním krokem cyklu je vždy výpočet nových center Centerj jednotlivých tříd jako těžiště tříd, vztah (2) nad parametry bodů xxi, které byly do třídy CLASSj přiřazeny (obr. 1d).

Obr. 1. Vizualizace principu shlukové analýzy K-means v jednotlivých krocích cyklu:
Vizualizace principu shlukové analýzy K-means v jednotlivých krocích cyklu:
a) rozmístění objektů xxn ve snímku; zvolená počáteční centra - Centerj, j = 1, 2, předpokládaný počet klasifikačních tříd k = 2, b) prvotní rozdělení xxj do dvou tříd CLASS, c) výpočet nových center Centerj a nové přiřazení xxj do tříd CLASSj; d) nové uspořádání center Centerj a tříd CLASSj po iteračním cyklu.

Druhým krokem cyklu je pak opětovné rozdělení obrazových bodů do klasifikačních tříd CLASSj (obr. 1d) podle kritéria nejmenší vzdálenosti parametrů bodu, vztah (1) vůči nově vypočítaným centrům Centerj,

Tento iterační cyklus se opakuje až do dosažení definované STOP podmínky.

2.3 Testování použitých metod a dosažené výsledky

Metoda shlukové analýzy výrazně zvyšuje úspěšnost detekce hlasivkové štěrbiny oproti metodě prahování Max-Min-Thresholding. Při použití vzorku 130 vybraných typových videosekvencí, které byly z hlediska detekce štěrbiny komplikované, byla shlukovou analýzou správně detekována štěrbina v 97 případech, prahováním ve 42 případech. Výsledek metody prahování byl pouze ve 4 případech detekce štěrbiny lepší než u metody shlukové analýzy. Příklady správné detekce a úplného nebo částečného selhání metody Max-Min-Thresholding v porovnání s metodou shlukové analýzy jsou na obrázku 2. Správnost detekce štěrbiny byla vždy posuzována ve spolupráci s otorinolaryngologem.

Obr. 2. Porovnání detekce štěrbiny metodou prahování Max- Min-Thresholding a metodou shlukové analýzy.
Porovnání detekce štěrbiny metodou prahování Max- Min-Thresholding a metodou shlukové analýzy.
a) příklad správné detekce oběma metodami, b) úplné selhání metody prahování, c), d) částečné selhání metody prahování

3. OSA SYMETRIE HLASIVKOVÉ ŠTĚRBINY

Po detekci hlasivkové štěrbiny je nezbytné ve snímcích provést odhad osy symetrie1 a určit její normálu. Správné stanovení polohy osy symetrie ovlivňuje vypovídací schopnost těch parametrů kinematiky hlasivek, které jsou odvozeny z předpokladu symetrie hlasivek. Takové parametry detekují vzájemné anomálie mezi levou a pravou hlasivkovou řasou. Hlavní osu hlasivky detekujeme automatickou metodou, která pracuje se sekvencí po sobě jdoucích snímků detekované hlasivkové štěrbiny.

3.1  Metoda odhadu osy symetrie

Ve firemním softwaru (23, 24) se většinou automatická detekce osy neprovádí, nebo je poloha osy stanovena ručně dvěma body, které odpovídají poloze přední a zadní komisury. V odborné literatuře jsou však metody automatické detekce hlavní osy hlasivek publikovány (např. 2, 10), nebo přehledová publikace (6).

Metody automatické detekce hlavní osy hlasivek se musí vypořádat s poruchami, které se během snímání videosekvence objeví. Např. vlivem vzájemného pohybu kamery a hrtanu se může poloha, velikost i natočení hlasivek v jednotlivých sekvencích snímků lišit. Dochází k překrytí části hlasivek supraglotickými strukturami, k ořezu štěrbiny na okraji oblasti záznamu, zakrytí jinou anatomickou strukturou nebo zamlžení snímků. Metoda detekce musí proto tyto poruchy v přiměřené míře akceptovat.

Na základě analýzy chování hlasivek, vývoje polohy hlasivkové štěrbiny vzhledem k umístění přední a zadní komisury a anatomické ose hlasivek (obr. 3) byla vytvořena robustní metoda odhadu parametrů osy symetrie hlasivkové štěrbiny.

Obr. 3. Snímek gotické oblasti zachycený vysokorychlostní kamerou. (Hlasivková štěrbina je ve fázi maximálního otevření během fonace vokálu „i“):
Snímek gotické oblasti zachycený vysokorychlostní kamerou. (Hlasivková štěrbina je ve fázi maximálního otevření během fonace vokálu „i“):
1. anatomická osa hlasivkové štěrbiny, 2. osa symetrie hlasivkové štěrbiny, AL, AR levý a pravý arytenoidní hrbol, CA přední komisura hlasivek.

Metoda odhadu parametrů osy symetrie hlasivkové štěrbiny vychází z předpokladů:

  • a) osa prokládá štěrbinu při uzavřeném stavu,
  • b) poloha hlasivek se ve snímcích videosekvence nemění, tj. snímky jsou stejnolehlé,
  • c) při nedovírání hlasivek osa prochází středem štěrbiny v nejuzavřenějším stavu.

1 Hlavní osa hlasivek [Glottal Main Axis] je definována jako spojnice středů přední a zadní komisury; terminologie a definice byla převzata z Příručky uživatele, HRES ENDOCAM, Richard Wolf (23). Střední linie hlasivkové štěrbiny [Glottal Midline] (10, 11).

2 Anatomická osa hlasivkové štěrbiny vychází z vlastní definice glottis = trojúhelníková štěrbina otevřená při dýchání a uzavřená při fonaci, která je ohraničena laterálně hlasivkovými řasami (plicaes vocalis), a dorzálně interarytenoidním prostorem. Anatomická osa je pak těžnice v trojúhelníku s vrcholem ve středu přední komisury hlasivek a středem vzdálenosti mezi arytenoidními hrboly.


Detekce osy ve fázi uzavřené štěrbiny, [předpoklad-a] je velice sporná. Její pozici je ale možné určit podle plochy štěrbiny ve fázi uzavření těsně před a ve fázi otevření těsně po stavu maximálního uzavření. Tato místa jsou evidentně ta, kde se nacházejí body štěrbiny nejčetněji. Hlasivky se ale nemusejí otevírat rovnoměrně po celé jejich délce a jejich pohyb může začínat u jednoho z okrajů. Proto nestačí sledovat chování hlasivek jen těsně před a těsně po stavu jejich maximálního uzavření, ale během celé periody nebo celé videosekvence.

Zde využijeme [předpoklad-b] o stejnolehlosti snímků ve videosekvenci. Promítnutím všech snímků sekvence a sečtením stejnolehlých obrazových bodů získáme matici, která má význam četností výskytů hlasivkové štěrbiny v jednotlivých bodech snímku. Pro vizualizaci takto získané informace vydělíme hodnotu všech bodů počtem snímků v sekvenci. Tím dojde k efektu bodové filtrace průměrováním podle stejnolehlých obrazových bodů a vznikne šedotónový obrázek, ve kterém nejtmavší místa jsou ta, kde je hlasivka nejdéle otevřená. V těchto bodech pak předpokládáme nejvyšší pravděpodobnost umístění osy symetrie hlasivkové štěrbiny (obr. 4a).

Díky technice snímání vysokorychlostní kamerou uvažujeme svislou orientaci osy. Proto v dalším upřesníme její pozici nalezením nejtmavšího (nejčetnějšího) bodu v každém řádku vypočteného snímku. Při nedovírání hlasivkové štěrbiny dochází k výskytu několika stejně tmavých (četných) bodů v jednom řádku. Pak jako bod osy označíme prostřední z nejtmavších bodů [předpoklad-c] (obr. 4b).

Při pořizování záznamu pohybu hlasivek vysokorychlostní kamerou není neobvyklé, že vlivem vzájemného pohybu hrtanu a kamery dochází ke změně polohy hlasivek v sekvenci snímků. V tomto případě je pak porušen [předpoklad-b] o stejnolehlosti jednotlivých snímků během videosekvence. Metoda je proto ještě upravena pro stanovení odhadu pomocí tzv. plovoucí osy.

Vycházíme z toho, že změna polohy hlasivek není díky setrvačné hmotě kamery a vysoké rychlosti snímání v jednotlivých po sobě jdoucích snímcích významná. Při rychlosti snímání 4000 snímků/s a základní hlasivkové frekvenci Fo = 200 Hz, připadá na jednu periodu otevření/uzavření hlasivek 20 snímků, tj. doba jedné periody Tperioda = 5 ms. Pokud však budeme uvažovat délku sekvence více než 100 snímků, bude celková doba Tsekvence ≥ 25 ms a může dojít k posunu o několik obrazových bodů. V takových případech úlohu odhadu osy symetrie hlasivkové štěrbiny ve snímku IMk videosekvence redukujeme na omezený počet snímků 2m+1, tj. snímky z videosekvence IMk-m, …, IMk, … ,IMk+m. Počet snímků 2m+1 odpovídá jednomu kmitu hlasivek s tím, že sekvence musí vždy obsahovat snímky s maximálním a minimálním otevřením hlasivek.

Aplikací metody tak získáme přímku, která je odhadem osy hlasivkové štěrbiny a zároveň osy předpokládané symetrie (obr. 4).

Obr. 4. Snímky odpovídající krokům odhadu osy symetrie pro případ symetrického a nesymetrického chování hlasivek:
Snímky odpovídající krokům odhadu osy symetrie pro případ symetrického
a nesymetrického chování hlasivek:
a) šedotónové obrázky získané sečtením snímků v sekvenci a následnou bodovou filtrací, b) vizualizované nejčetnější body hlasivkové štěrbiny detekované po řádcích, c) body odhadu osy symetrie hlasivkové štěrbiny získané aplikací metody lineární regrese.

Takto získané body určují odhad bodů osy hlasivek. Ve většině případů již tvoří přímku nebo ji kopírují v těsné blízkosti. Při poškození hlasivek, např. při rozdělení štěrbiny na více částí, může ale docházet k nepřesnostem. Proto jsme pro upřesnění odhadu osy symetrie hlasivkové štěrbiny, použili metodu lineární regrese (obr. 4c).

3.2  Testování metody odhadu osy hlasivek a dosažené výsledky

Metoda byla aplikována na vzorku 233 videozáznamů hlasivek s různým typem a stupněm patologické léze, u kterých byla vždy úspěšně detekována oblast hlasivkové štěrbiny. U hlasivek s velkým stupněm poškození, kde téměř nedocházelo k pohybu nebo byly hlasivkové řasy příliš zdeformované, nelze tuto metodu, a pravděpodobně ani žádnou jinou automatickou metodu, použít.

Pro hodnocení přesnosti odhadu hlasivkové osy byla použita metoda testování shody dvou přímek AxisConformity (AC), tj. v našem případě odhadované hlasivkové osy a anatomické osy určené lékařem ORL (obr. 5). Pro parametr shody AC pak platí:

kde:

k  …koeficient tolerance (k = 0,2)

p …koeficient penalizace úhlu (p = 3)

di  …normovaná vzdálenost bodů

h …výška výřezu

xi …x-souřadnice bodu odhadované osy

xorli …x-souřadnice bodu anatomické osy podle otorinolaryngologa.

Obr. 5. Schéma metody AxisConformity pro ohodnocení shody odhadu anatomické osy (x<sub>1</sub>, x<sub>2</sub>) a osy stanovené otorinolaryngologem (x<sub>orl1</sub>, x<sub>orl2</sub>).
Schéma metody AxisConformity pro ohodnocení shody odhadu anatomické osy (x&lt;sub&gt;1&lt;/sub&gt;, x&lt;sub&gt;2&lt;/sub&gt;) a osy stanovené otorinolaryngologem (x&lt;sub&gt;orl1&lt;/sub&gt;, x&lt;sub&gt;orl2&lt;/sub&gt;).

Interval hodnot AC ∈ (0, 1> byl rozdělen na 10 disjunktních podintervalů. Potom kvantovací koeficient q = 0,10. Výsledek přiřazení jednotlivých videozáznamů podle hodnot AC do jednotlivých podintervalů, tj. četností výskytu hodnot AC v testovaném vzorku videozáznamů, je prezentován v tabulce 1.

Tab. 1. Četnost výskytu hodnot AxisConformity v jednotlivých podintervalech AC (q = 0,10) pro soubor testovaných videosekvencí.
Četnost výskytu hodnot AxisConformity v jednotlivých podintervalech AC (q = 0,10) pro soubor testovaných videosekvencí.

U 233 testovaných videozáznamů se vyskytuje 81,97 % hodnot AC v podintervalech označených { 0,8; 0,9; 1,0 }, reálně se jedná o hodnoty AC ∈ (0,75; 1,00> (tab. 1). To v případě simulací hodnot AC (h = 100px, daxis = 0px) představuje chybu odhadu v natočení osy |α| < 3,4° a pro simulaci AC (h = 100px, α = 0°) je chyba odhadu polohy |daxis|< 3px. Zahrneme-li do hodnocení také podinterval { 0,7 }, tj. reálně AC ∈ (0,65; 1,00) (tab. 1), pak do tohoto intervalu hodnot AC patří 3,56 % testovaných os. Pro simulaci hodnot AC (h = 100px, daxis = 0px) se jedná o chybu odhadu natočení |α|< 5,7° a pro simulaci AC (h = 100px, α = 0°) je chyba odhadu polohy |daxis|< 5px.

4. PARAMETRY HLASIVKOVÉ ŠTĚRBINY

Počáteční množinu parametrů hlasivkové štěrbiny jsme volili redundantní, tj. obsahuje i takové parametry, které jsou jak přímo měřené, tak odvozované nebo závislé. Další parametry jsou získané na základě aproximace (modelu) hlasivkové štěrbiny nebo sledováním osové symetrie.

Parametry můžeme rozdělit podle jejich typu, způsobu výpočtu a charakteristiky na parametry:

  • statické odvozené z jednoho snímku hlasivek
  • dynamické vývoj štěrbiny v čase, tj. pro posloupnost snímků
    • perioda jeden kmit hlasivek
    • videosekvence definovaný počet kmitů hlasivek

a podle typu

  • rozměr plocha A a obvod P hlasivkové štěrbiny
  • tvar členitost a podlouhlost hlasivkové štěrbiny
  • symetrie parametry vztažené k hlavní ose Axis a její normále Norm
  • těžiště parametry počítané vzhledem k plošnému těžišti Ck štěrbiny
  • elipsa parametry odvozené od aproximace štěrbiny elipsou
  • kymogram

V následujícím jsou uvedeny detaily vybrané skupiny parametrů symetrie a těžiště, které jsou bezprostředně závislé na kvalitě odhadu osy symetrie hlasivek. Na jednotlivých kazuistikách prezentujeme schopnost parametrů odlišit anomální chování hlasivky.

4.1  Parametry symetrie

Jedná se o soubor parametrů, které se odvíjejí od definované osy symetrie hlasivek Axis, viz kap. 3, a normály Norm. Normála je úsečka kolmá k hlavní ose hlasivek, jejíž krajní body jsou body vnitřní hranice Hk štěrbiny Sk, a která protíná hlavní osu v jejím středu. Použití těchto parametrů má význam pro analýzu dynamiky jak jednoho celého kmitu hlasivek, tak videosekvence snímků HSV.

Symetrie plochy

Pro posouzení symetrie hlasivek podle plochy štěrbiny je nutné definovat vzhledem k hlavní ose Axis plochu levé části Aleft(k) a pravé části Aright(k) hlasivkové štěrbiny Sk ve snímku k a parametr vychýlení plochy Adelt(k).

Adelt(k) = Aright(k)Aleft(k). (4)

Příklady vývoje rozměrového parametru celkové plochy hlasivkové štěrbiny A a současně parametrů symetrie podle plochy Aright, Aleft a Adelt pro videosekvenci 100 snímků zdravého jedince a pacienta s levostrannou parézou zvratného nervu jsou na obrázku 6. Z uvedených grafů je patrný rozdíl ve vývoji parametrů symetrie. U zdravého jedince se plochy pravé a levé části hlasivkové štěrbiny shodují, viz také vývoj Adelt kolem nulové hodnoty. Naopak u pacienta s levostrannou parézou zvratného nervu je plocha levé části hlasivkové štěrbiny v jednotlivých snímcích videosekvence výrazně menší než plocha pravé části, viz také vývoj parametru Adelt. V obou případech ale vývoj celkové plochy A hlasivkové štěrbiny nevykazuje žádné výrazné odlišnosti. V případě levostranné parézy jen nedochází k úplnému uzavření hlasivkové štěrbiny, což ale nemusí být diagnosticky významné.

Obr. 6. Vývoj parametrů symetrie plochy hlasivkové štěrbiny:
Vývoj parametrů symetrie plochy hlasivkové štěrbiny:
a) zdravý jedinec (žena, SPL = 92 dB, Fo = 276 Hz), b) pacient, dg. levostranná paréza zvratného nervu – (žena, SPL = 78 dB, Fo = 240 Hz). Platí: A celková plocha hlasivkové štěrbiny Aright, Aleft plocha pravé a levé části vzhledem k ose symetrie Adelt rozdíl pravé a levé plochy hlasivkové štěrbiny

Symetrie obvodu

V tomto případě definujeme vzhledem k hlavní ose Axis obvod levé části Pleft(k) a pravé části Pright(k) hlasivkové štěrbiny Sk ve snímku k a parametr nesymetrie obvodu hlasivkové štěrbiny Pdelt(k). Parametr symetrie obvodu je schopný podchytit takové rozdíly v chování hlasivek, které nemusíme detekovat parametrem symetrie plochy A. Příkladem může být zvlnění okraje levé nebo pravé části štěrbiny Sk, které může vyvolat změnu obvodu Pleft(k) nebo Pright(k) při zachování velikosti plochy Aleft(k) nebo Aright(k).

Pdelt(k) = Pright(k)Pleft(k). (5)

Příklady vývoje rozměrového parametru celkového obvodu hlasivkové štěrbiny P a současně parametrů symetrie podle obvodu Pright, Pleft a Pdelt pro 100 snímků ve videosekvenci zdravého jedince a pacienta s levostrannou parézou zvratného nervu jsou na obrázku 7. Již v případě vývoje parametru celkového obvodu P je patrný rozdíl ve tvaru křivky, kdy nepravidelnosti, viz obr. 7b, odpovídají změnám členitosti, např. zvlnění, hraniční čáry štěrbiny.

Obr. 7. Vývoj parametrů symetrie délky obvodu hlasivkové štěrbiny:
Vývoj parametrů symetrie délky obvodu hlasivkové štěrbiny:
a) zdravý jedinec (žena, SPL = 92 dB, Fo = 276 Hz), b) pacient, dg. levostranná paréza zvratného nervu – (žena, SPL = 78 dB, Fo = 240 Hz). Platí: P celkový obvod hlasivkové štěrbiny Pright, Pleft obvod pravé a levé části vzhledem k ose symetrie Pdelt rozdíl obvodů pravé a levé části hlasivkové štěrbiny

Tyto změny v členitosti jsou typické pro zakmitávání hlasivkové řasy u parézy zvratného nervu. Vývoj obou parametrů Pright, Pleft u zdravého jedince je téměř shodný bez známek zakmitávání a odpovídá vývoji parametrů Aleft nebo Aright, viz obr. 6a., resp. parametrů A a P. Hodnoty Pdelt jsou pak také blízké nulové hodnotě.

Jev zakmitávání hlasivkových řas se ale výrazně projevuje v parametrech PrightPleft u parézy zvratného nervu. Parametr Pdelt, viz obr. 7b, ukazuje na nesymetrii v kinematice hlasivkové štěrbiny vzhledem k ose symetrie. Také průběh parametru celkového obvodu hlasivkové štěrbiny P se podstatně liší od průběhu parametru celkové plochy A právě vlivem zakmitávání hlasivkových řas.

4.2  Parametry těžiště

Parametry těžiště budeme chápat jako vzdálenost plošného těžiště štěrbiny Sk ve snímku k od hlavní osy hlasivek Dx a její normály Dy. Svým charakterem se jedná o parametry jak statické tak dynamické. Význam sledování dynamiky vývoje těžiště je patrný ze schematického zobrazení na obrázku 8 a výsledků analýzy symetrické a nesymetrické hlasivky, obrázky 9 a 10.

Pro výpočet polohy těžiště Ck(xc, yc) platí následující vztahy:

kde x a y jsou hodnoty jednotlivých souřadnic obrazových bodů, které tvoří segmentovanou oblast štěrbiny Sk, detekovanou metodami, viz kap. 2.

Obr. 8. Schéma a popis pohybu těžiště během jednoho kmitu hlasivek:
Schéma a popis pohybu těžiště během jednoho kmitu hlasivek:
a) symetrická hlasivková štěrbina, kdy je dominantní vývoj vzdálenosti Dy, tj. těžiště vzhledem k normále, b) nesymetrická hlasivková štěrbina, zesiluje vývoj vzdálenosti Dx, tj. těžiště vzhledem k hlavní ose.

Na obrázku 9 jsou prezentovány výsledky analýzy pohybu těžiště hlasivkové štěrbiny symetrické hlasivky u zdravého jedince. Dominantní pohyb je ve směru Dy, tj. podél osy symetrie štěrbiny. Maximální vychýlení těžiště je ve směru Dy (43 px  100%). Maximální vychýlení ve směru Dx, tj. normály, jsou 2 px (= 4,65% max. vychýlení těžiště).

Obr. 9. Vývoj polohy těžiště Dx a Dy hlasivkové štěrbiny u zdravého jedince – (žena, SPL = 92 dB, Fo = 252 Hz):
Vývoj polohy těžiště Dx a Dy hlasivkové štěrbiny u zdravého jedince – (žena, SPL = 92 dB, F<sub>o</sub> = 252 Hz):
a) vývoj polohy těžiště Dx a Dy pro 100 snímků z videosekvence, b) zobrazení polohy těžiště Dx a Dy pro 100 snímků z videosekvence, c) trajektorie vývoje polohy těžiště pro jednu periodu hlasivek (22. až 36. snímek). Poznámka: souřadnice Dx a Dy jsou uváděny v [%] maximálního vychýlení těžiště ve videosekvenci od osy symetrie nebo normály.

Analýza (obr. 10) ukazuje změnu v pohybu těžiště v případě karcinomu na hlasivce vlevo. Dominantní je stále pohyb ve směru Dy s maximálním vychýlením těžiště 9 px (= 100%). Malý počet obrazových bodů [ px ] je způsoben větší vzdáleností kamery od hlasivek. Pohyb Dx ve směru normály jsou pak 2 px (= 22,22% max. vychýlení těžiště).

Obr. 10. Vývoj parametrů Dx a Dy těžiště hlasivkové štěrbiny pro diagnózu karcinom vlevo- (muž, SPL = 81 dB, Fo = 298 Hz):
Vývoj parametrů Dx a Dy těžiště hlasivkové štěrbiny pro diagnózu karcinom vlevo- (muž,  SPL = 81 dB, F<sub>o</sub> = 298 Hz):
a) vývoj polohy těžiště Dx a Dy pro 100 snímků z videosekvence, b) zobrazení polohy těžiště Dx a Dy pro 100 snímků z videosekvence, c) trajektorie vývoje polohy těžiště pro jednu periodu hlasivek (19. až 34. snímek). Poznámka: souřadnice Dx a Dy jsou uváděny v [%] maximálního vychýlení těžiště ve videosekvenci od osy symetrie nebo normály.

5. ZÁVĚR

Při hodnocení kinematiky hlasivek z videozáznamu vysokorychlostní kamerou bylo nutné nejprve vyřešit dvě základní úlohy. V jednotlivých snímcích detekovat hlasivkovou štěrbinu, určit hranici hlasivkové štěrbiny a provést odhad její osy symetrie. K řešení těchto úloh jsme aplikovali metody Signal Processing, spec. Image Processing. Úspěšnost detekce hlasivkové štěrbiny a odhadu osy symetrie byla testována na 233 videozáznamech. Bylo ověřeno, že osa symetrie je odhadována v porovnání se subjektivním hodnocením velmi přesně, v 82 % případů byl odhad osy symetrie v intervalu chyby posunutí do ± 3px a úhlu natočení do ± 3,4°. Tím byla také potvrzena přesnost primární informace, tj. detekce hlasivkové štěrbiny a její hranice.

Úspěšné vyřešení tohoto problému nám dále umožnilo definovat takové parametry, které jsou odvozené od osy symetrie a určitým způsobem charakterizují hlasivkovou štěrbinu a její dynamiku. Z množiny používaných parametrů jsme pro představení navrhovaného řešení problému vybrali ty, které vyjadřují symetrii hlasivkové štěrbiny a dále jsme soustředili pozornost na sledování pohybu jejího těžiště. Ukázalo se, že takto navržené metody mohou odhalit některé nepravidelnosti v pohybu hlasivek, které jsou při běžném pozorování videozáznamu špatně postřehnutelné. To je patrné z uvedeného příkladu dvou diagnóz, parézy zvratného nervu a karcinomu, na nichž jsou prezentovány výsledky vývoje parametrů. Z doposud získaných zkušeností a analýzy dat pro omezený počet videozáznamů a diagnóz odvozujeme, že parametry symetrie a polohy těžiště bude účelné zařadit do již existujícího souboru parametrů, které testujeme pro použití při hodnocení chování hlasivek, kvality závěru glottis a kinematiky hlasivek (5, 13, 14, 17). Cílem je vytvořit kombinovaný nástroj použitelný jako podporu včasné diagnostiky závažných onemocnění hlasivek. Tento nástroj je postupně doplňován a testován. Principem je nalezení takového chování hlasivek, které je nepravidelné, nahodilé a nestandardní v rámci provedeného vyšetření (8) a které je běžnými technikami obtížně detekovatelné.

Aplikace navržených parametrů a metod má i svá úskalí. Spolehlivost a přesnost parametrů symetrie a polohy těžiště jsou závislé na kvalitě videozáznamu, tj. na velikosti detailu hlasivek v počtu obrazových bodů, na úhlu, pod kterým byly hlasivky snímány, na zaostření kamery a stabilitě videozáznamu. To je ovlivněno jak lidským faktorem během vyšetření, tak obecněji dostupným technickým vybavením.

Adresa ke korespondenci:

Ing. Jiří Pešta, CSc.

ORL klinika FN Plzeň

Tř. dr. E. Beneše 13

305 99 Plzeň

e-mail: pestaj@fnplzen.cz


Zdroje

1. Aghlmandi, D., Faez, K.: Automatic segmentation of glottal space from video Images based on mathematical morphology and the hough zransform. International Journal of Electrical and Computer Engineering (IJECE),.2, 2012, 2, s. 223~230, ISSN: 2088-8708. (http://iaesjournal.com/online/index.php/IJECE).

2. Andrade Miranda, G., Godino Llorente, J. I., Moro Velazquez, L., Gomez Garcia, J. A.: An automatic method to detect and track the glottal gap from high speed videoendoscopic images. BioMedical Engineering OnLine. 2015.

3. Blanco, M., Chen, X., Yan, Y.: A restricted, adaptive threshold segmentation approach for processing high-speed image sequences of the glottis. Engineering, 5, 357-362, Published Online October 2013 (http://www.scirp.org/journal/eng).

4. Bleau, A., Leon, L.: Watershed-based segmentation and region merging. Computer Vision and Image Understanding, 77, 2000,3, s. 317-370.

5. Ettler, T.: Analýza vysokorychlostního záznamu kmitání hlasivek. Diplomová práce, ZČU v Plzni, FAV, Katedra informatiky a výpočetní techniky, Plzeň, 2012.

6. Chen, J.: Vocal fold analysis from high speed videoEndoscopic data. A disertation. Louisiana State University. 2014.

7. Kittler, J., Illingwrth, J.: Minimum error thresholding, SERC rutherford appleton laboratory, Chilton, Didcot, Oxon OX11 0QX, U.K, 1986.

8. Kroupa, L.: Systém vyhodnocení parametrů jednoho kmitu hlasivek. Diplomová práce, ZČU v Plzni, FAV, Katedra informatiky a výpočetní techniky, Plzeň, 2015.

9. MacQueen, J. B.: Some methods for classification and analysis of multivariate observations. Proceedings of 5th Berkeley Symposium on Mathematical Statistics and Probability 1. University of California Press, s. 281-297. MR 0214227. Zbl 0214.46201. Retrieved 2009-04-07. 1967.

10. Mehta, D. D.: Investigating the impact of in vivo human vocal fold vibratory asymmetries: Co-variations among measures from laryngeal high-speed videoendoscopy, acoustic voice analysis, and auditory-perceptual voice assessment of sustained vowel phonation. Thesis Research for the Degree of Doctor of Philosophy. Massachusetts Institute of Technology, 2009.

11. Mehta, D. D., Deliyski, D. D., Quatieri, T. F., Hillman, R. E.: Automated measurement of vocal fold vibratory asymmetry from high-speed videoendoscopy recordings. Journal of Speech, Language, and Hearing Research, 54, 2011, s. 47-54.

12. Ng, H. F.: Automatic thresholding for defect detection, Pattern Recognition Letters, 27, 2006, s. 1644-1649.

13. Nový, P., Vávra, F., Kotlíková, M.: Voice range profile examination method and its applications. Summer School DATASTAT 03, Proceedings, ISBN - 80-210-3564-1, Brno, Masaryk University, 2003.

14. Nový, P., Vávra, F., Pešta, J. et al.: Parameters identification from phoniatrical examinations, summer school DATASTAT 06. Proceedings, 2007, s. 221-234, ISBN 978-80-210-4493-7, Brno: Masaryk University.

15. Palm, C., Keysers, D., Lehmann, T. et al.: Gabor filtering of complex hue/saturation images for color texture classication. Proc. JCIS 2000, Atlantic City, USA, s. 45-49.

16. Peng, B., Zhang, L.: Automatic image segmentation by dynamic region merging. IEEE Trans. Image Processing, 12, 2011, 12, s. 3592-3605.

17. Pešta, J., Slípka, J., Nový, P. et al.: Evaluating the quality of the glottis closure. Otorinolaryng. a Foniat./Prague/, 59, 2010, 4, s. 190-196,ISSN 1210-7867.

18. Russ, J. C.: The image processing handbook. Fourth Edition, CRC 2002,ISBN 0-8493-2532-3.

19. Shapiro, L., Stockman, G.: Computer vision. Prentice Hall, 2002, s. 69-73.

20. Schenk, F., Aichinger, P., Roesner, I., Urschler, M.: Automatic high-speed video glottis segmentation using salient regions and 3D geodesic active contours. Annals of the BMVA, 2015, 1, s. 1-15.

21. Švec, J.: Studium mechanicko-akustických vlastností zdroje lidského hlasu. Dizertační práce, Přírodovědecká fakulta, Univerzita Palackého v Olomouci, Olomouc, 1996.

22. Tatiraju, S., Mehta, A.: Image segmentation using k-means clustering, EM and normalized cuts. Department of EECS, 2008, s. 1-7.

23. Laryngoscopic diagnosis system HRES ENDOCAM 5562, Richard Wolf GmbH, [Cit. 29. 7. 2015]. Dostupné z URL:

http://www.richardwolf.be/userfiles/files/products/kno/G647_hres_endocam_5562_en.pdf

http://www.richard-wolf.com/discipline/ent.html

24. Color High-Speed Video System (CHSV), Model 9710, KayPENTAX, [Cit. 29. 7. 2015]. Dostupné z URL: http://www.kayelemetrics.com/index.php?option=com_product&view=product&Itemid=3&controller=product&cid[]=77&task=pro_details

Štítky
Audiologie a foniatrie Dětská otorinolaryngologie Otorinolaryngologie

Článek vyšel v časopise

Otorinolaryngologie a foniatrie

Číslo 2

2016 Číslo 2
Nejčtenější tento týden
Nejčtenější v tomto čísle
Kurzy Podcasty Doporučená témata Časopisy
Přihlášení
Zapomenuté heslo

Zadejte e-mailovou adresu, se kterou jste vytvářel(a) účet, budou Vám na ni zaslány informace k nastavení nového hesla.

Přihlášení

Nemáte účet?  Registrujte se