Porovnanie spoľahlivosti AO a Evansovej klasifikácie trochanterických zlomenín


Comparison of Reliability of AO/ASIF and Evan’s Classifications

Purpose of the study:
There are many of classification systems for grading trochanteric fractures. Of these the AO/ASIF and Evan’s classification systems are widely used. To be a beneficial tool for indicating a method of treatment or permitting communication between surgeons, the classification system should be reliable and reproducible. The aim of this study was to compare the interobserver reliability and intraobserver reproducibility of the AO/ASIF and Evan’s classifications.

Material and Methods:
Plain preoperative and the first postoperative radiographs of 39 consecutive series of patients were classified using the AO/ASIF (with and without subgroups) and Evan’s classifications by five observers (2 ex-perienced surgeons, an experienced radiologist and 2 medical students). The same radiographs were classified by the same observers three months later. Observers agreement was assessed with the weighed coefficient kappa (κ).

Results:
The mean kappa (κ) value for interobserver reliability was 0.43 with the AO/ASIF subgroups (31 A1.1-A3.3), 0.51 with the AO/ASIF main groups (31A1-A3), and 0.37 with Evan’s classification. The mean κ value for intraobserver reproducibility was 0.50, 0.53 and 0.42 respectively. Perfect agreement of all observations in the first session was obtained 18 times (46%) with the AO/ASIF main groups, twice with the AO/ASIF subgroups (5%), and 5 times (13%) with Evan’s classification and 18 (46%), 2 (5%) and 4 times (10%) in the second session respectively.

Discussion and Conclusions:
Our data confirm outcomes of other authors that both the AO/ASIF and Evan’s classifications have moderate to fair inter- and intraobserver reliability with the best mean kappa values for the classification in the AO/ASIF three main groups. Using of early postoperative radiographs for classification did not increase the accuracy of classifying trochanteric fractures in comparison with other authors’ outcomes.

Key words:
kappa statistics, interobserver reliability, intraobserver reproducibility, trochanteric fractures.


Autoři: Radoslav Morochovič 1;  Dana Potočeková 2;  Henrieta Blašková 3;  Ivan Bugáň 1
Působiště autorů: Klinika úrazovej chirurgie LF UPJŠ a FNLP, Košice 1;  Department of Trauma Surgery, School of Medicine, University of P. J. Šafárik and FNLP, Košice 1;  Ústav lekárskej informatiky LF UPJŠ, Košice 2;  Institute of Medical Informatics, School of Medicine, University of P. J. Šafárik, Košice 2;  Klinika rádiodiagnostiky a nukleárnej medicíny FNLP, Košice 3;  Department of Radiodiagnostics and Nuclear Medicine, FNLP, Košice 3
Vyšlo v časopise: Úraz chir. 16., 2008, č.1

Souhrn

Účel práce:
Pre oblasť trochanterickej oblasti proximálneho femuru existuje viacero klasifikácií. Medzi inými AO/ASIF a Evansova klasifikácia. Aby klasifikácia bola vhodná na určenie spôsobu liečby a bola presným nástrojom komunikácie medzi chirurgami musí byť spoľahlivou a reprodukovateľnou. Preto cieľom práce je porovnanie interobserver spoľahlivosti a intraobserver reprodukovateľnosti AO/ASIF a Evansovej klasifikácie.

Materiál a metódy:
Vstupné predoperačné a prvé pooperačné rtg snímky 39 po sebe nasledujúcich pacientov s trochantericou zlomeninou boli hodnotené podľa AO/ASIF (s/ bez delenia do podskupín) a Evansovej klasifikácie piatimi hodnotiacimi (2x skúsenými úrazovými chirurgami, 1x röntgenológom a 2 x študentami medicíny). Tá istá séria rtg snímok bola hodnotená tými istými hodnotiacimi o 3 mesiace. Výsledná zhoda bola zhodnotená váženým koeficientom kappa (κ).

Výsledky:
Priemerná hodnota kappa pre interobserver spoľahlivosť bola 0,43 pri delení do podskupín podľa AO/ASIF (31 A1.1-A3.3), 0,51 pri hodnotení do AO/ASIF základných skupín a 0,37 pri Evansovej klasifikácii. Priemerná hodnota kappa pre intraobserver reprodukovateľnosť bola 0,50, 0,53 a 0,42. Úplná zhoda všetkých hodnotiacich bola dosiahnutá 18x (46 %) pri AO /ASIF klasifikácii do hlavných skupín v oboch sede-niach, 2x (5 %) pri klasifikácii do podskupín podľa AO/ASIF v oboch sedeniach a 5x (13 %) pri prvom a 4x (10 %) pri druhom sedení pri Evansovej klasifikácii.

Diskusia a záver:
Naše výsledky potvrdzujú závery iných autorov, že obe klasifikácie majú miernu až slabú inter - a intraobserver spoľahlivosť s najvyšším priemerom koeficientu kappa pre klasifikáciu AO/ASIF s rozdelením do hlavných skupín. Použitie prvých pooperačných snímok nezvýšilo priemernú hodnotu kappa v sledovanom súbore v porovnaní s inými autormi.

Kľúčové slová:
kappa štatistika, interobserver spoľahlivosť, intraobserver reprodukovateľnosť, trochanterické zlomeniny.

ÚVOD

Pre mnohé anatomické lokality existuje viacero klasifikácií zlomenín. Pri ich vytváraní sa autori opierali o rôzne kritériá: mechanizmus vzniku zlomeniny, priebeh lomnej línie, početnosť a mieru dislokácie úlomkov a pod. V trochanterickej oblasti femuru sa pre klasifikáciu zlomenín často používajú AO a Evansova klasifikácia [1, 5]. Kompletná AO klasifikácia rozdeľuje pertrochanterické zlomeniny na tri základné skupiny a deväť jednotlivých podtypov podľa priebehu lomnej línie a počtu úlomkov (tab. 1). Evansova klasifikácia rozdeľuje pertrochanterické zlomeniny na dva základné typy podľa priebehu lomnej línie. Prvý typ sa ďalej delí na štyri podtypy na základe rozsahu mediálnej (calcar femoris) a laterálnej (veľký trochanter) kominúcie úlomkov (tab. 2).

Tab. 1.

Tab. 2.

Správne zaklasifikovanie typu zlomeniny spĺňa v klinickej praxi viacero úloh. Slúži na výber adekvátneho spôsobu liečby, na jej základe sa dá predpovedať dĺžka hojenia, pravdepodobná prognóza liečby a v neposlednom rade je nevyhnutnou podmienkou pri porovnaní výsledkov rôznych spôsobov liečby pri tom type zlomeniny [4, 11]. Aby klasifikácia spĺňala tieto požiadavky musí byť spoľahlivá a reprodukovateľná. Spoľahlivosť klasifikácie odzrkadľuje mieru rovnakého určenia typu zlomeniny pri jej hodnotení viacerými hodnotiacimi (angl. interobserver reliability) a reprodukovateľnosť pri opakovanom posúdení tým istým hodnotiacim (angl. intraobserver reproducibility) [4].

Cieľom predkladanej práce je porovnanie spoľahlivosti a reprodukovateľnosti AO/ASIF a Evansovej klasifikácie skupinou piatich hodnotiacich.

Materiál a metóda

Na hodnotenie boli vybrané röntgenové (rtg) snímky 39 po sebe nasledujúcich pacientov hospitalizovaných v roku 2004 na Klinike úrazovej chirurgie v Košiciach s diagnózou trochanterickej zlomeniny.

Každá rtg snímka bola hodnotená piatimi hodnotiacimi, z ktorých ani jeden pri hodnotení trochanterických zlomenín predtým nepoužíval AO/ASIF alebo Evansovu klasifikáciu. Skupina hodnotiacich bola zložená z jedného skúseného röntgenológa (R), z dvoch skúsených úrazových chirurgov (T1, T2) a z dvoch študentov medicíny (M1, M2).

Na hodnotenie typu zlomeniny boli použité AO/ASIF a Evansova klasifikácia (tab. 1, 2) [1, 5]. Hodnotenie typu zlomeniny bolo vykonané dvakrát. Prvýkrát bola klasifikovaná zlomenina podľa AO/ASIF (9 podskupín 31 A1.1 – A3.3) a druhýkrát podľa Evansa (5 typov). Všetky hodnotenia boli vykonané na základe vstupných predoperačných (35 x iba anteroposteriórna (AP) projekcia, 4x AP aj axiálna projekcia) a prvých pooperačných rtg snímok v oboch projekciách.

Pred prvým hodnotením boli na rtg snímkach (nepoužitých pre ďalšie hodnotenie) a na trojrozmernom modeli femuru (Pravý femur 2230, Synbone AG, Švajčiarsko) demonštrované jednotlivé typy trochanterických zlomenín. Navyše každý hodnotiaci mal počas celého hodnotenia k dispozícii grafické vyobrazenie a slovný popis oboch klasifikácií.

Po troch mesiacoch boli použité tie isté rtg snímky pri rovnakom procese hodnotenia zlomenín tými istými hodnotiacimi.

Hodnotiaci neboli oboznámení s výsledkom klasifikácie po prvom sedení a rtg snímky nemali k dispozícii v čase medzi oboma hodnoteniami.

Miera spoľahlivosti v klasifikovaní medzi jednotlivými hodnotiacimi (interobserver) a miera reprodukovateľnosti v klasifikovaní medzi samotnými hodnotiacimi s odstupom troch mesiacov (intraobserver) bola vypočítaná uvedená hodnotou kappa (κ) [2, 12]. Za vynikajúcu zhodu medzi hodnotiacimi sa považoval výsledok koeficientu κ > 0,80, za výraznú zhodu ak κ bola v rozmedzí (0,80–0,61), za miernu zhodu κ (0,60 – 0,41), slabú zhodu κ (0,40 – 0,21) a takmer žiadnu zhodu ak κ (0,2 – 0,0) [2].

Definitívne zatriedenie posudzovaných rtg snímok do jednotlivých typov zlomenín v hodnotenom súbore bolo určené na základe prevažujúcich súhlasných odpovedí hodnotiacich. Ak bol počet súhlasných odpovedí rovnaký, typ zlomeniny bol určený dohodou medzi autormi.

Výpočty hodnôt váženého κ boli vykonané počítačovými programami Statistica Cz 6.1 (Statsoft Inc., USA) a Arcus QuickStat Biomedical 1.1 (StatsDirect Ltd., UK).

VÝSLEDKY

Zastúpenie jednotlivých typov zlomenín podľa klasifikácií AO/ASIF a Evans je uvedené v tab. 3 a 4. V skupine prevládali zlomeniny klasifikované podľa AO/ASIF ako 31 A2 a podskupiny 2 a 3 podľa Evansovej klasifikácie.

Tab. 3.

Tab. 4.

Výsledky spoľahlivosti a reprodukovateľnosti sú zhrnuté v tab. 1 až 3. Priemerná hodnota κ pre interobserver spoľahlivosť pri klasifikácii zlomenín podľa AO/ASIF do troch základných skupín (31 A1-A3) bola 0,51 (mierna zhoda) a intraobserver 0,53 (mierna zhoda).

Priemerné κ pre interobserver spoľahlivosť pri klasifikácii zlomenín podľa AO/ASIF do deviatich podskupín (31 A1.1-A3.3) bolo 0,43 (mierna zhoda) a pre intraobserver 0,50 (mierna zhoda). Pri klasifikácii podľa Evansa boli dosiahnuté priemerné hodnoty interobserver 0,37 (slabá zhoda) s intraobserver reprodukovateľnosťou 0,42 (mierna zhoda).

Tab. 5. Vypočítané κ pre inter- a intraobserver zhodu pri klasifikácií trochanterických zlomenín do skupín (A1-A3) podľa AO/ASIF
Vypočítané κ pre inter- a intraobserver zhodu pri klasifikácií trochanterických zlomenín do skupín (A1-A3) podľa AO/ASIF

Tab. 6. Vypočítané κ pre inter- a intraobserver zhodu pri klasifikácií trochanterických zlomenín do podskupín (A1.1-A3.3) podľa AO/ASIF
Vypočítané κ pre inter- a intraobserver zhodu pri klasifikácií trochanterických zlomenín do podskupín (A1.1-A3.3) podľa AO/ASIF

Úplná zhoda medzi všetkými hodnotiacimi sa pri klasifikácii do skupín (31 A1-A3) podľa AO/ASIF vyskytla 18 krát pri prvom i pri druhom hodnotení. Pri hodnotení do podskupín (31 A1.1-A3.3) v rámci klasifikácie AO/ASIF sa úplná zhoda dosiahla dvakrát v každom zo sedení a pri klasifikácii podľa Evansa pri prvom hodnotení päťkrát a pri druhom štyrikrát.

Tab. 7. Vypočítané κ pre inter- a intraobserver zhodu pri klasifikácií trochanterických zlomenín do skupín podľa Evansa
Vypočítané κ pre inter- a intraobserver zhodu pri klasifikácií trochanterických zlomenín do skupín podľa Evansa

DISKUSIA

Kappa štatistika počíta mieru zhody vo výpovediach hodnotiacich, pričom výsledný koeficient kappa (κ) zohľadňuje aj náhodne dosiahnuté zhodné hodnotenia. Teoreticky hodnota κ môže byť v rozmedzí od –1 až po 1, kde –1 vyjadruje absolútny nesúhlas v hodnoteniach (žiadna výpoveď hodnotiaceho A nebola zhodná s výpoveďou hodnotiaceho B) a hodnota 1 úplný súhlas v každej z výpovedí.

Porovnanie spoľahlivosti klasifikácii trochanterických zlomenín bolo predmetom viacerých prác [6, 8, 10, 11]. Výber hodnotiacich v publikovaných prácach bol rôzny. Kým Gehrchen a kol. [6] a Pervez a kol. [10] vybrali do hodnotiacej skupiny chirurgov s rôznou dĺžkou praxe Jin a kol. [8] vybral iba chirurgov s dostatočne dlhou praxou. Keďže akákoľvek klasifikácia by mala byť jednoznačná a jej použitie by malo byť po ozrejmení jej princípov pre kohokoľvek jednoduché, do skupiny nami vybraných piatich hodnotiacich boli zaradení zástupcovia troch rôznych skupín. Skupiny úrazových chirurgov, ktorá hodnotí ako rtg snímky tak i zlomeninu samotnú pri jej osteosyntéze, skupiny röntgenológov, ktorá hodnotí iba rtg snímky a skupiny študentov medicíny, ktorá sa ešte s hodnotením zlomenín nestretla.

V našej práci sme nehodnotili rozdiely medzi podskupinami hodnotiacich pre ich nízky počet v každej z nich. Rozdiel medzi podskupinami hodnotiacich zhodnotil vo svojej práci Schipper a kol. [11]. Pri porovnaní skupiny skúsených chirurgov, začínajúcich chirurgov a röntgenológov a ich dosiahnutých priemerných hodnôt kappa (inter- aj intraobserver) nezistil medzi týmito skupinami významný rozdiel.

Pre správne zhodnotenie zlomeniny je nevyhnutná štandardná rtg snímka postihnutého proximálneho femuru [3, 9]. Viacerí autori používali pri hodnotení zlomenín iba predoperačné snímky proximálneho femuru v dvoch projekciách [6, 10, 11]. Nami hodnotené predoperačné rtg snímky neboli vždy v požadovaných dvoch projekciách a pri výraznej deformite končatiny dochádzalo ku skresleniu zobrazovaného priebehu a rozsahu zlomeniny. Z tohoto dôvodu sme pri hodnotení použili aj prvé pooperačné snímky v oboch projekciách.

Vypočítané priemerné hodnoty κ pre interobserver spoľahlivosť a intraobserver reprodukovateľnosť AO/ASIF klasifikácie do troch skupín (31 A1-A3) dosiahli nižšie hodnoty ako vypočítané hodnoty iných autorov (tab. 8). Hodnoty κ s rozdelením do 9 podskupín podľa AO/ASIF a podľa Evansovej klasifikácie boli podobné.

Tab. 8. Prehľad priemerných hodnôt koeficientu kappa získaného pri hodnotení klasifikácií trochanterických zlomenín z hľadiska spoľahlivosti a reprodukovateľnosti
Prehľad priemerných hodnôt koeficientu kappa získaného pri hodnotení klasifikácií trochanterických zlomenín z hľadiska spoľahlivosti a reprodukovateľnosti
* v modifikácii podľa Jensena [7] # uvedené sú aj priemerné hodnoty koeficientu kappa za jednotlivé sedenia

Prezentované výsledky potvrdzujú závery ďalších autorov o miernej až slabej spoľahlivosti testovaných klasifikácií trochanterických zlomenín s najvyššou mierou spoľahlivosti a reprodukovateľnosti pri klasifikovaní zlomenín iba do troch skupín podľa AO/ASIF (31 A1-A3) [6, 8, 10, 11]. Pri tomto zaklasifikovaní zlomenín bola v našom hodnotení dosiahnutá v 18 prípadoch (46 %) úplná zhoda výpovedí hodnotiacich.

ZÁVER

Spoľahlivosť AO/ASIF a Evansovej klasifikácie trochanterických zlomenín hodnotená na základe predoperačných ako aj štandardných pooperačných rtg snímok dosahovala iba miernu až slabú mieru spoľahlivosti. Z tohoto dôvodu definitívne posúdenie typu zlomeniny zostáva na operatérovi a jeho schopnosti predoperačne alebo peroperačne určiť jej rozsah a kominúciu.

MUDr. Radoslav Morochovič, Ph.D.

Klinika úrazové chirurgie FN Košice

Rastislavova 43

040 01 Košice, SR

rado17@post.sk


Zdroje

1. Fracture and dislocation compendium. Orthopaedic Trauma Association Committee for Coding and Classification. J Orthop Trauma. 10 Suppl 1, 1996, č. s. v-ix, 32–35.

2. AUDIGE, L., BHANDARI, M., KELLAM, J. How reliable are reliability studies of fracture classifications? A systematic review of their methodologies. Acta Orthop Scand. 2004, 75, 184–194.

3. BARTONÍČEK, J., DOUŠA, P., SKÁLA-ROSEN-BAUM, J., KOŠŤÁL, R. Trochanterické zlomeniny. Souborný referát. Úraz chir. 2002, 10, 13–24.

4. BURSTEIN, A. H. Fracture classification systems: do they work and are they useful? J Bone Joint Surg. 1993,75-A, 12, 1743–1744.

5. EVANS, E. M. The treatment of trochanteric fractures of the femur. J Bone Joint Surg. 1949, 31-B, 190–203.

6. GEHRCHEN, P. M., NIELSEN, J. O., OLESEN, B. Poor reproducibility of Evans' classification of the trochanteric fracture. Assessment of 4 observers in 52 cases. Acta Orthop Scand. 1993, 64, 71–72.

7. JENSEN, J. S., MICHAELSEN, M. Trochanteric femoral fractures treated with McLaughlin osteosynthesis. Acta Orthop Scand. 1975, 46, 795–803.

8. JIN, W. J., DAI, L. Y., CUI, Y. M. et al. Reliability of classification systems for intertrochanteric fractures of the proximal femur in experienced orthopaedic surgeons. Injury. 2005, 36, 858–861.

9. KITKA, M., CIBUR, P., MOLČÁNYI, T., NOVOT-NÝ, Š., ROŠÁK, M. Výsledky a komplikácie po osteosyntézach proximálneho konca femuru dynamic-kou skĺznou skrutkou. Úraz chir. 1999, 7, 9–12.

10. PERVEZ, H., PARKER, M. J., PRYOR, G. A., LUTCHMAN, L., CHIRODIAN, N. Classification of trochanteric fracture of the proximal femur: a study of the reliability of current systems. Injury. 2002, 33. 713–715.

11. SCHIPPER, I. B., STEYERBERG, E. W., CASTE-LEIN, R. M., VAN VUGT, A. B. Reliability of the AO/ASIF classification for pertrochanteric femoral fractures. Acta Orthop Scand. 2001, 72, 36–41.

12. SIM, J., WRIGHT, C. C. The kappa statistic in reliability studies: use, interpretation, and sample size requirements. Phys Ther. 2005, 85, 257–268.

Štítky
Chirurgie všeobecná Traumatologie Urgentní medicína
Kurzy Doporučená témata Časopisy
Přihlášení
Zapomenuté heslo

Nemáte účet?  Registrujte se

Zapomenuté heslo

Zadejte e-mailovou adresu se kterou jste vytvářel(a) účet, budou Vám na ni zaslány informace k nastavení nového hesla.

Přihlášení

Nemáte účet?  Registrujte se

VIRTUÁLNÍ ČEKÁRNA ČR Jste praktický lékař nebo pediatr? Zapojte se! Jste praktik nebo pediatr? Zapojte se!

×