Převezmou jazykové modely administrativu v ordinacích?

24. 9. 2024

Pokročilé jazykové modely sice v poslední době zaznamenaly prudký rozvoj a vykazují skvělé výsledky při zpracování přirozeného jazyka, jejich účinnost při použití v odborné lékařské terminologii ale zůstávala dosud neprokázána. Jedním z takových oříšků byla i analýza dlouhých textů a sumarizace klíčových informací z komplexních zdravotních záznamů. Nový výzkum nicméně ukázal, že i v tomto ohledu se umělá inteligence vyvíjí ostošest.

Nekonečné papírování

Lékaři v současné době tráví značné množství času zpracováním obrovského množství textových informací –⁠ sumarizací diagnostických zpráv, psaním poznámek o průběhu léčby nebo tvorbou souhrnů anamnézy pacientů léčených několika různými specialisty. Předchozí výzkumy uvádějí, že lékaři mohou dokumentací a administrativou strávit až 2 hodiny na každou hodinu interakce s pacientem. Administrativa a dokumentace zatěžuje také zdravotní sestry, kterým může zabrat až 60 % jejich pracovního času.

Nadměrná vytíženost spojená s dokumentací má za následek odvádění pozornosti zdravotníků od přímé péče o pacienty i výrazný pokles jejich spokojenosti se svou profesí, což může v konečném důsledku vést až k vyhoření. Při velkém objemu zpracovávaného textu navíc i u zkušených lékařů existuje riziko chyb a nepřesností.

Jazykové modely versus lidští experti

Mezinárodní výzkumný tým v čele s vědci ze Stanfordovy univerzity v Kalifornii se proto ve své studii, publikované v únoru 2024 v časopisu Nature Medicine, zaměřil na možnosti využití pokročilých jazykových modelů a umělé inteligence, které by mohly lékařům se sumarizací a vyhodnocením klinických záznamů pomoci.

Výzkum probíhal ve třech fázích, které na sebe postupně navazovaly. V té první zadal výzkumný tým 8 různým jazykovým modelům sérii 4 specifických sumarizační úloh –⁠ měly zpracovat radiologické zprávy, otázky pacientů, poznámky o průběhu vyšetření a dialog mezi lékařem a pacientem. Pro porovnání pak stejné úkoly vypracovalo také několik lidských expertů.

Druhým krokem byla zaslepená studie, ve které vypracované souhrny hodnotilo a následně porovnávalo 10 lékařů z různých oborů. Poslední fází výzkumu pak byla analýza bezpečnosti, při které výzkumníci vyhledávali různé typy zkreslených informací a snažili se identifikovat potenciální pochybení, která mohou vyplynout jak z volby jazykového modelu, tak z pochybení lékařského experta.

Výsledek první studie: 1 : 0

Jako nejlepší se nakonec ukázal jazykový model GPT-4, který byl dodatečně dotrénován a adaptován na medicínském prostředí. Výsledné porovnání ukázalo, že v žádné z úloh nebyly souhrny vytvořené AI horší než ty pocházející z pera lékařských expertů.

Ve srovnání s lékaři byly souhrny jazykového modelu dokonce úplnější a často také přesnější, protože se dopouštěly méně chyb. Jako příklad autoři studie uvádějí sumarizaci radiologických zpráv, u kterých lékaři relativně často zaměňují pravou a levou stranu. Shrnutí vytvořená umělou inteligencí pak byla také stručnější, současně v nich ale žádné podstatné informace nechyběly.

Začlenění jazykových modelů do medicínské praxe by mohlo vést ke snížení administrativní zátěže lékařů, čímž by se také mohla zlepšit a zefektivnit samotná péče o pacienty. Studie navíc ukázala, že výkon AI může být pro medicínské účely dále trénován a vylepšován. Jestli se závěry této studie potvrdí, to ukážou další výzkumy i využití jazykových modelů přímo v praxi.

(jko)

Zdroj: Van Veen D., Van Uden C., Blankemeier L. et al. Adapted large language models can outperform medical experts in clinical text summarization. Nat Med 2024; 30 (4): 1134–1142, doi: 10.1038/s41591-024-02855-5.

Líbil se Vám článek? Rádi byste se k němu vyjádřili? Napište nám − Vaše názory a postřehy nás zajímají. Zveřejňovat je nebudeme, ale rádi Vám na ně odpovíme.

Nejčtenější tento týden

Top novinky

Nové kurzy

Top články

Nové číslo

Top novinky

Nejčtenější

Nová videa

Nová videa

Nové podcasty

Doporučené pozice

Top novinky

Převezmou jazykové modely administrativu v ordinacích?

Nekonečné papírování

Jazykové modely versus lidští experti

Výsledek první studie: 1 : 0