Převezmou jazykové modely administrativu v ordinacích?

24. 9. 2024

Pokročilé jazykové modely sice v poslední době zaznamenaly prudký rozvoj a vykazují skvělé výsledky při zpracování přirozeného jazyka, jejich účinnost při použití v odborné lékařské terminologii ale zůstávala dosud neprokázána. Jedním z takových oříšků byla i analýza dlouhých textů a sumarizace klíčových informací z komplexních zdravotních záznamů. Nový výzkum nicméně ukázal, že i v tomto ohledu se umělá inteligence vyvíjí ostošest.

Nekonečné papírování

Lékaři v současné době tráví značné množství času zpracováním obrovského množství textových informací – sumarizací diagnostických zpráv, psaním poznámek o průběhu léčby nebo tvorbou souhrnů anamnézy pacientů léčených několika různými specialisty. Předchozí výzkumy uvádějí, že lékaři mohou dokumentací a administrativou strávit až 2 hodiny na každou hodinu interakce s pacientem. Administrativa a dokumentace zatěžuje také zdravotní sestry, kterým může zabrat až 60 % jejich pracovního času.

Nadměrná vytíženost spojená s dokumentací má za následek odvádění pozornosti zdravotníků od přímé péče o pacienty i výrazný pokles jejich spokojenosti se svou profesí, což může v konečném důsledku vést až k vyhoření. Při velkém objemu zpracovávaného textu navíc i u zkušených lékařů existuje riziko chyb a nepřesností.

Jazykové modely versus lidští experti

Mezinárodní výzkumný tým v čele s vědci ze Stanfordovy univerzity v Kalifornii se proto ve své studii, publikované v únoru 2024 v časopisu Nature Medicine, zaměřil na možnosti využití pokročilých jazykových modelů a umělé inteligence, které by mohly lékařům se sumarizací a vyhodnocením klinických záznamů pomoci.

Výzkum probíhal ve třech fázích, které na sebe postupně navazovaly. V té první zadal výzkumný tým 8 různým jazykovým modelům sérii 4 specifických sumarizační úloh – měly zpracovat radiologické zprávy, otázky pacientů, poznámky o průběhu vyšetření a dialog mezi lékařem a pacientem. Pro porovnání pak stejné úkoly vypracovalo také několik lidských expertů.

Druhým krokem byla zaslepená studie, ve které vypracované souhrny hodnotilo a následně porovnávalo 10 lékařů z různých oborů. Poslední fází výzkumu pak byla analýza bezpečnosti, při které výzkumníci vyhledávali různé typy zkreslených informací a snažili se identifikovat potenciální pochybení, která mohou vyplynout jak z volby jazykového modelu, tak z pochybení lékařského experta.

Výsledek první studie: 1 : 0 

Jako nejlepší se nakonec ukázal jazykový model GPT-4, který byl dodatečně dotrénován a adaptován na medicínském prostředí. Výsledné porovnání ukázalo, že v žádné z úloh nebyly souhrny vytvořené AI horší než ty pocházející z pera lékařských expertů.

Ve srovnání s lékaři byly souhrny jazykového modelu dokonce úplnější a často také přesnější, protože se dopouštěly méně chyb. Jako příklad autoři studie uvádějí sumarizaci radiologických zpráv, u kterých lékaři relativně často zaměňují pravou a levou stranu. Shrnutí vytvořená umělou inteligencí pak byla také stručnější, současně v nich ale žádné podstatné informace nechyběly.

Začlenění jazykových modelů do medicínské praxe by mohlo vést ke snížení administrativní zátěže lékařů, čímž by se také mohla zlepšit a zefektivnit samotná péče o pacienty. Studie navíc ukázala, že výkon AI může být pro medicínské účely dále trénován a vylepšován. Jestli se závěry této studie potvrdí, to ukážou další výzkumy i využití jazykových modelů přímo v praxi.

(jko)

Zdroj: Van Veen D., Van Uden C., Blankemeier L. et al. Adapted large language models can outperform medical experts in clinical text summarization. Nat Med 2024; 30 (4): 1134–1142, doi: 10.1038/s41591-024-02855-5. 



Kurzy Podcasty Doporučená témata Časopisy
Přihlášení
Zapomenuté heslo

Zadejte e-mailovou adresu, se kterou jste vytvářel(a) účet, budou Vám na ni zaslány informace k nastavení nového hesla.

Přihlášení

Nemáte účet?  Registrujte se