Převezmou jazykové modely administrativu v ordinacích?
Pokročilé jazykové modely sice v poslední době zaznamenaly prudký rozvoj a vykazují skvělé výsledky při zpracování přirozeného jazyka, jejich účinnost při použití v odborné lékařské terminologii ale zůstávala dosud neprokázána. Jedním z takových oříšků byla i analýza dlouhých textů a sumarizace klíčových informací z komplexních zdravotních záznamů. Nový výzkum nicméně ukázal, že i v tomto ohledu se umělá inteligence vyvíjí ostošest.
Nekonečné papírování
Lékaři v současné době tráví značné množství času zpracováním obrovského množství textových informací – sumarizací diagnostických zpráv, psaním poznámek o průběhu léčby nebo tvorbou souhrnů anamnézy pacientů léčených několika různými specialisty. Předchozí výzkumy uvádějí, že lékaři mohou dokumentací a administrativou strávit až 2 hodiny na každou hodinu interakce s pacientem. Administrativa a dokumentace zatěžuje také zdravotní sestry, kterým může zabrat až 60 % jejich pracovního času.
Nadměrná vytíženost spojená s dokumentací má za následek odvádění pozornosti zdravotníků od přímé péče o pacienty i výrazný pokles jejich spokojenosti se svou profesí, což může v konečném důsledku vést až k vyhoření. Při velkém objemu zpracovávaného textu navíc i u zkušených lékařů existuje riziko chyb a nepřesností.
Jazykové modely versus lidští experti
Mezinárodní výzkumný tým v čele s vědci ze Stanfordovy univerzity v Kalifornii se proto ve své studii, publikované v únoru 2024 v časopisu Nature Medicine, zaměřil na možnosti využití pokročilých jazykových modelů a umělé inteligence, které by mohly lékařům se sumarizací a vyhodnocením klinických záznamů pomoci.
Výzkum probíhal ve třech fázích, které na sebe postupně navazovaly. V té první zadal výzkumný tým 8 různým jazykovým modelům sérii 4 specifických sumarizační úloh – měly zpracovat radiologické zprávy, otázky pacientů, poznámky o průběhu vyšetření a dialog mezi lékařem a pacientem. Pro porovnání pak stejné úkoly vypracovalo také několik lidských expertů.
Druhým krokem byla zaslepená studie, ve které vypracované souhrny hodnotilo a následně porovnávalo 10 lékařů z různých oborů. Poslední fází výzkumu pak byla analýza bezpečnosti, při které výzkumníci vyhledávali různé typy zkreslených informací a snažili se identifikovat potenciální pochybení, která mohou vyplynout jak z volby jazykového modelu, tak z pochybení lékařského experta.
Výsledek první studie: 1 : 0
Jako nejlepší se nakonec ukázal jazykový model GPT-4, který byl dodatečně dotrénován a adaptován na medicínském prostředí. Výsledné porovnání ukázalo, že v žádné z úloh nebyly souhrny vytvořené AI horší než ty pocházející z pera lékařských expertů.
Ve srovnání s lékaři byly souhrny jazykového modelu dokonce úplnější a často také přesnější, protože se dopouštěly méně chyb. Jako příklad autoři studie uvádějí sumarizaci radiologických zpráv, u kterých lékaři relativně často zaměňují pravou a levou stranu. Shrnutí vytvořená umělou inteligencí pak byla také stručnější, současně v nich ale žádné podstatné informace nechyběly.
Začlenění jazykových modelů do medicínské praxe by mohlo vést ke snížení administrativní zátěže lékařů, čímž by se také mohla zlepšit a zefektivnit samotná péče o pacienty. Studie navíc ukázala, že výkon AI může být pro medicínské účely dále trénován a vylepšován. Jestli se závěry této studie potvrdí, to ukážou další výzkumy i využití jazykových modelů přímo v praxi.
(jko)
Líbil se Vám článek? Rádi byste se k němu vyjádřili? Napište nám − Vaše názory a postřehy nás zajímají. Zveřejňovat je nebudeme, ale rádi Vám na ně odpovíme.
Odborné události ze světa medicíny
Všechny kongresy
Nejčtenější tento týden
- Vidí pacient v druhých démony? Možná potřebuje neurologa, nikoli psychiatra – kazuistika
- Kteří lidé jsou nejšťastnější a jak to souvisí se zdravím?
- Umělá inteligence dokáže vytrasovat záhadné metastázy do místa jejich původu
- Nobelova cena za fyziologii a lékařství 2024: Malinkatá RNA s velkým dosahem
- Metamizol jako analgetikum první volby: kdy, pro koho, jak a proč?