Naukowcy z Uniwersytetu Tsinghua budują wirtualny szpital agenta do szkolenia lekarzy AI bez interwencji człowieka
Naukowcy z Uniwersytetu Tsinghua z Instytutu Badań nad Inteligentnym Przemysłem (AIR) https://air.tsinghua.edu.cn/en/ oraz Wydziału Informatyki i Technologii https://www.cs.tsinghua.edu.cn/csen/ zbudowali wirtualny szpital agenta do szkolenia lekarzy AI bez interwencji człowieka. Najpierw stworzyli symulację całego szpitala wraz z personelem i pacjentami. Lekarzom AI powierzono następnie diagnozowanie i leczenie tysięcy wirtualnych pacjentów bez interwencji człowieka. Lekarze szybko nauczyli się na swoich błędach, a ich umiejętności w zakresie badania, diagnozowania i leczenia znacznie wzrosły.
Wirtualne symulacje, lub symulakry, replikują rzeczywiste środowisko w celu bezpiecznego i szybkiego szkolenia sztucznej inteligencji. Komputer nie musi czekać na pojawienie się chorego pacjenta, ale raczej setki, tysiące, a nawet miliony chorych pacjentów można zaprogramować tak, aby pojawiali się zgodnie z życzeniem. Koszt takich symulacji jest również znacznie niższy niż rzeczywisty trening.
Naukowcy z Tsinghua byli w stanie szybko wyszkolić wirtualnych lekarzy AI na 10 000 wirtualnych pacjentów w symulacji Agent Hospital przy użyciu ich procesu zwanego metodą MedAgent-Zero. Zostały one utworzone poprzez dostarczenie modelom wielkojęzycznym informacji na temat ośmiu rodzajów chorób w celu stworzenia elektronicznych kart zdrowia dla 10 000 wirtualnych pacjentów, z których każdy miał inny stopień zaawansowania i prezentację. Te osiem chorób to ostre zapalenie nosogardzieli, ostry nieżyt nosa, astma oskrzelowa, przewlekłe zapalenie oskrzeli, COVID-19, grypa A, grypa B i zakażenie mykoplazmą. Do testów utworzono oddzielny zestaw 500 rekordów pacjentów.
Podczas symulacji wirtualny lekarz zasilany przez gpt-3.5-turbo-1106 szybko rozwinął swoje umiejętności. Po obejrzeniu 10 000 wirtualnych pacjentów, lekarz osiągnął wskaźniki sukcesu w badaniu, diagnozowaniu i leczeniu pacjentów na poziomie 88%, 95,6% i 77,6% w zależności od choroby.
GPT szybko się poprawia, więc naukowcy z Tsinghua przetestowali również swoją metodę treningową MedAgent-Zero przy użyciu bardziej wydajnego gpt-4-1106-preview. Porównali oni wydajność lekarzy AI gpt-3 i gpt-4, wykorzystując 1273 pytania z bazy danych MedQA, dużego zestawu pytań wielokrotnego wyboru, które są podobne do pytań licencyjnych z medycyny, które można znaleźć w testach takich jak USMLE. Wyniki wirtualnych lekarzy w zakresie pytań dotyczących chorób układu oddechowego wyniosły 93,06% gpt-4 w porównaniu z 84,72% gpt-3.
Przełomowe wyniki tych lekarzy AI zostały osiągnięte przy użyciu zaledwie kilku dni wirtualnego treningu, a symulakrum Agent Hospital otwiera drogę do opracowania metod szkoleniowych dla przyszłych lekarzy AI, a także prawdziwych lekarzy, które są znacznie szybsze i bardziej skuteczne.
Czytelnicy, którzy nie wiedzą, jakie zawody pozostaną w przyszłości opartej na sztucznej inteligencji, mogą po prostu powiedzieć im humanoidalnym robotom 1X by przygotowały dla nich obiad i posprzątały dom. Ci, którzy chcą zbudować sztuczną inteligencję, powinni wyposażyć swoje komputery PC w szybki procesor graficzny Nvidia(taki jak tenna Amazon) lub kupić jeden z najszybszych laptopów na świecie(taki jak ten na Amazon), aby rozpocząć szkolenie sztucznej inteligencji w celu przejęcia wielu miejsc pracy.
Źródło(a)
Tłumaczenie maszynowe przez przeglądarkę Edge:
AIR tworzy wirtualny szpital, aby zrealizować samorozwój lekarzy AI
Czas publikacji: 2024-05-24
Instytut Badań nad Inteligentnym Przemysłem Uniwersytetu Tsinghua (AIR) oraz Wydział Informatyki i Technologii Uniwersytetu Tsinghua współpracowały przy budowie wirtualnego szpitala, Agent HospitalMedAgent-Zero, zaproponowano metodę samorozwoju dla agentów medycznych, która umożliwia agentom medycznym ciągłe doskonalenie ich zdolności medycznych poprzez generowanie dużej ilości danych bez ręcznych adnotacji w wirtualnych szpitalach i jest weryfikowana w rzeczywistych zbiorach danych. Wszyscy pacjenci, pielęgniarki i lekarze w Agent Hospital są odgrywani przez autonomicznych agentów sterowanych przez duże modele, które symulują zamknięty proces "przed-szpitalny-w-szpitalu-po-szpitalu" początku, segregacji, rejestracji, konsultacji, badania, diagnozy, leczenia, rehabilitacji i obserwacji. W oparciu o bazę wiedzy i podstawowy model, Agent Hospital symuluje proces generowania i rozwoju choroby wirtualnych pacjentów. Wirtualni lekarze uczą się (tj. czytają literaturę medyczną) i ćwiczą (tj. wchodzą w interakcje z wirtualnymi pacjentami i podejmują decyzje dotyczące diagnozy i leczenia) w Agent Hospital, stale podsumowują doświadczenia z udanych przypadków diagnozy i leczenia, zastanawiają się nad wnioskami z nieudanych przypadków i stale poprawiają dokładność wielu zadań diagnostycznych i leczniczych. Po leczeniu prawie 10 000 wirtualnych pacjentów (ludzkim lekarzom zajmuje to około 2 lat), wirtualni lekarze byli w stanie przewyższyć najlepsze obecnie metody w podzbiorze chorób układu oddechowego zbioru danych MedQA, osiągając wskaźnik dokładności na poziomie 93,06%. Badanie, którego współautorami są adiunkt Ma Weizhi z AIR i profesor Yang Liu, dziekan wykonawczy AIR i prodziekan Wydziału Informatyki, spotkało się z dużym zainteresowaniem i dyskusją ze strony społeczności sztucznej inteligencji i społeczności medycznej w kraju i za granicą po opublikowaniu go w arXiv.
- Tytuł artykułu: Agent Hospital: Symulakrum szpitala z ewoluującymi agentami medycznymi
- Link do artykułu: arxiv.org/pdf/2405.02957v1
W ostatnich latach intensywnie rozwijały się wielkoskalowe modele językowe, a technologia agentowa oparta na dużych modelach językowych przyciągnęła wiele uwagi. Wcześniejsze badania wykorzystywały technologię agentową do symulacji świata rzeczywistego, w tym interakcji i scenariuszy gier, takich jak "Stanford Town" i "Werewolf Killing Game". Jednocześnie technologia agentowa jest również wykorzystywana w planowaniu harmonogramów i procesie współpracy różnych zadań, ale proces ten opiera się głównie na wsparciu wysokiej jakości danych z ręcznymi adnotacjami. Dlatego też pytanie badawcze dotyczy tego, czy symulacja w świecie rzeczywistym może pomóc poprawić zdolność agentów do przetwarzania zadań.
Inteligentna opieka zdrowotna przyciągnęła szeroką uwagę ze względu na jej znaczenie i wartość aplikacyjną, a zespół badawczy zwrócił dużą uwagę na zastosowanie dużych modeli językowych i technologii agentów w scenariuszach medycznych
.
W odpowiedzi na powyższe pytania badawcze zespół uważa, że rzeczywiste środowisko modelowe może pomóc w poprawie i ewolucji zdolności agentów do wykonywania zadań, dlatego przeprowadził badania Agent Hospital, które łączą symulację w świecie rzeczywistym i poprawę zdolności medycznych. W tej pracy zespół jest zaangażowany w tworzenie środowiska symulacji szpitala i badanie autonomicznej ewolucji agentów medycznych w tym środowisku. Celem jest umożliwienie agentom niezależnego gromadzenia wiedzy medycznej w procesie diagnozowania i leczenia oraz uczenia się, podobnie jak ludzcy lekarze, i realizowania ciągłej ewolucji zdolności medycznych.
Zespół badawczy skupił się najpierw na wykorzystaniu wielkoskalowych modeli agentów do symulacji krytycznych procesów medycznych w świecie rzeczywistym. W Agent Hospital zespół zaprojektował i uwzględnił 8 typowych scenariuszy od powstania choroby do powrotu do zdrowia, a mianowicie: początek, triage, rejestracja, konsultacja, badanie, diagnoza, recepta i powrót do zdrowia, a pacjenci będą aktywnie uczestniczyć w dalszych informacjach zwrotnych. Wszystkie procesy są wspierane przez duże modele, w których role mogą współdziałać autonomicznie.
Przykłady głównych sesji diagnozy i leczenia
Powyższy diagram ilustruje podejście oparte na zamkniętej pętli: kiedy Kenneth Morgan, agent pacjenta, zachoruje, udaje się do szpitala po pomoc. Pielęgniarka Katherine Li rozumie objawy Morgana, analizuje go i kieruje na określony oddział. Po tym, jak Morgan ukończy rejestrację, konsultację i badanie lekarskie zgodnie z instrukcjami lekarza, lekarz Robert przekaże mu ostateczną diagnozę i plan leczenia, a Morgan pójdzie do domu, aby odpocząć zgodnie z instrukcjami lekarza i przekaże informacje zwrotne do szpitala w celu wyzdrowienia, aż do następnego zachorowania i udania się do szpitala.
Jak widać na powyższym przykładzie, zespół badawczy zaprojektował dwa główne typy ról dla szpitala: personel medyczny i pacjenci. Wszystkie informacje o postaciach są generowane przez duży model (GPT-3.5), dzięki czemu można je łatwo skalować i dodawać. Konkretne informacje o niektórych postaciach pokazano na poniższym rysunku: 35-letni pacjent Kenneth Morgan ma obecnie ostry nieżyt nosa, nadciśnienie w wywiadzie i szereg objawów, takich jak uporczywe wymioty; Zhao Lei jest doświadczonym radiologiem, a internistka Elise Martin ma doskonałe umiejętności komunikacyjne i specjalizuje się w diagnozowaniu i leczeniu ostrych i przewlekłych chorób medycznych. Te kompletne informacje o postaciach zwiększają realizm symulacji szpitala.
Wprowadzenie do informacji o wirtualnej postaci
W wyżej wspomnianym procesie symulacji medycznej kluczowe jest generowanie chorób. W szczególności bieżące informacje z dokumentacji medycznej są generowane przez duży model językowy w połączeniu z wiedzą medyczną w celu wygenerowania pełnej dokumentacji medycznej pacjenta, w tym rodzaju choroby, objawów, czasu trwania i różnych wyników badań (szczegółowe informacje znajdują się w załączniku do artykułu). Należy zauważyć, że w celu zapewnienia jak największej dokładności całego procesu symulacji, agent pacjenta będzie postrzegał tylko objawy swojej choroby, ale nie konkretną chorobę, podczas gdy agent lekarza może zrozumieć informacje tylko poprzez rozmowę z agentem pacjenta i przepisywanie testów. Badanie, które agent pacjenta musi wykonać, rodzaj choroby i jej nasilenie zostaną wykorzystane jako trzy kluczowe zadania do oceny zdolności agenta medycznego do diagnozowania i leczenia wirtualnych pacjentów.
Większość tradycyjnych metod szkolenia modeli medycznych opiera się na wstępnym szkoleniu, dostrajaniu i innych technologiach, więc muszą być wspierane przez dużą ilość danych medycznych i niektóre wysokiej jakości dane z ręcznymi adnotacjami
.
Zespół badawczy uważa jednak, że proces poprawy zdolności ludzkich lekarzy nie opiera się na tak ogromnych danych i często mogą oni gromadzić doświadczenie z praktyki klinicznej w procesie diagnozy i leczenia, a także będą się doskonalić poprzez czytanie literatury medycznej w celu gromadzenia kluczowej wiedzy. Agenci medyczni w wirtualnych szpitalach powinni być w stanie osiągnąć podobną ewolucję zdolności.
W związku z tym zespół opracował algorytm samorozwoju agenta o nazwie "MedAgent-Zero", który, podobnie jak AlphaGo-Zero, nie opiera się na ręcznych danych adnotacji, ale wykorzystuje uczenie się (tj. czytanie literatury medycznej) i praktykę (tj. interakcję z wirtualnymi pacjentami i podejmowanie decyzji dotyczących diagnozy i leczenia) w wirtualnym szpitalu, aby osiągnąć poprawę zdolności
.
Z drugiej strony, agenci medyczni będą również uczyć się autonomicznie, symulując proces uczenia się dokumentów medycznych w oparciu o pytania medyczne generowane przez LLM.
Schemat przepływu polityki MedAgent-Zero
Jak pokazano na powyższym rysunku, ewolucja MedAgent-Zero obejmuje dwa podejścia: 1) Podsumowywanie doświadczenia z udanych przypadków, w przypadku diagnozy i problemów z leczeniem, na które można odpowiedzieć poprawnie, inteligentny organizm będzie gromadził doświadczenie z bazy danych przypadków, podobnie jak ludzki lekarz; 2) Refleksja nad wnioskami wyciągniętymi z niepowodzeń, podczas odpowiadania na błędy, agent przejmie inicjatywę, aby zastanowić się nad błędami i przemyśleć je. Jeśli wnioski z refleksji pomogą agentowi odpowiedzieć na pytanie, zostaną one zachowane i zapisane w puli doświadczeń.
Ostatecznie zespół badawczy przeprowadzi akumulację i ewolucję powyższych dwóch aspektów w procesie szkolenia na wirtualnych danych. W każdym procesie wnioskowania agent pobiera najbardziej podobne treści z dwóch baz danych i dodaje je do Prompt w celu uczenia się w kontekście, a także gromadzi dokumentację medyczną lub podsumowuje doświadczenie zgodnie z prawidłowymi i nieprawidłowymi odpowiedziami, aby stale poprawiać umiejętności agenta.
W wirtualnym szpitalu zespół badawczy stworzył dokumentację medyczną dziesiątek tysięcy wirtualnych pacjentów na potrzeby eksperymentów autonomicznej ewolucji agentów medycznych, w tym 8 chorób związanych z układem oddechowym, takich jak grypa A, grypa B i nowa korona, obejmujących ponad 10 różnych badań lekarskich. Na podstawie obliczeń, że lekarze leczą około 100 pacjentów tygodniowo, zdiagnozowanie 10 000 pacjentów może zająć dwa lata, ale inteligentnym lekarzom zajmie to tylko kilka dni.
Zespół ocenił zdolność agentów medycznych w wirtualnych szpitalach głównie pod kątem dwóch aspektów
.
Pierwszym z nich jest ocena kompetencji medycznych w środowisku wirtualnym: jak pokazano na poniższym rysunku, w procesie szkolenia agenta medycznego (po lewej), wraz ze wzrostem liczby zdiagnozowanych i leczonych pacjentów, dokładność agenta medycznego w trzech kluczowych zadaniach stale rośnie i stopniowo się stabilizuje. W eksperymencie obejmującym 500 testowych rekordów medycznych stwierdzono (po prawej), że dokładność agenta wahała się nieznacznie wraz ze wzrostem liczby pacjentów, ale wykazywała ogólną tendencję wzrostową.
Dokładność zadania agenta medycznego na zestawie szkoleniowym (po lewej) i zestawie testowym (po prawej)
.
Następnie zespół badawczy porównał dokładność diagnostyczną agentów medycznych dla różnych chorób przed i po ich ewolucji i stwierdził, że wszystkie zostały znacznie poprawione, weryfikując skuteczność ich autonomicznej ewolucji
.
Objawy diagnostyczne różnych chorób przed i po ewolucji agentów
Z drugiej strony, zespół wykorzystał podzbiór chorób układu oddechowego z zewnętrznego zbioru danych MedQA do oceny zdolności agenta medycznego w rzeczywistej medycynie. Co zaskakujące, nawet bez użycia jakichkolwiek sztucznie adnotowanych danych w procesie ewolucji agenta, po leczeniu prawie 10 000 pacjentów, agent medyczny był w stanie przewyższyć obecną najlepszą metodę na zbiorze danych i osiągnąć najwyższy wskaźnik dokładności wynoszący 93,06%, co weryfikuje skuteczność autonomicznej ewolucji agentów medycznych w symulowanym środowisku.
Dokładność różnych metod na podzbiorze MedQA
Ponadto zespół badawczy przeprowadził eksperymentalną weryfikację ablacji, a wyniki pokazały, że zarówno przykłady zgromadzone z sukcesów, jak i wnioski wyciągnięte z niepowodzeń mogą pomóc w ulepszeniu możliwości medycznych modelu.
Wydajność testu ablacji MedAgent-Zero
Podsumowując, w niniejszej pracy badawczej skonstruowano pierwszy scenariusz wirtualnego szpitala, Agent Hospital, i zaproponowano MedAgent-Zero, algorytm ewolucji agenta medycznego, który nie opiera się na sztucznych adnotacjach danych
.
Wyniki eksperymentalne danych wirtualnych i rzeczywistych wstępnie weryfikują skuteczność środowiska symulacyjnego w celu poprawy możliwości agenta medycznego i proponują nowe rozwiązania w zakresie stosowania sztucznej inteligencji, zwłaszcza dużych modeli językowych i technologii agentów w inteligentnych scenariuszach medycznych. Wciąż jednak istnieją pewne ograniczenia w tej pracy badawczej, a w przyszłości zespół będzie nadal ulepszał i optymalizował typy chorób objętych badaniem, skrupulatność środowiska symulacyjnego oraz wybór i optymalizację bazy modeli.
O autorze korespondencyjnym
Ma Weizhi, asystent naukowy w Instytucie Inteligentnego Przemysłu (AIR) Uniwersytetu Tsinghua, został wybrany jako "Young Talent Lifting Project" Chińskiego Stowarzyszenia Nauki i Technologii. Jego zainteresowania badawcze obejmują inteligentne pozyskiwanie informacji i inteligentną opiekę medyczną. Osobista strona domowa: mawz12.github.io.
Liu Yang jest profesorem GDS, dziekanem wykonawczym Instytutu Inteligentnego Przemysłu (AIR), prodziekanem Wydziału Informatyki Uniwersytetu Tsinghua i laureatem Narodowego Funduszu dla Wybitnych Młodych Uczonych. Jego zainteresowania badawcze obejmują sztuczną inteligencję, przetwarzanie języka naturalnego i inteligentną medycynę. Osobista strona domowa: nlp.csai.tsinghua.edu.cn/~ly.