Przychodzi Microsoft do lekarza i mówi: nasze AI diagnozuje pacjentów lepiej

5 dni temu 13
Reklama 3 tysiące złotych na miesiąc.

Trudno mieć jednoznaczna opinię o sztucznej inteligencji. Z jednej strony słyszymy o przypadkach nieudolnego AI mylącego się w 70% przypadków. Z drugiej strony sztuczna inteligencja potrafi przewidzieć datę śmierci i motywować do zmiany stylu życia. Trudno znaleźć jedną, sensowną wizję dotyczącą roli AI w społeczeństwie, bo nowe rozwiązania oddziałują inaczej na rozmaite dziedziny życia. Z pewnością sporo nadziei dotyczy najbardziej przyziemnych zagadnień, jak te dotyczące naszego zdrowia.

W internecie nie brakuje osób, które przyznają się do czatowania z Chatem GPT i innymi narzędziami w celu uzyskania porad zdrowotnych, a szczególny poklask konwersacyjne modele językowe zyskują poprzez udzielanie wsparcia psychologicznego. Z jednej strony nie jest to dobra droga, z drugiej nie brakuje osób, które zapowiadają, że AI zabierze pracę pracownikom umysłowym. I choć wydaje się, że lekarze z natury rzeczy powinni być bezpieczni, tak Microsoft pokazuje, że i oni nie muszą do końca czuć się niezastąpieni.

Jak sztuczna inteligencja pokonała lekarzy w diagnozowaniu dolegliwości?

Wyobraźcie sobie, że przychodzicie do lekarza, a ten jest połączeniem między innymi Groka, GPT, Gemini, Llamy i Gemini, czyli popularnych modeli językowych. Być może korzystanie przez lekarzy z asystentów nie jest zupełną nowością, ale dopiero teraz Microsoft postanowił przetestować takie rozwiązanie w ramach jednego narzędzia o nazwie Microsoft AI Diagnostic Orchestrator (MAI-DxO). Do tego celu wykorzystano 304 zapisy przypadków medycznych z The New England Journal of Medicine.

MIcrosoft MAI-DxOMAI-DxO radzi sobie z wieloma zadaniami, jakie stoją przed lekarzami

Narzędzie od Microsoftu miało za zadanie zdiagnozować po objawach i elementach wywiadu medycznego, z jakimi dolegliwościami mogą borykać się pacjenci. Nie było to jednak byle jakie narzędzie – przeszło ono z niemal perfekcyjnym wynikiem przez egzamin licencyjny USMLE. To jednak test wiedzy. Sztuczna inteligencja rozpracowała badanie ludzi dzięki diagnozie sekwencyjnej. Z każdym kolejnym pytaniem model efektywniej od ludzi zawęża obszar badawczy i doprowadza do diagnozy.

O ile efektywniej? W bezpośrednim porównaniu MAI-DxO osiągał prawidłowy rezultat w nawet 85% przypadków pochodzących z czasopisma The New England Journal of Medicine. Ten wynik potrafił się różnić o kilka punktów procentowych, ale najczęściej oznaczał, że rozwiązanie Microsoftu było 4-kronie lepsze od specjalistów. Ci prawidłowo diagnozowali przypadki jedynie w około 20% sytuacji. Do tego MAI-DxO potrafił przejść do prawidłowych konkluzji z wykorzystaniem tańszych badań i w szybszy sposób.

AI nadal trudno zaufać, ale może okazać się prawdziwie przydatne

Microsoft dokonał porównania diagnoz wywnioskowanych przez pojedyncze modele, jak i przez własne rozwiązanie w różnych progach cenowych. Zagregowana wiedza wielu modelu w narzędziu MAI-DxO pozwalała na osiągnięcie lepszego rezultatu dla skondensowanych rozwiązań, choć przy większym budżecie i pojedyncze modele, jak o3 od OpenAI potrafiły spisywać się dobrze.

Wykres skuteczności poszczególnych modeli w danym budżecie

Oczywiście im więcej pieniędzy wydamy, tym rezultat jest lepszy, a znaczenie ma także udostępnienie większej ilości czasu na odpowiedzi. Według Microsoftu AI może obniżyć koszty funkcjonowania placówek leczniczych i zwiększyć efektywność pracy. Firma szacuje, że w przypadku amerykańskiego systemu ochrony zdrowia, który kosztuje niemal 20% PKB Stanów Zjednoczonych Ameryki, 1/4 tych pieniędzy marnuje się przez niewielki wpływ na rezultat leczenia.

Ponad 50 milionów zapytań w wyszukiwarce Bing i Copilot dotyczy tematów zdrowotnych. Z pewnością ta liczba jest jeszcze większa dla wyszukiwarki Google. Celem Microsoftu jest stworzenie medycznej superinteligencji, a Mustafa Suleyman, CEO dywizji odpowiedzialnej za rozwój sztucznej inteligencji, wierzy, że narzędzi MAI-DxO to pierwszy krok, bo firma rozwija między innymi RAD-DINO, przyspieszający procesy w radiologii oraz Microsoft Dragon Copilot, czyli asystent oparty na głosie dla lekarzy klinicznych.

Przeczytaj źródło