Prawda

Niedziela, 16 czerwca 2024 - 19:18

« Poprzedni Następny »


ChatGPT niemal zdaje lekarski egzamin końcowy


Steven Novella 2023-02-21


Pojawienie się kilku aplikacji sztucznej inteligencji (AI) do użytku publicznego, takich jak Dalle-2, Midjourney i ChatGPT, sprawiło, że sztuczna inteligencja stała się jednym z największych newsów naukowych minionego roku. Sam obszernie o tym pisałem i intensywnie korzystałem z tych aplikacji, aby zorientować się, co mogą, a czego nie mogą zrobić. Możliwości tych systemów zmieniają się jednak szybko.

Ostatnio pisałem o potencjale aplikacji podobnej do ChatGPT jako systemu eksperckiego wspomagającego praktykę lekarską. Już jest aktualizacja warta nowego postu (również ta została opublikowana na SBM). Jeśli chodzi o tło, ChatGPT to duży model językowy, zasadniczo potężny chatbot, który jest w stanie generować odpowiedzi w języku naturalnym, które są spójne w odpowiedziach na słowa użytkownika. Zadaj mu pytanie lub daj mu zadanie, a wypluje całkiem przyzwoitą odpowiedź. Jest szkolony na danych z Internetu do 2021 roku. Aplikacja denerwuje wielu nauczycieli, ponieważ tworzy dobre eseje, przynajmniej na poziomie szkoły średniej. Nie sądzę, aby ostatecznie stanowiło to problem, ale zmusi nauczycieli do ponownego przemyślenia zadań opartych na esejach.

 

Jako wyznacznik rzeczywistego potencjału tych aplikacji AI, Microsoft podobno zainwestował miliardy dolarów w ChatGPT i włącza go do swojej wyszukiwarki Bing. Google odpowiedziało na to swoją własną aplikacją, Bard, która ma wyboisty początek, ale poczekajmy z oceną. Następna wersja ChatGPT, wersja 4, pojawi się wkrótce i obiecuje, że będzie jeszcze potężniejsza i aktualna. Konkluzja – spodziewaj się, że zobaczysz to oprogramowanie wszędzie, w tle naszego doświadczenia komputerowego. W rzeczywistości ChatGPT będzie pisać to oprogramowanie.

 

Zawsze jednak pozostaje pytanie, w jaki sposób społeczeństwo będzie wchodzić w interakcję z nową technologią i jak ludzie będą się z nią czuć. Kiedy już przejdziemy przez etap nowości i nadmiernego entuzjazmu, czy ludzie gremialnie włączą nową technologię do swojego codziennego życia? Smartfon jest prawdopodobnie najlepszym niedawnym przykładem nowej technologii, która szybko zmieniła świat. Segue to kultowy kontrprzykład. Myślę, że odpowiedzią na nowe aplikacje AI jest sposób ich stosowania. Jedna „killer app” i wkrótce nie będziemy pamiętać, jak to się stało, że radziliśmy sobie bez tej technologii. Przewiduję, że aplikacje AI typu ChatGPT będą doskonałymi osobistymi asystentami.

 

To, o czym mówiłem na SBM, to potencjał oprogramowania AI w stylu ChatGPT jako doskonałego systemu eksperckiego dla lekarzy. Tym, co stanowi o świetności tych systemów, jest posiadanie przez nie ogromnej bazy danych informacji na wyciągnięcie (cyfrowej) ręki. Mogą szybko przeszukać te informacje i przedstawić czytelne podsumowanie. Świat medyczny domaga się takiej aplikacji, ponieważ jesteśmy coraz bardziej pogrążeni w nieustannej lawinie nowych badań, standardów praktyki i opcji leczenia. To może i powinno stać się niezbędnym narzędziem dla każdego klinicysty.

 

Najwyraźniej nie jestem jedyną osobą, która wpadła na ten (co prawda oczywisty) pomysł. Uniwersytet Stanforda stworzył PubMedGPT – wersję ChatGPT wyszkoloną wyłącznie w zakresie literatury medycznej. Przynajmniej może to służyć jako doskonała wyszukiwarka – „Pokaż mi wszystkie opublikowane badania w ciągu ostatnich 2 lat dotyczące terapii X choroby Y”. PubMed to nieocenione i niezbędne źródło informacji. Ale jego wyszukiwarka jest nieco niezgrabna. Często łączę to z Google, które ma po prostu lepszą wyszukiwarkę. Przede wszystkim chciałbym, aby PubMed włączył technologię ChatGPT do swojej wyszukiwarki.

 

Aby przetestować model, PubMedGPT przeszedł trzyczęściowe egzaminy USMLE, które lekarze muszą zdać, aby uzyskać licencję [odpowiednik polskiego lekarskiego egzaminu końcowego – LEK, przyp. tłum.]. Wynik egzaminu jest określany w procentach, ale zwykle trzeba poprawnie odpowiedzieć na około 60% pytań (to naprawdę trudny test, więc nie myśl, że to zły wynik). PubMedGPT uzyskał wynik 50,8%, co nie jest wynikiem pozytywnym, ale całkiem niezłym jak na chatbota. Wiele pytań jest subtelnych i skomplikowanych koncepcyjnie, więc jest to imponujący pokaz.

 

Jednak ChatGPT (szkolony w Internecie od 2021 r.) również został przetestowany. W trzech testach uzyskał od 52,4 do 75%, ze średnim wynikiem tuż poniżej progu 60%. Żeby było jasne, nie zdałby wszystkich trzech egzaminów, ale to imponujący wynik. Jest też lepszy niż PubMedGPT, co jest interesujące. Zastanawiam się, jak poradziłaby sobie aplikacja GPT, gdyby była najpierw szkolona w całym Internecie, a następnie w PubMed, dając pierwszeństwo informacjom z PubMed?

 

Powinniśmy myśleć o tym wyniku w taki sam sposób, jak o pierwszym razie, gdy program komputerowy był bliski pokonania światowego mistrza szachowego. Wkrótce te programy szachowe były tak dobre, że żaden ludzki gracz nie mógł się do nich zbliżyć. Podobnie, nie sądzę, że minie dużo czasu (jeśli prace nad tą konkretną aplikacją będą kontynuowane), zanim będziemy mieć medyczne systemy eksperckie GPT, które uzyskają 80% poprawnych wyników, a ostatecznie ponad 90% poprawnych. 

 

ChatGPT zdaje również egzaminy z szkoły prawniczej oraz egzaminy MBA. Ponownie, nie przewyższa najlepszych uczniów, ani nawet przeciętnych uczniów, ale daj mu czas.

 

To wszystko jest dobre. Pokazuje potencjał tego typu zastosowań technologii AI. Z niecierpliwością czekam na dzień, w którym na biurku w mojej klinice pojawi się w komputerach aplikacja MedicalGPT, gotowa do dostarczania aktualnych informacji, które pomogą mi w podejmowaniu decyzji klinicznych. Pomyśl o oszczędnościach w służbie zdrowia. Microsoft inwestuje miliardy dolarów w uzyskanie przewagi w wojnach wyszukiwarek. Możemy zainwestować miliardy dolarów w poprawę opieki zdrowotnej.


ChatGPT Almost Passes Medical Licensure Exams

NeuroLogica Blog, 13 lutego 2023

Tłumaczenie: Małgorzata Koraszewska

 
*Steven Novella 

Neurolog, wykładowca na Yale University School of Medicine. Przewodniczący i współzałożyciel New England Skeptical Society. Twórca popularnych (cotygodniowych) podkastów o nauce The Skeptics’ Guide to the Universe. Jest również dyrektorem Science-Based Medicine będącej częścią James Randi Educational Foundation (JREF), członek Committee for Skeptical Inquiry (CSI) oraz członek założyciel Institute for Science in Medicine. Prowadzi blog Neurologica.


Skomentuj Tipsa en vn Wydrukuj






Nauka

Znalezionych 1479 artykuły.

Tytuł   Autor   Opublikowany

Mózgi noworodków   Novella   2020-03-16
Twierdzenie o białku i DNA dinozaurów   Novella   2020-03-10
Porażka jest stałym elementem pracy naukowca   Konrad Bocian   2020-03-07
Jak myśleć o naszych problemach   Tupy   2020-03-03
Dlaczego tak wiele nowych wirusów pochodzi od nietoperzy?   Ridley   2020-02-29
Odkrycie antybiotyku przez AI   Novella   2020-02-27
Wizyta w Andach u łysek rogatych   Lyon   2020-02-26
Zioła nie pomagają na utratę wagi   Novella   2020-02-25
Dawkins pisze tweeta   Coyne   2020-02-24
W obronie binarności płci u ludzi   Coyne   2020-02-21
Nie palmy pieniędzy na ołtarzu zielonej manii   Lomborg   2020-02-20
Więcej dowodów ewolucji: końskie zarodki zaczynają tworzyć pięć palców, a cztery zawiązki znikają   Coyne   2020-02-18
Homeopatyczny rentgen   Novella   2020-02-14
Różnice płci w wyborze zabawek: chłopcy bawią się chłopięcymi zabawkami, dziewczynki dziewczęcymi zabawkami   Coyne   2020-02-13
Śmiertelność z powodu raka nadal spada wbrew twierdzeniom szarlatanów     2020-02-11
Odkrycie w immunologii, a leczenie nowotworów   Novella   2020-02-10
Ponowne psucie nauki przez ideologię: ”Slate” wypacza biologię ewolucyjną, by wyglądała na kapitalistyczną i antysocjalistyczną   Coyne   2020-02-07
Flamingi z braku łysek rogatych   Lyon   2020-02-06
Moja ostatnia praca badawcza. Część 3: Znaczenie   Coyne   2020-02-04
Moja ostatnia praca badawcza. Część 2: Wyniki   Coyne   2020-02-03
Moja ostatnia praca badawcza: Część 1: Cele i metody   Coyne   2020-02-01
Ewolucyjne wyjaśnienie nienaukowych przekonań   Bretl   2020-01-31
Zdumiewająca mimikra   Coyne   2020-01-27
Reality check: Pęd do szybkiej „zerowej” emisji to gwarancja przegranej   Lomborg   2020-01-27
Sfuszerowany artykuł o biologii w „Washington Post”   Coyne   2020-01-24
Punkty dla Ameryki w konflikcie między Iranem i USA   Destexhe   2020-01-24
Zbliżanie się do rozumienia pamięci   Novella   2020-01-22
Z perspektywy naszego kurnika   Witkowski   2020-01-16
Fałszywa pokora nie uratuje planety   Boudry   2020-01-09
Złoty ryż zatwierdzony na Filipinach   Novella   2020-01-07
Cudowna animacja DNA i komórek   Coyne   2020-01-06
Dychotomiczne myślenie, niepewność i zaprzeczanie nauce     2020-01-01
Mieliśmy najlepszą dekadę w historii. Naprawdę   Ridley   2019-12-31
Kreacjonista opowiada się za ”argumentem z niedowierzania”   Coyne   2019-12-26
Biologia męskiej agresji i dlaczego nie jest to tylko „socjalizacja”   Coyne   2019-12-24
Wydajność, wyzysk, wybory   Koraszewski   2019-12-23
Społecznościowe finansowanie szarlatanerii   Novella   2019-12-20
Wykład Dawkinsa o czerpaniu odwagi z darwinizmu   Coyne   2019-12-18
Uprawy GM, takie jak Złoty Ryż, uratują życie setek tysięcy dzieci   Ridey   2019-12-13
Darwin, lisy i inne ssaki na Falklandach   Mayer   2019-12-11
Wirtualna edukacja   Novella   2019-12-03
Teoria klasy próżniaczej Thorsteina Veblena – uaktualnienie statusu   Henderson   2019-12-02
Punkt szczytowy inteligencji   Novella   2019-11-30
Likwidowanie przeziębienia miedzią   Novella   2019-11-27
Dlaczego wyjaśnianie problemów przez biały przywilej jest niesłuszne   Rob Henderson   2019-11-25
LiveScience zachwala panpsychizm jako rozwiązanie trudnego problemu świadomości   Coyne   2019-11-22
Jak walczyć z firehosing   Novella   2019-11-19
Odwołajcie antyszczepionkową konferencję w Tel Awiwie   Blum   2019-11-15
Ewolucja dwunożności   Novella   2019-11-14
Granice „przeskoczenia” progu opłacalności   Lomborg   2019-11-13
Dlaczego nie żyjemy w epoce post-prawdy   Pinker   2019-11-11
Śledząc pochodzenie człowieka   Novella   2019-11-09
Skamieniałe trylobity idące gęsiego. Ale dlaczego to zrobiły?   Coyne   2019-11-06
Saga o złotym ryżu   Novella   2019-11-04
Kolejne badanie rolnictwa organicznego   Novella   2019-11-02
Fabrizio Benedetti pyta: “Czy badania placebo wzmacniają pseudonaukę?”     2019-11-01
Nathaniel Comfort raz jeszcze: nauka nie czyni postępów (czy może robi to?)   Coyne   2019-10-31
Pochwała jednoznaczności   Witkowski   2019-10-29
Stare i nowe  troski o bezpieczeństwo żywnościowe   Ongu   2019-10-28
Powrót Adama i Ewy jako rzeczywistych ludzi, jak proponuje kolejna pseudonaukowa teoria   Coyne   2019-10-25
Pradawne przechowywanie żywności   Novella   2019-10-24
Artykuł w naukowym piśmie ”Nature” dyskredytuje naukę i „scjentyzm”, kwestionuje wartości Oświecenia   Coyne   2019-10-22
Błogosławieni ci, którzy wycofują   Jacoby   2019-10-19
Pro-life czyli czarodziej z Krotoszyna   Koraszewski   2019-10-18
Biologia rozwoju ujawnia ewolucyjną historię   Novella   2019-10-15
Niebezpieczne życie antropologa   Blackwell   2019-10-12
Swędzikami jesień się zaczyna   Łopatniuk   2019-10-11
Jak wieloryb stracił swoje geny   Coyne   2019-10-10
Używanie sztucznej inteligencji do diagnozy   Novella   2019-10-08
Niespodzianka! Koty są tak samo przywiązane do swojego personelu jak psy i niemowlęta   Coyne   2019-10-05
Oburzenie, stronniczość i niestabilność prawdy   Novella   2019-10-04
O zmianie klimatu: ludzkość nie jest „nikczemna”   Lomborg   2019-10-03
Postmodernizm wyjaśniony i krytykowany   Coyne   2019-09-30
Uzdrawianie kryształami   Novella   2019-09-26
Kolejna rewolucja w rolnictwie   Novella   2019-09-24
Opory przeciwko szczelinowaniu są oparte na ideologii, a nie na nauce   Jacoby   2019-09-23
St Paul Island część 5   Lyon   2019-09-21
Co to jest czerwona rtęć?   Novella   2019-09-20
Jaka sztuka siedzi w naszych genach i czy to aby nie kicz?   Koraszewski   2019-09-19
Fałszywe wspomnienia i Fake News   Novella   2019-09-18
Kolejna próba odrzucenia teorii Darwina   Coyne   2019-09-17
Choroba zielonych mięśni   Łopatniuk   2019-09-14
”Sygnalizowanie cnoty” może nas irytować. Cywilizacja byłaby jednak bez niego niemożliwa    Miller   2019-09-13
Foka Weddela wygryza w lodzie otwory do oddychania   Coyne   2019-09-12
DNA i Loch Ness   Novella   2019-09-11
Nowa i ważna czaszka hominina z Etiopii   Coyne   2019-09-10
St Paul Island, Część 4   Lyon   2019-09-06
Biały jak śnieg, żółciutki jak kaczuszka   Łopatniuk   2019-09-04
Pingwiny geje? Nie tak szybko   Coyne   2019-09-03
Czego może nas nauczyć była zwolenniczka antyszczepionkowców, Kelley Watson-Snyder     2019-08-30
Bezzbożowa karma dla psa   Novella   2019-08-29
Odrażające życie płciowe pingwinów białookich   Coyne   2019-08-28
Badanie akupunktury jako terapii na dławicę piersiową   Novella   2019-08-23
Pradawna gigantyczna papuga z Nowej Zelandii: metr wysokości i waga 7 kilogramów!   Coyne   2019-08-22
Alaska — nurniczki i obopólny dobór płciowy   Lyon   2019-08-20
Zła nauka promuje organiczne jabłka   Novella   2019-08-19
Gąsienica zmienia kolor, żeby dopasować się do podłoża nie używając oczu: potrafi widzieć skórą!   Coyne   2019-08-16
Pseudonaukowa histeria to nie jest dobra odpowiedź na klimatyczne wyzwania   Lomborg   2019-08-14
GMO i model deficytu wiedzy   Novella   2019-08-12
Po raz pierwszy użyto edytowania genów CRISPR do leczenia zaburzenia genetycznego – anemii sierpowatej   Coyne   2019-08-08

« Poprzednia strona  Następna strona »
Polecane
artykuły

Chłopiec w kefiji


Czerwone skarby


Gdy­by nie Ży­dzi


Lekarze bez Granic


Wojna w Ukrainie


Krytycy Izraela


Walka z malarią


Przedwyborcza kampania


Nowy ateizm


Rzeczywiste łamanie


Jest lepiej


Aburd


Rasy - konstrukt


Zielone energie


Zmiana klimatu


Pogrzebać złudzenia Oslo


Kilka poważnych...


Przeciwko autentyczności


Nowy ateizm


Lomborg


„Choroba” przywrócona przez Putina


„Przebudzeni”


Pod sztandarem


Wielki przekret


Łamanie praw człowieka


Jason Hill


Dlaczego BIden


Korzenie kryzysu energetycznego



Obietnica



Pytanie bez odpowiedzi



Bohaterzy chińskiego narodu



Naukowcy Unii Europejskiej



Teoria Rasy



Przekupieni



Heretycki impuls


Listy z naszego sadu
Redaktor naczelny:   Hili
Webmaster:   Andrzej Koraszewski
Współpracownicy:   Jacek, , Małgorzata, Andrzej, Henryk