Pojawienie się kilku aplikacji sztucznej inteligencji (AI) do użytku publicznego, takich jak Dalle-2, Midjourney i ChatGPT, sprawiło, że sztuczna inteligencja stała się jednym z największych newsów naukowych minionego roku. Sam obszernie o tym pisałem i intensywnie korzystałem z tych aplikacji, aby zorientować się, co mogą, a czego nie mogą zrobić. Możliwości tych systemów zmieniają się jednak szybko.

Ostatnio pisałem o potencjale aplikacji podobnej do ChatGPT jako systemu eksperckiego wspomagającego praktykę lekarską. Już jest aktualizacja warta nowego postu (również ta została opublikowana na SBM). Jeśli chodzi o tło, ChatGPT to duży model językowy, zasadniczo potężny chatbot, który jest w stanie generować odpowiedzi w języku naturalnym, które są spójne w odpowiedziach na słowa użytkownika. Zadaj mu pytanie lub daj mu zadanie, a wypluje całkiem przyzwoitą odpowiedź. Jest szkolony na danych z Internetu do 2021 roku. Aplikacja denerwuje wielu nauczycieli, ponieważ tworzy dobre eseje, przynajmniej na poziomie szkoły średniej. Nie sądzę, aby ostatecznie stanowiło to problem, ale zmusi nauczycieli do ponownego przemyślenia zadań opartych na esejach.

Jako wyznacznik rzeczywistego potencjału tych aplikacji AI, Microsoft podobno zainwestował miliardy dolarów w ChatGPT i włącza go do swojej wyszukiwarki Bing. Google odpowiedziało na to swoją własną aplikacją, Bard, która ma wyboisty początek, ale poczekajmy z oceną. Następna wersja ChatGPT, wersja 4, pojawi się wkrótce i obiecuje, że będzie jeszcze potężniejsza i aktualna. Konkluzja – spodziewaj się, że zobaczysz to oprogramowanie wszędzie, w tle naszego doświadczenia komputerowego. W rzeczywistości ChatGPT będzie pisać to oprogramowanie.

Zawsze jednak pozostaje pytanie, w jaki sposób społeczeństwo będzie wchodzić w interakcję z nową technologią i jak ludzie będą się z nią czuć. Kiedy już przejdziemy przez etap nowości i nadmiernego entuzjazmu, czy ludzie gremialnie włączą nową technologię do swojego codziennego życia? Smartfon jest prawdopodobnie najlepszym niedawnym przykładem nowej technologii, która szybko zmieniła świat. Segue to kultowy kontrprzykład. Myślę, że odpowiedzią na nowe aplikacje AI jest sposób ich stosowania. Jedna „killer app” i wkrótce nie będziemy pamiętać, jak to się stało, że radziliśmy sobie bez tej technologii. Przewiduję, że aplikacje AI typu ChatGPT będą doskonałymi osobistymi asystentami.

To, o czym mówiłem na SBM, to potencjał oprogramowania AI w stylu ChatGPT jako doskonałego systemu eksperckiego dla lekarzy. Tym, co stanowi o świetności tych systemów, jest posiadanie przez nie ogromnej bazy danych informacji na wyciągnięcie (cyfrowej) ręki. Mogą szybko przeszukać te informacje i przedstawić czytelne podsumowanie. Świat medyczny domaga się takiej aplikacji, ponieważ jesteśmy coraz bardziej pogrążeni w nieustannej lawinie nowych badań, standardów praktyki i opcji leczenia. To może i powinno stać się niezbędnym narzędziem dla każdego klinicysty.

Najwyraźniej nie jestem jedyną osobą, która wpadła na ten (co prawda oczywisty) pomysł. Uniwersytet Stanforda stworzył PubMedGPT – wersję ChatGPT wyszkoloną wyłącznie w zakresie literatury medycznej. Przynajmniej może to służyć jako doskonała wyszukiwarka – „Pokaż mi wszystkie opublikowane badania w ciągu ostatnich 2 lat dotyczące terapii X choroby Y”. PubMed to nieocenione i niezbędne źródło informacji. Ale jego wyszukiwarka jest nieco niezgrabna. Często łączę to z Google, które ma po prostu lepszą wyszukiwarkę. Przede wszystkim chciałbym, aby PubMed włączył technologię ChatGPT do swojej wyszukiwarki.

Aby przetestować model, PubMedGPT przeszedł trzyczęściowe egzaminy USMLE, które lekarze muszą zdać, aby uzyskać licencję [odpowiednik polskiego lekarskiego egzaminu końcowego – LEK, przyp. tłum.]. Wynik egzaminu jest określany w procentach, ale zwykle trzeba poprawnie odpowiedzieć na około 60% pytań (to naprawdę trudny test, więc nie myśl, że to zły wynik). PubMedGPT uzyskał wynik 50,8%, co nie jest wynikiem pozytywnym, ale całkiem niezłym jak na chatbota. Wiele pytań jest subtelnych i skomplikowanych koncepcyjnie, więc jest to imponujący pokaz.

Jednak ChatGPT (szkolony w Internecie od 2021 r.) również został przetestowany. W trzech testach uzyskał od 52,4 do 75%, ze średnim wynikiem tuż poniżej progu 60%. Żeby było jasne, nie zdałby wszystkich trzech egzaminów, ale to imponujący wynik. Jest też lepszy niż PubMedGPT, co jest interesujące. Zastanawiam się, jak poradziłaby sobie aplikacja GPT, gdyby była najpierw szkolona w całym Internecie, a następnie w PubMed, dając pierwszeństwo informacjom z PubMed?

Powinniśmy myśleć o tym wyniku w taki sam sposób, jak o pierwszym razie, gdy program komputerowy był bliski pokonania światowego mistrza szachowego. Wkrótce te programy szachowe były tak dobre, że żaden ludzki gracz nie mógł się do nich zbliżyć. Podobnie, nie sądzę, że minie dużo czasu (jeśli prace nad tą konkretną aplikacją będą kontynuowane), zanim będziemy mieć medyczne systemy eksperckie GPT, które uzyskają 80% poprawnych wyników, a ostatecznie ponad 90% poprawnych.

ChatGPT zdaje również egzaminy z szkoły prawniczej oraz egzaminy MBA. Ponownie, nie przewyższa najlepszych uczniów, ani nawet przeciętnych uczniów, ale daj mu czas.

To wszystko jest dobre. Pokazuje potencjał tego typu zastosowań technologii AI. Z niecierpliwością czekam na dzień, w którym na biurku w mojej klinice pojawi się w komputerach aplikacja MedicalGPT, gotowa do dostarczania aktualnych informacji, które pomogą mi w podejmowaniu decyzji klinicznych. Pomyśl o oszczędnościach w służbie zdrowia. Microsoft inwestuje miliardy dolarów w uzyskanie przewagi w wojnach wyszukiwarek. Możemy zainwestować miliardy dolarów w poprawę opieki zdrowotnej.

ChatGPT Almost Passes Medical Licensure Exams

NeuroLogica Blog, 13 lutego 2023

Tłumaczenie: Małgorzata Koraszewska

*Steven Novella

Neurolog, wykładowca na Yale University School of Medicine. Przewodniczący i współzałożyciel New England Skeptical Society. Twórca popularnych (cotygodniowych) podkastów o nauce The Skeptics’ Guide to the Universe. Jest również dyrektorem Science-Based Medicine będącej częścią James Randi Educational Foundation (JREF), członek Committee for Skeptical Inquiry (CSI) oraz członek założyciel Institute for Science in Medicine. Prowadzi blog Neurologica.

Skomentuj Tipsa en vn Wydrukuj

Nauka

Znalezionych 1479 artykuły.

Tytuł	Autor	Opublikowany

Mózgi noworodków	Novella	2020-03-16
Twierdzenie o białku i DNA dinozaurów	Novella	2020-03-10
Porażka jest stałym elementem pracy naukowca	Konrad Bocian	2020-03-07
Jak myśleć o naszych problemach	Tupy	2020-03-03
Dlaczego tak wiele nowych wirusów pochodzi od nietoperzy?	Ridley	2020-02-29
Odkrycie antybiotyku przez AI	Novella	2020-02-27
Wizyta w Andach u łysek rogatych	Lyon	2020-02-26
Zioła nie pomagają na utratę wagi	Novella	2020-02-25
Dawkins pisze tweeta	Coyne	2020-02-24
W obronie binarności płci u ludzi	Coyne	2020-02-21
Nie palmy pieniędzy na ołtarzu zielonej manii	Lomborg	2020-02-20
Więcej dowodów ewolucji: końskie zarodki zaczynają tworzyć pięć palców, a cztery zawiązki znikają	Coyne	2020-02-18
Homeopatyczny rentgen	Novella	2020-02-14
Różnice płci w wyborze zabawek: chłopcy bawią się chłopięcymi zabawkami, dziewczynki dziewczęcymi zabawkami	Coyne	2020-02-13
Śmiertelność z powodu raka nadal spada wbrew twierdzeniom szarlatanów		2020-02-11
Odkrycie w immunologii, a leczenie nowotworów	Novella	2020-02-10
Ponowne psucie nauki przez ideologię: ”Slate” wypacza biologię ewolucyjną, by wyglądała na kapitalistyczną i antysocjalistyczną	Coyne	2020-02-07
Flamingi z braku łysek rogatych	Lyon	2020-02-06
Moja ostatnia praca badawcza. Część 3: Znaczenie	Coyne	2020-02-04
Moja ostatnia praca badawcza. Część 2: Wyniki	Coyne	2020-02-03
Moja ostatnia praca badawcza: Część 1: Cele i metody	Coyne	2020-02-01
Ewolucyjne wyjaśnienie nienaukowych przekonań	Bretl	2020-01-31
Zdumiewająca mimikra	Coyne	2020-01-27
Reality check: Pęd do szybkiej „zerowej” emisji to gwarancja przegranej	Lomborg	2020-01-27
Sfuszerowany artykuł o biologii w „Washington Post”	Coyne	2020-01-24
Punkty dla Ameryki w konflikcie między Iranem i USA	Destexhe	2020-01-24
Zbliżanie się do rozumienia pamięci	Novella	2020-01-22
Z perspektywy naszego kurnika	Witkowski	2020-01-16
Fałszywa pokora nie uratuje planety	Boudry	2020-01-09
Złoty ryż zatwierdzony na Filipinach	Novella	2020-01-07
Cudowna animacja DNA i komórek	Coyne	2020-01-06
Dychotomiczne myślenie, niepewność i zaprzeczanie nauce		2020-01-01
Mieliśmy najlepszą dekadę w historii. Naprawdę	Ridley	2019-12-31
Kreacjonista opowiada się za ”argumentem z niedowierzania”	Coyne	2019-12-26
Biologia męskiej agresji i dlaczego nie jest to tylko „socjalizacja”	Coyne	2019-12-24
Wydajność, wyzysk, wybory	Koraszewski	2019-12-23
Społecznościowe finansowanie szarlatanerii	Novella	2019-12-20
Wykład Dawkinsa o czerpaniu odwagi z darwinizmu	Coyne	2019-12-18
Uprawy GM, takie jak Złoty Ryż, uratują życie setek tysięcy dzieci	Ridey	2019-12-13
Darwin, lisy i inne ssaki na Falklandach	Mayer	2019-12-11
Wirtualna edukacja	Novella	2019-12-03
Teoria klasy próżniaczej Thorsteina Veblena – uaktualnienie statusu	Henderson	2019-12-02
Punkt szczytowy inteligencji	Novella	2019-11-30
Likwidowanie przeziębienia miedzią	Novella	2019-11-27
Dlaczego wyjaśnianie problemów przez biały przywilej jest niesłuszne	Rob Henderson	2019-11-25
LiveScience zachwala panpsychizm jako rozwiązanie trudnego problemu świadomości	Coyne	2019-11-22
Jak walczyć z firehosing	Novella	2019-11-19
Odwołajcie antyszczepionkową konferencję w Tel Awiwie	Blum	2019-11-15
Ewolucja dwunożności	Novella	2019-11-14
Granice „przeskoczenia” progu opłacalności	Lomborg	2019-11-13
Dlaczego nie żyjemy w epoce post-prawdy	Pinker	2019-11-11
Śledząc pochodzenie człowieka	Novella	2019-11-09
Skamieniałe trylobity idące gęsiego. Ale dlaczego to zrobiły?	Coyne	2019-11-06
Saga o złotym ryżu	Novella	2019-11-04
Kolejne badanie rolnictwa organicznego	Novella	2019-11-02
Fabrizio Benedetti pyta: “Czy badania placebo wzmacniają pseudonaukę?”		2019-11-01
Nathaniel Comfort raz jeszcze: nauka nie czyni postępów (czy może robi to?)	Coyne	2019-10-31
Pochwała jednoznaczności	Witkowski	2019-10-29
Stare i nowe troski o bezpieczeństwo żywnościowe	Ongu	2019-10-28
Powrót Adama i Ewy jako rzeczywistych ludzi, jak proponuje kolejna pseudonaukowa teoria	Coyne	2019-10-25
Pradawne przechowywanie żywności	Novella	2019-10-24
Artykuł w naukowym piśmie ”Nature” dyskredytuje naukę i „scjentyzm”, kwestionuje wartości Oświecenia	Coyne	2019-10-22
Błogosławieni ci, którzy wycofują	Jacoby	2019-10-19
Pro-life czyli czarodziej z Krotoszyna	Koraszewski	2019-10-18
Biologia rozwoju ujawnia ewolucyjną historię	Novella	2019-10-15
Niebezpieczne życie antropologa	Blackwell	2019-10-12
Swędzikami jesień się zaczyna	Łopatniuk	2019-10-11
Jak wieloryb stracił swoje geny	Coyne	2019-10-10
Używanie sztucznej inteligencji do diagnozy	Novella	2019-10-08
Niespodzianka! Koty są tak samo przywiązane do swojego personelu jak psy i niemowlęta	Coyne	2019-10-05
Oburzenie, stronniczość i niestabilność prawdy	Novella	2019-10-04
O zmianie klimatu: ludzkość nie jest „nikczemna”	Lomborg	2019-10-03
Postmodernizm wyjaśniony i krytykowany	Coyne	2019-09-30
Uzdrawianie kryształami	Novella	2019-09-26
Kolejna rewolucja w rolnictwie	Novella	2019-09-24
Opory przeciwko szczelinowaniu są oparte na ideologii, a nie na nauce	Jacoby	2019-09-23
St Paul Island część 5	Lyon	2019-09-21
Co to jest czerwona rtęć?	Novella	2019-09-20
Jaka sztuka siedzi w naszych genach i czy to aby nie kicz?	Koraszewski	2019-09-19
Fałszywe wspomnienia i Fake News	Novella	2019-09-18
Kolejna próba odrzucenia teorii Darwina	Coyne	2019-09-17
Choroba zielonych mięśni	Łopatniuk	2019-09-14
”Sygnalizowanie cnoty” może nas irytować. Cywilizacja byłaby jednak bez niego niemożliwa	Miller	2019-09-13
Foka Weddela wygryza w lodzie otwory do oddychania	Coyne	2019-09-12
DNA i Loch Ness	Novella	2019-09-11
Nowa i ważna czaszka hominina z Etiopii	Coyne	2019-09-10
St Paul Island, Część 4	Lyon	2019-09-06
Biały jak śnieg, żółciutki jak kaczuszka	Łopatniuk	2019-09-04
Pingwiny geje? Nie tak szybko	Coyne	2019-09-03
Czego może nas nauczyć była zwolenniczka antyszczepionkowców, Kelley Watson-Snyder		2019-08-30
Bezzbożowa karma dla psa	Novella	2019-08-29
Odrażające życie płciowe pingwinów białookich	Coyne	2019-08-28
Badanie akupunktury jako terapii na dławicę piersiową	Novella	2019-08-23
Pradawna gigantyczna papuga z Nowej Zelandii: metr wysokości i waga 7 kilogramów!	Coyne	2019-08-22
Alaska — nurniczki i obopólny dobór płciowy	Lyon	2019-08-20
Zła nauka promuje organiczne jabłka	Novella	2019-08-19
Gąsienica zmienia kolor, żeby dopasować się do podłoża nie używając oczu: potrafi widzieć skórą!	Coyne	2019-08-16
Pseudonaukowa histeria to nie jest dobra odpowiedź na klimatyczne wyzwania	Lomborg	2019-08-14
GMO i model deficytu wiedzy	Novella	2019-08-12
Po raz pierwszy użyto edytowania genów CRISPR do leczenia zaburzenia genetycznego – anemii sierpowatej	Coyne	2019-08-08

« Poprzednia strona Następna strona »