Wyobraź sobie, że przez sześć tygodni przechodzisz terapię onkologiczną opartą na planie, który stworzono pierwszego dnia. Plan ten nie uwzględnia, że twoje ciało dynamicznie się zmienia – nowotwór może się kurczyć, a organy przemieszczać.
Brzmi jak archaiczne podejście? Dla Mikołaja Stryji, inżyniera i doktoranta na TU Delft, to codzienność systemów opieki zdrowotnej.
W najnowszym odcinku 99 Twarzy rozmawiamy o tym, dlaczego technologia, która mogłaby personalizować leczenie w czasie rzeczywistym, pozostaje melodią przyszłości , a największą barierą nie jest brak algorytmów, lecz brak infrastruktury, pieniędzy i odpowiedniego modelu biznesowego.
Statyczny plan na dynamiczną chorobę
Jednym z najbardziej obrazowych problemów, jakie Mikołaj Stryja porusza w rozmowie, jest fundamentalna wada obecnego standardu radioterapii. Leczenie, które potrafi trwać nawet sześć tygodni, opiera się na planie stworzonym na podstawie jednego skanu wykonanego na samym początku. To tak, jakby nawigować przez dynamicznie zmieniające się miasto, używając mapy sprzed kilku tygodni. Jak mówi Mikołaj, takie podejście jest dalekie od optymalnego.
Rozwiązaniem jest tzw. radioterapia adaptacyjna online, gdzie plan leczenia jest aktualizowany na bieżąco, niemal przed każdą sesją terapeutyczną. Technologia AI, która mogłaby to zautomatyzować, już istnieje, ale jej wdrożenie blokują bariery systemowe, finansowe i infrastrukturalne.
„Myślę, że możemy sobie sami odpowiedzieć na pytanie, że przez 6 tygodni ciało człowieka, który wie, że ma nowotwór, może się dość drastycznie zmienić. Dostarczanie cały czas tego samego planu jest bardzo konserwatywnym podejściem”.
Problem, który nie jest technologią
Choć dysponujemy coraz doskonalszymi algorytmami, prawdziwe bariery we wdrażaniu AI w medycynie leżą gdzie indziej. Mikołaj bez ogródek wskazuje na niedofinansowanie infrastruktury cyfrowej w szpitalach oraz problem z modelem biznesowym. W Europie, w przeciwieństwie do USA, rozdrobnione i publiczne systemy opieki zdrowotnej nie tworzą presji na optymalizację kosztów, która napędzałaby inwestycje.
„W branży medycznej jest bardzo trudno o dobry model biznesowy. […] zasadnicze pytanie jest takie, kto będzie za to płacił? Bo szpitale na dzień dzisiejszy nie stać na nic”.
To prowadzi do sytuacji, w której najbardziej utalentowani inżynierowie wybierają pracę nad lepiej finansowanymi modelami językowymi, a medycyna, mimo swojej ogromnej wagi, zmaga się z „długiem technologicznym”. Zdaniem Mikołaja, szansą dla Polski jest skupienie się na tworzeniu niszowych, specjalistycznych modeli, które rozwiązują realne problemy, zamiast konkurować na przesyconym rynku gotowych narzędzi.
Posłuchajcie sami! Na koniec kilka pytań:
- W jaki sposób zarządzasz swoją dokumentacją medyczną? Czy wizja „Google Drive dla medycyny”, o której mówi Mikołaj, rozwiązałaby Twoje problemy z dostępem do historii leczenia?
- Czy zgadzasz się z tezą, że Polska powinna inwestować w tworzenie własnych, fundamentalnych technologii AI, zamiast skupiać się na integracji gotowych rozwiązań? Gdzie widzisz największy potencjał?
- Radioterapia adaptacyjna to przykład technologii, która istnieje, ale jest blokowana przez system. Jak myślisz, co musiałoby się zmienić w systemie opieki zdrowotnej, aby takie innowacje mogły być wdrażane szybciej?
Napiszcie maila karol@99twarzyAI.pl – do napisania i usłyszenia!
—
Masz chwilę? Jeśli podoba Ci się 99 Twarzy AI, zostaw ocenę i recenzję – dzięki temu możemy docierać do jeszcze większej liczby słuchaczy!
Dobrego dnia i niech #AI będzie z Wami wszystkimi!
Transkrypcja rozmowy
Disclaimer. Droga Czytelniczko, Drogi Czytelniku – mała uwaga dotycząca transkrypcji rozmowy. Jak się pewnie domyślasz – transkrypcja została przygotowana z wykorzystaniem magii LLM. Proszę o wyrozumiałość, gdyby pojawiły się w niej niewielkie błędy, literówki, etc. Żeby mieć pewność co do wszystkich wypowiedzi – polecam posłuchać, zamiast czytać. Ukłony.
Karol
Mikołaju, witam cię serdecznie. 99 twarzy AI. Kolejna twarz i tutaj uwaga, znajome nazwisko, Mikołaj Stryja.
Mikołaj
Tak, tak wyszło.
Karol
Dla naszych słuchaczy informacja: okazało się, że mamy to samo, rzadkie nazwisko, ale rodziną chyba nie jesteśmy.
Mikołaj
Chyba nie, chociaż nie wiadomo.
Karol
Nie wiadomo. Trzeba byłoby, tak jak się śmialiśmy, drzewo genealogiczne sprawdzić. Mikołaju, powiedz, kim jesteś, czym się zajmujesz, bo spotkaliśmy się na jednej z konferencji, zaczęliśmy rozmawiać i zaciekawiło mnie to, czym się zajmujesz. Opowiedzmy o tym naszym słuchaczom.
Mikołaj
Dobrze. Z wykształcenia jestem inżynierem. Ukończyłem Akademię Górniczo-Hutniczą na Wydziale Inżynierii Mechanicznej i Robotyki, kierunek Automatyka i Robotyka, a następnie ukończyłem Mechatronikę na tym samym wydziale. W międzyczasie miałem jeszcze krótki epizod dwuletniego studiowania informatyki, ale druga inżynierka nie była aż tak niezbędna, wobec czego zrezygnowałem z tych studiów.
Moje zainteresowanie sztuczną inteligencją wzięło się stąd, że od drugiego roku studiów inżynierskich, czyli od 2017 roku, zacząłem w tym temacie siedzieć coraz bardziej. Może to kolokwializm, ale chodzi o to, że kierowałem swoją karierę w tę stronę, aby się tym zajmować, szczególnie w dziedzinie zastosowania AI w danych medycznych i ogólnie w medycynie.
Karol
A w jakim konkretnie obszarze medycyny?
Mikołaj
Głównie specjalizuję się w obrazowaniu medycznym i w zarządzaniu obrazowymi danymi medycznymi, czyli MRI (Magnetic Resonance Imaging), CT (Computer Tomography). De facto zajmuję się każdą modalnością, która operuje na danych wolumetrycznych.
Karol
To bardzo ciekawy obszar, szczególnie że na wyniki tomografii komputerowej nawet w Warszawie potrafi się czekać 10 tygodni.
Mikołaj
Tak, tak. Aczkolwiek, żeby sprecyzować, nie do końca zajmuję się kwestią opisywania tych danych. Od ponad dwóch lat, dzięki temu, że robię doktorat w Holandii na TU Delft, zajmuję się głównie czymś, co się nazywa protonoterapia. Jest to podtyp radioterapii, gdzie zamiast naświetlania fotonami wykorzystuje się naładowane cząstki elementarne – protony. Głównie zajmuję się zastosowaniem sztucznej inteligencji do personalizacji planowania leczenia. To jest taka bardzo ogólna nazwa.
Karol
A teraz przełóżmy to na język zrozumiały dla ludzi i opowiedzmy o tym obrazowo.
Mikołaj
Okej. Mam nadzieję, że nasi słuchacze wiedzą, jak działa radioterapia. To jest dość powszechna wiedza. Jeżeli pacjent ma zdiagnozowany nowotwór, może być zakwalifikowany do leczenia z wykorzystaniem radioterapii.
Karol
Albo chemioterapii.
Mikołaj
Albo chemioterapii, aczkolwiek skupmy się na radioterapii, bo chemioterapia to co innego. Oczywiście w dzisiejszym świecie ludzie zaczynają miksować różne metody, więc możliwych kombinacji jest bardzo dużo. Natomiast ja koncentruję się na radioterapii od strony fizyki i technologii.
Radioterapia sama w sobie polega na tym, że pacjent jest kładziony na specjalnym łóżku pod tak zwanym gantry. Następnie przez linak, czyli liniowy akcelerator cząsteczek (głównie elektronów, które są potem przetwarzane na wiązkę fotonów), naświetlany jest jego nowotwór. Naświetlanie polega na deponowaniu tam dawki. Dawka to energia zdeponowana w jednostce masy. Przez to, że deponujemy tę dawkę w komórkach nowotworowych, niszczymy ich łańcuchy DNA. Ja się na tym dokładnie nie znam, ale ogólnie przez odpowiednią irradiację (napromieniowanie) komórek, zabijamy je. Komórki zdrowe mają większą zdolność do rekonwalescencji, komórki nowotworowe tej zdolności nie mają. Odpowiednio zaplanowane leczenie sprawia, że nowotwór jest niszczony, oczywiście nie zawsze w pełni. I to są fotony.
Natomiast poza fotonami istnieje też modalność protonów i innych cząstek elementarnych, jak na przykład jony węgla czy same elektrony. Protony, czyli to, czym ja się zajmuję, polegają na tym, że również dokonujemy naświetlania, tylko zamiast światłem (fotonami), naświetlamy protonami – cząsteczkami elementarnymi, które są znacznie cięższe.
Przekładając na bardzo prosty obraz: wyobraźmy sobie, że mamy kulkę i stawiamy ją pod strumieniem wody. Zalewanie jej wodą pod dużym ciśnieniem sprawia, że kulka jest niszczona, zmniejsza swoją objętość, po prostu jest degradowana. To jest bardzo prosty przykład, bo to tak nie działa, ale chodzi o pokazanie obrazu. Natomiast w przypadku protonów, wyobraźmy sobie, że ta sama kulka jest bombardowana malutkimi kuleczkami, które mają o wiele mniejszą masę. Jest niszczona przez zderzenia, a nie przez to, że woda ją rozmywa. To jest ta różnica.
Protony mają jedną bardzo istotną zaletę nad fotonami – poza tym, że stwarzają wiele problemów, bo to bardzo złożony system inżynierski. Zaletą protonów jest to, że wszystkie zatrzymują się w jednym, określonym miejscu. Dzięki temu jest możliwe takie zaplanowanie leczenia, żeby zminimalizować dawkę zdeponowaną w zdrowych organach, a zmaksymalizować ją w nowotworze, co jest bardzo trudne do osiągnięcia w przypadku fotonów.
Karol
Czyli jest to metoda bardziej dokładna.
Mikołaj
Bardziej dokładna, dokładnie.
Karol
No dobrze, a gdzie tutaj rola uczenia maszynowego i całej sztucznej inteligencji?
Mikołaj
To dobre pytanie. Jest bardzo wiele zastosowań sztucznej inteligencji w radioterapii, począwszy od takich jak planowanie leczenia. To jest, powiedzmy, najbardziej trywialne. Dostajemy obraz z tomografii komputerowej i wyobraźmy sobie system, który mówi: „Okej, to jest nasz pacjent, musimy go naświetlić, żeby go wyleczyć”. Na tej podstawie powstaje mapa rozkładu dawki.
Karol
Rozumiem, czyli tworzy się mapa i w połączeniu z nią mamy przydzielone dawki w określonych punktach tej radioterapii?
Mikołaj
Dokładnie. Mamy określoną dawkę na każdy woksel.
Karol
I potem to jest zintegrowane z urządzeniem?
Mikołaj
To by było pięknie, ale to melodia przyszłości. Żeby zbudować fundament zrozumienia, bo ciężko się o tym opowiada bez prezentacji, spróbuję to zobrazować. Skan z tomografii komputerowej to prostopadłościan. Wyobraźmy sobie, że ten prostopadłościan składa się z tysięcy małych prostopadłościaników.
Karol
Czyli nie mówimy o płaskich arkuszach, o slajsach, tylko potrzebujemy trzech wymiarów?
Mikołaj
Dokładnie. Myślenie o tym w kategoriach slajsów, czyli pojedynczych obrazów na danej głębokości, bardzo ogranicza zrozumienie tego, jak działa radioterapia. Potrzebujemy myślenia w trzech wymiarach.
Myślę, że słuchacze, którzy nas słuchają, to grupa osób, które na pewno oglądały Interstellar. Jest tam taka scena na końcu, gdzie Cooper wpada do czarnej dziury i jest w tym wielowymiarowym pokoju swojej córki. Wyobraźmy sobie jeden punkt w czasie, czyli ten jeden pokój dziecka. To jest trójwymiarowa przestrzeń. I teraz wyobraźmy sobie, że dzielimy tę przestrzeń nie na slajsy, tylko na sześciany. Możemy wypełnić ten pokój małymi sześcianami i dzięki temu cała objętość pokoju będzie wypełniona.
Karol
Im mniejsze te sześciany, tym większa dokładność.
Mikołaj
Dokładnie. I każdy taki sześcian to jest woksel. Kluczem w radioterapii jest to, żeby wiedzieć, jaka jest dawka na każdy woksel.
Proces obliczenia tej dawki polega na tym, że przy odpowiednich warunkach początkowych próbuje się rozwiązać równanie transportu Boltzmanna. To jest równanie różniczkowe, które opisuje, jak zmienia się energia cząsteczek, gdy przemierzają one przez jakąś przestrzeń o danej gęstości. Ta gęstość jest zdeterminowana przez jednostki Hounsfielda, które są odczytywane z tomografii komputerowej.
Karol
Upraszczając, przechodząc przez ciało, te cząsteczki tracą energię.
Mikołaj
Tak, na rzecz takich procesów jak rozpraszanie (scattering), zwalnianie (stopping) i interakcje jądrowe (nuclear interactions), czyli interakcje, gdy proton uderza w proton albo w neutron, już na poziomie jądra atomu.
Problem w radioterapii, który dzisiaj mamy, jest taki, że musimy zaplanować leczenie.
Karol
To może opowiedzmy o tym, jak to wyglądało na przestrzeni czasu. Jak się zaczęło, na jakim etapie jesteśmy teraz i jak to może wyglądać w przyszłości?
Mikołaj
Szczerze mówiąc, aż tak dobrze historii radioterapii nie znam, ale zaczęła się od wynalezienia promieni rentgenowskich. Roentgen, który dostał za to Nagrodę Nobla, wymyślił, że przy naświetlaniu ciała odpowiednim światłem i postawieniu za nim kliszy (dzisiaj detektora), można zobrazować wnętrze ciała. Dzieje się tak dzięki zjawisku atenuacji. Gdy cząsteczki przechodzą przez ciało, w różnych jego elementach atenuacja (pochłanianie) jest różna, więc na wyjściu mają różną energię. Dzięki temu można wyświetlić obraz tego, jak promieniowanie przeszło przez ciało.
Karol
Inaczej zachowuje się kość, inaczej tłuszcz czy mięsień.
Mikołaj
Dokładnie, jest inna gęstość. Na podstawie wynalazku Roentgena powstał tomograf komputerowy, który jest w zasadzie rentgenem, tylko w 3D. Działa to tak, że źródło fotonów kręci się w jednej płaszczyźnie, a stół z pacjentem przesuwa się wzdłuż osi. To połączenie ruchu obrotowego i przesuwnego daje obraz spiralny, który po rekonstrukcji daje nam obraz 3D.
Szybko zorientowano się, że przy naświetlaniu można zabijać komórki. Dostarczenie dużej energii do komórki w krótkim czasie w jakiś sposób na nią wpływa. Naturalnie ludzie doszli do wniosku, że można dostarczyć na tyle dużą energię, żeby zabijać nowotwory. Ale pojawił się problem: skoro zabijamy nowotwór, to zabijamy też komórki zdrowe. Zaczęto więc wymyślać coraz bardziej precyzyjne mechanizmy, jak na przykład kolimator wielolistkowy (multi-leaf collimator), czyli maskę, która kształtuje wiązkę światła. Później wymyślono VMAT (Volumetric Modulated Arc Therapy), która polega na tym, że naświetlamy, kręcąc się wokół pacjenta, więc dawka jest dostarczana z 360 stopni z różnymi intensywnościami, co daje lepszą kontrolę.
Do dnia dzisiejszego planowanie polega na tym, że na stół trafia obraz medyczny pacjenta. Radiolodzy określają: tu jest nowotwór, tu serce, tu płuco, tu żebra. Następnie tzw. radiation oncologist, czyli onkolog specjalizujący się w radioterapii, określa priorytety. Mówi na przykład, że kluczowe jest, aby dostarczyć jak najmniejszą dawkę do serca pacjenta, ale można sobie pozwolić na większe naświetlenie kawałka płuca.
Następnie tym organom przypisywane są wagi do optymalizacji. Uruchamiana jest symulacja rozkładu dawki, która rozwiązuje wspomniane równanie transportu Boltzmanna. Na podstawie wyniku tej symulacji optymalizuje się intensywności, czyli ile cząstek naświetlamy z której strony, zgodnie z tymi wagami. W ten sposób powstaje plan leczenia.
Karol
I zakładam, że do tej pory ten plan był tworzony w pewien sposób manualnie?
Mikołaj
Manualnie o tyle, że nie rozwiązujemy równań ręcznie, bo do tego są solwery, jak Monte Carlo. Kiedy mamy gotowy plan leczenia, można go egzekwować. Co istotne, plan leczenia jest robiony raz.
Załóżmy, że mam nowotwór. Dzisiaj idę na tomografię komputerową, diagnozują mi nowotwór i moje ciało zostaje zmapowane. Plan leczenia jest dostosowany do dzisiejszej charakterystyki mojego ciała. Ten plan zakłada dostarczenie do mojego nowotworu, na przykład, 60 grejów (grej to dżul na kilogram). Lekarz planuje, jak dostarczyć te 60 grejów, ale nie może tego zrobić w jednym strzale, bo by mnie to zabiło. Więc rozdziela to na, powiedzmy, 30 dawek, co oznacza 6 tygodni leczenia. Myślę, że możemy sobie sami odpowiedzieć na pytanie, że przez 6 tygodni ciało człowieka, który wie, że ma nowotwór, może się dość drastycznie zmienić. Dostarczanie cały czas tego samego planu jest więc bardzo konserwatywnym podejściem.
I tutaj zaczyna się personalizacja, gdzie AI może odegrać dużą rolę.
Karol
Opowiesz o tym?
Mikołaj
Tak. To jest obecnie dość duży przedmiot badań naukowych. Podsumowując: na dzień dzisiejszy pacjent trafia na tomografię, nowotwór jest diagnozowany i opisywany, powstaje plan leczenia i przez 6 tygodni jest on realizowany. Zazwyczaj, jeśli pacjent ma tomografię dzisiaj, plan jest gotowy za dwa tygodnie, a leczenie zacznie się za dwa i pół tygodnia. Przez ten czas ciało i nowotwór prawdopodobnie trochę się zmienią. Nie wspominając o tym, że jeśli to jest nowotwór płuc, to on się przemieszcza, bo płuca się ruszają. Jeśli to nowotwór prostaty, jego lokalizacja zmienia się w zależności od wypełnienia pęcherza. Jest bardzo dużo zmiennych.
Leczenie na dzień dzisiejszy jest więc trochę rachunkiem prawdopodobieństwa. Moi koledzy na doktoracie pracują nawet nad metodami probabilistycznymi, które uwzględniają najgorsze scenariusze, żeby planowanie leczenia miało jak największe prawdopodobieństwo pokrycia całego nowotworu przy jak najmniejszym napromieniowaniu zdrowych organów.
Poza kilkoma czołowymi klinikami na świecie, jak Paul Scherrer Institute w Szwajcarii czy Mayo Clinic w USA, wszędzie stosuje się leczenie konserwatywne: jeden skan, jeden plan, egzekucja. Nie bierze się pod uwagę zmian w ciele pacjenta. Nie jest to możliwe, bo po prostu nie ma takiej technologii i zasobów ludzkich, które by pozwalały na personalizację.
Ale jest sztuczna inteligencja. I tutaj AI ma duży potencjał, ponieważ może dostosowywać plan leczenia do na bieżąco zmieniającego się ciała pacjenta.
Karol
Ale skąd wziąć dane, na podstawie których będziemy uczyli model, a potem dane samego pacjenta?
Mikołaj
Przede wszystkim dane do inferencji, bo dane treningowe w świecie medycyny to, wbrew pozorom, nie jest duży problem. Mimo że się o tym mówi, to danych jest naprawdę dużo, zwłaszcza w krajach Europy Zachodniej. Można wejść na The Cancer Imaging Archive, jest tam kilkadziesiąt różnych baz danych, każda po kilkaset skanów. To, z czym jest największy problem, to integracja wytrenowanego modelu z działającymi systemami klinicznymi. Jak sprawić, by model mógł dostać odpowiednie dane wejściowe w trakcie procesu leczenia?
Jeżeli powiem, że będziemy dostosowywać plan na bieżąco, to mój model potrzebuje aktualnego skanu z tomografii komputerowej mojego ciała po 10 dniach leczenia. A skąd go wziąć? Trzeba mi zrobić nowe CT. A tomograf może nie działać, może być długa kolejka albo to po prostu kosztuje. A nawet jeśli jest dostępne, to co mi po samym skanie, jak nie mam konturowania organów? Radiolog musiałby to zrobić, a to trwa. Można go zastąpić przez AI, ale wtedy pojawia się pytanie, kto weźmie za to odpowiedzialność? To cały strumień problemów do rozwiązania, nie tylko na poziomie technologicznym, ale też systemowym – procesów i finansów w opiece zdrowotnej.
Ale załóżmy, że wszystko działa, i opowiedzmy, jak to powinno funkcjonować w scenariuszu badawczym. Mówimy tu o tak zwanej Online Adaptive Radiotherapy. Założenie jest takie: wykonujemy skan CT pacjenta przed leczeniem. Lekarze dokonują opisu, czyli konturowania organów i określenia, jakie dawki są dopuszczalne. Następnie kładziemy pacjenta na stół pod akceleratorem.
Idealnie byłoby, gdyby przed każdą sesją leczenia pacjent był ponownie skanowany. W tym samym pomieszczeniu, gdzie jest akcelerator, powinien być tomograf. Częściowo jest to rozwiązane, bo istnieje coś takiego jak Cone Beam CT (CBCT). To jest skan tomograficzny o bardzo słabej jakości, z dużym szumem, ale daje trójwymiarowy obraz.
W idealnym scenariuszu, po wykonaniu nowego skanu, system AI, mając kontekst pierwotnego planu stworzonego przez człowieka, automatycznie dostosowuje kontury organów na nowym obrazie. Następnie, znając priorytety (wagi) dla poszczególnych organów, może na nowo przeliczyć i zaktualizować plan leczenia, aby był adekwatny do bieżącej sytuacji. Problem jest taki, że nawet jeśli przewidzimy idealną dawkę, to modele AI nie zawsze powiedzą, jakie ustawienia maszyny są potrzebne, żeby ją dostarczyć. To jest tzw. problem odwrotny (inverse problem), który nie jest trywialny.
Karol
A jest szansa, że zautomatyzujemy ten proces w taki sposób, o którym mówisz?
Mikołaj
W radioterapii – myślę, że tak. Właśnie w Paul Scherrer Institute jakieś trzy miesiące temu opublikowali artykuł, w którym pokazali, że im się to udało. Opisali metodologię, gdzie pacjent przychodzi, jest skanowany, a plan leczenia jest na bieżąco dostosowywany na podstawie aktualnego wyglądu pacjenta, aby dostarczyć bardziej spersonalizowaną dawkę.
Karol
A jakieś inne ciekawe obszary w medycynie, gdzie wykorzystuje się takie narzędzia?
Mikołaj
Coś, czym zajmowałem się przez prawie dwa lata: segmentacja naczyń wieńcowych i określanie tzw. calcium score. Naczynia wieńcowe to naczynia krwionośne, które oplatają serce.
Karol
A niebezpieczeństwo jest takie, że któreś z tych naczyń może się zatkać.
Mikołaj
Tak, przez odkładanie się wapnia. Wtedy dochodzi do zmniejszenia dopływu krwi, część mięśnia sercowego jest niedotleniona i może dojść do zawału.
Karol
I takie narzędzia już funkcjonują?
Mikołaj
Z tego co wiem, to tak. Sam nad jednym pracowałem i jestem współautorem publikacji na ten temat. Celem było stworzenie rozwiązania, które na wejściu otrzymuje skan tomografii komputerowej serca z kontrastem, następnie przeprowadza segmentację naczyń wieńcowych, konwertuje je na siatkę 3D (mesh) i na tej podstawie przeprowadza symulację przepływu krwi. To jest tak zwane badanie FFR, które pozwala ocenić niedotlenienie poszczególnych części mięśnia sercowego.
Karol
Czyli to kwestia czasu, środków i optymalizacji systemu leczenia, żeby wykorzystać tę technologię, która już jest dostępna, połączyć ją z danymi i zaadaptować w ramach infrastruktury?
Mikołaj
Do zrobienia, jak to mówią, „overnight”, nie? Zobaczymy, co będzie za 20 lat. Prawda jest taka, że system medyczny, mimo że podziwiam, jak działa przy swoich ograniczeniach, jest bardzo niedoinwestowany, jeśli chodzi o infrastrukturę cyfrową. Jest problem z transferem danych, ze zrozumieniem, jak je zbierać, i z brakiem ekspertów, którzy chcą pracować w tej dziedzinie.
Porównajmy dwie branże: dane medyczne i inżynierię AI dla LLM-ów. W LLM-ach są gigantyczne pieniądze, miliardy dolarów. Wszyscy zdolni researcherzy, matematycy i programiści chcą tam uderzać, bo to jest fascynujące i są tam najlepsze zarobki. Z drugiej strony wynagrodzenia w technicznych obszarach branży medycznej nie są aż tak wysokie. To jest dziedzina, która wymaga ogromnej, interdyscyplinarnej wiedzy, pasji i cierpliwości. Dodatkowo jest to rynek bardzo mocno regulowany. Projektowanie maszyny do strzelania protonami w człowieka to ogromna odpowiedzialność. Jeśli coś się zepsuje, dostarczy się dawkę o dwa greje za dużą, można doprowadzić do nieodwracalnych konsekwencji na całe życie.
Karol
Zobacz, jak ważna jest tutaj etyka.
Mikołaj
Tak, ale na szczęście są regulatorzy. Branża medyczna jest niesamowicie mocno regulowana. Nie można dostarczyć do szpitala wyrobu medycznego, który nie przeszedł odpowiedniej ścieżki certyfikacji. A to wszystko trwa i kosztuje.
Karol
A widzisz obszary w branży medycznej, które są w stanie zaadaptować tę technologię najszybciej?
Mikołaj
Jeśli chodzi o ogólną sztuczną inteligencję, to dokumentacja medyczna.
Karol
Ostatnio rozmawiałem z Michałem Prządką, który pracował nad projektem wspólnie z DocPlannerem. Automatyzują proces tworzenia dokumentacji medycznej, tworząc asystenta dla lekarza, który prowadząc wywiad z pacjentem, nie musi sam tworzyć tej dokumentacji.
Mikołaj
To fajny temat. Obiło mi się o uszy, że DocPlanner coś takiego robi. Dokumentacja medyczna bazuje głównie na tekście, ale trzeba pamiętać, że to też jest pewne upośledzenie tej branży – brak czegoś takiego jak multimodalny rekord pacjenta. Moim zdaniem powinno być tak, że pacjent ma wszystkie swoje badania w jednym miejscu. Na Google Drive możemy trzymać wszystko: dokumenty, zdjęcia, wideo. Co nas blokuje przed tym, żeby zbudować taki „Google Drive” dedykowany medycynie?
Karol
Genialny pomysł. Szczególnie że gdyby to potraktować systemowo i centralnie, to zobacz, jak cenna baza danych mogłaby powstać.
Mikołaj
Ja nawet byłem zaskoczony, obserwując sytuację w jednym ze szpitali, gdzie okazało się, że szpital de facto nie prowadzi dokumentacji medycznej pacjentów na przestrzeni lat w szerokim zakresie. Często jest ona outsourcowana do poddostawców badań.
Powinno być tak – i to jest coś, co bardzo chciałbym, żeby się wydarzyło – że mamy ujednolicony system. Na świecie jest dużo gotowych klocków. Są systemy PACS (Picture Archiving and Communication System) do przechowywania obrazów medycznych w formacie DICOM. Są systemy HIS (Hospital Information System) i LIS (Laboratory Information System). Ale one nie są ze sobą połączone. Mamy dane z patomorfologii, genetyki, dane tekstowe, dane wolumetryczne z CT/MRI, wideo z badań USG czy EEG. Tych modalności jest mnóstwo, ale każda jest w innym systemie.
Karol
Trzeba znaleźć w funduszu ludzi, zespół, kogoś z wizją, kto stworzy wizję przyszłości medycyny.
Mikołaj
Tylko tyle i aż tyle. W branży medycznej jest bardzo trudno o dobry model biznesowy.
Karol
Naprawdę? A usprawnianie procesów, zwiększenie efektywności?
Mikołaj
A kto za to zapłaci? Szpitali w Polsce na to nie stać. To jest problem realiów polskich. W Ameryce, gdzie służba zdrowia jest prywatna, każdy szpital walczy o optymalizację i marżowość, więc chętnie inwestuje w takie rozwiązania. W Europie sytuacja jest inna. Jeśli budujesz produkt w Polsce, musisz walczyć o to, żeby go przenieść osobno do Niemiec, Holandii, Francji, a systemy w każdym kraju są inaczej zorganizowane.
Karol
To w jakim kierunku możemy pójść w kontekście rozwoju modeli uczenia głębokiego w Polsce?
Mikołaj
Moim zdaniem powinniśmy skupić się na tym, jak podchodzić do trenowania specjalistycznych modeli. Mam wrażenie, że w Polsce jest bardzo mało osób, które mówią o tym, jak faktycznie wygląda praca nad modelami uczenia głębokiego, a za dużo jest o tym, jak integrować gotowe narzędzia do procesów biznesowych. O ile integracja jest ważna, o tyle koncentracja tylko na niej jest zakładaniem sobie pętli na szyję. Zawsze będziemy korzystać z czyjejś technologii.
Karol
Czyli podstawa to edukacja rynku, biznesu, w tworzeniu technologii od podstaw.
Mikołaj
Tak, ale brakuje treści, które edukują technicznie. I to jest duży problem. Wyjątkiem jest community wokół Remigiusza Kinasa. On jest absolutnie moim guru na LinkedInie, ma wielki szacunek za to, co robi. Jest mistrzem świata.
Brakuje mi contentu, który faktycznie edukuje od podstaw, jak buduje się te modele. Ważne jest wdrażanie rozwiązań, które biorą gotowe modele z Hugging Face i je integrują, ale wtedy cały silnik pochodzi od kogoś innego. Jeśli Polska ma być krajem, w którym AI przynosi duże PKB, musimy dostarczać fundamentalne technologie. Język polski jest niszowy, więc modele językowe same w sobie nie są czymś, czym zwojujemy światowy rynek.
Karol
To jaki jest obszar, w którym możemy być mocni?
Mikołaj
Moim zdaniem specjalistyczne modele. Modele do budowania wartości w konkretnych dziedzinach. Oprócz tego, że robię doktorat, jestem współzałożycielem firmy w Polsce, która zajmuje się opracowywaniem modeli „bespoke” na potrzeby klientów. Pracujemy z różnymi branżami, dostarczając dedykowane komponenty, tę fundamentalną technologię. To jest szansa dla Polski. Mamy świetnych informatyków, inżynierów, lekarzy i specjalistów. Trzeba to połączyć i wychodzić za granicę z gotowymi produktami.
Karol
Skoro korzystasz z LinkedIna, to może zacząłbyś publikować treści o tym, co jest potrzebne i pokazywać na własnym przykładzie, jak buduje się te modele?
Mikołaj
Myślałem o tym, aczkolwiek jestem trochę nieśmiały.
Karol
A jaka jest droga do stworzenia AGI? Wierzysz w to?
Mikołaj
Słyszałem już nową definicję: ASI – Artificial Super Intelligence. Najpierw była statystyka, potem deep learning, potem AI, potem AGI, teraz ASI. Co będzie następne, nie wiem.
Karol
To patrząc na rozwój technologii w ciągu ostatnich lat, jak Twoim zdaniem rynek będzie się rozwijał w ciągu najbliższych dwóch, trzech, pięciu lat?
Mikołaj
Zacznijmy od perspektywy pół roku. Moim zdaniem to, co już się dzieje, to powrót do starej szkoły reinforcement learningu. Ostatnio japońska grupa Sakana zrobiła samoadaptujący się LLM, który wykorzystuje algorytm REINFORCE, opublikowany w latach 90., będący podwaliną reinforcement learningu.
Karol
Wytłumaczmy różnicę.
Mikołaj
Supervised learning to podejście, gdzie na każdym kroku treningu model jest „karany” za odchylenie od z góry znanej, prawidłowej odpowiedzi lub trajektorii. Natomiast reinforcement learning polega na tym, że dajemy modelowi cel i ogólne zasady (policy), np. „zrób to jak najszybciej” albo „jak najbezpieczniej”. Model wykonuje setki tysięcy iteracji, eksplorując przestrzeń rozwiązań, a my nagradzamy go lub karzemy za ostateczny wynik, a nie za każdy pojedynczy krok.
W dłuższej perspektywie, moim zdaniem, nastąpi duże „odchudzanie” modeli. Prawdopodobnie będą instalowane lokalnie. Liczę też na zmianę paradygmatu – odejście od prostej optymalizacji miliardów wag w gigantycznych sieciach. Powinniśmy myśleć o tym, jak sprawić, żeby AI było tak efektywne energetycznie, jak ludzki mózg. Człowiek obudzony w nocy odpowie, ile jest 2+2, zużywając znikomą ilość energii. AI potrzebuje do tego gigantycznej karty graficznej.
Karol
Kogo czytać, kogo obserwować, oprócz Remka Kinasa?
Mikołaj
Yann LeCun, Chief AI Scientist w Meta. Zgadzam się z jego szkołą myślenia, że należy szukać rozwiązań innych niż LLM-y i Transformery. Transformer to cudowny algorytm, który zmienił świat, ale nie możemy zakładać, że będzie dobry do wszystkiego. A takie założenie trochę panuje w nauce.
Sam jestem trochę ofiarą tego trendu. W moim doktoracie pracuję nad rozwiązaniem do obliczania dawki w radioterapii, czyli data-driven dose engine. Klasyczne metody Monte Carlo są bardzo drogie obliczeniowo – obliczenie pojedynczej wiązki protonów zajmuje około 60 sekund, a cały plan składa się z około 4 tysięcy takich wiązek. My pracujemy nad algorytmem, który osiąga podobną dokładność, ale robi to w 6 milisekund na wiązkę. Ale też korzystamy z Transformera, bo taką technologię wykorzystywał mój poprzednik i to jest kierunek, który łatwiej publikować, mimo że Transformer prawdopodobnie nie jest tu najbardziej efektywnym rozwiązaniem.
Są alternatywy, jak na przykład State Space Models, ale na razie się nie przyjęły. Całe piękno researchu polega teraz na tym, żeby szukać tych lepszych, bardziej efektywnych rozwiązań.
Karol
Mikołaj, dziękuję Ci serdecznie za spotkanie i za rozmowę. Trzymam kciuki za Twoje i Twojego wspólnika dalsze działania.
Mikołaj
Dziękuję bardzo. Oby się udało.
