Czy traktujemy sztuczną inteligencję jak zaawansowaną wyszukiwarkę, czy może jak partnera zdolnego do kreatywnego myślenia? To pytanie stało się jednym z głównych wątków mojej niedawnej rozmowy w podcaście „99 Twarzy AI”. Moim gościem była Inez Okulska – postać fascynująca, łącząca światy pozornie odległe. Doktor literaturoznawstwa, która ukończyła również automatykę i robotykę, a dziś spełnia się jako badaczka AI na Politechnice Wrocławskiej i redaktor naczelna hAI Magazine. Wnosi unikalne, interdyscyplinarne spojrzenie na technologię.
A jeżeli chcecie posłuchać Inez na żywo – koniecznie wpadnijcie na Infoshare | Shape Tomorrow Today w Gdańsku!
Humanistyka spotyka technologię – nowa perspektywa na AI.
Połączenie głębokiej wiedzy o języku i kulturze z technicznym zrozumieniem działania systemów AI dało naszej rozmowie wyjątkowy wymiar. Perspektywa Inez pozwoliła spojrzeć na modele językowe nie tylko przez pryzmat ich architektury czy danych treningowych, ale także jako na systemy kształtowane przez niuanse języka naturalnego i – co istotne – przez nasze ludzkie oczekiwania i uprzedzenia. To cenne uzupełnienie często czysto inżynieryjnego podejścia do AI.
AI jako partner czy wyszukiwarka? Rola wyobraźni.
Inez trafnie zauważyła, że kluczem do pełnego wykorzystania AI jest wyobraźnia. Potrzebujemy jej nie tylko do wymyślania nowych zastosowań, ale przede wszystkim do przewidywania konsekwencji ich wdrożenia. Zwróciła uwagę na fakt, że mamy tendencję do sprowadzania potężnych modeli do roli wyrafinowanych wyszukiwarek. Czy w ten sposób nie ograniczamy ich potencjału, skupiając się na odpytywaniu o fakty – które, jak pokazują badania i doświadczenie, bywają przez modele przekłamywane lub wręcz wymyślane (halucynacje)?
Uprzejmość czy ograniczenie? O „wychowaniu” modeli językowych.
Jednym z bardziej intrygujących wątków poruszonych przez Inez było „wychowanie” modeli. Wyjaśniła, jak mechanizmy uczenia ze wzmocnieniem (szczególnie RLHF – uczenie na podstawie ludzkich informacji zwrotnych) faworyzują odpowiedzi „grzeczne”, bezpieczne i zgodne z oczekiwaniami oceniających. Skutkuje to tworzeniem modeli, które często unikają kontrowersji czy krytycznego podejścia, preferując „schlebianie” użytkownikowi. To prowadzi do ważnego pytania: czy budując AI, nieświadomie kodujemy w nim nasze własne ograniczenia i potrzebę konformizmu?







Język jako interfejs – dlaczego poeci rozumieją AI?
Nasza rozmowa wielokrotnie wracała do fundamentalnej roli języka. Inez, czerpiąc ze swojego doświadczenia, podkreślała znaczenie precyzji, bogactwa słownictwa i świadomości struktury języka (składni) w komunikacji z modelami. Zrozumienie, jak formułować pytania i polecenia (prompty), pozwalają wydobyć z AI znacznie więcej niż standardowe zapytania. Nie bez powodu, jak zauważyła, na rynku pracy w roli prompt inżynierów pojawiają się osoby z wykształceniem humanistycznym – poeci, filolodzy – których naturalna wrażliwość językowa staje się cennym atutem.
Kreatywność modeli – nie tylko streszczenia i odpowiedzi.
Aby pokazać, że AI potrafi być kreatywne, przywołałem eksperyment z generowaniem recenzji jazdy pchły na triceratopsie. Model wykazał zaskakującą zdolność nie tylko do przetworzenia absurdalnego zapytania, ale do zbudowania spójnej, stylizowanej narracji. To dowód, że potencjał modeli wykracza daleko poza proste odpowiadanie na pytania czy generowanie podsumowań. Kluczem jest odpowiednie sformułowanie wyzwania.
Świadomość ograniczeń – jak pracować z AI efektywnie?
Nie idealizowaliśmy jednak możliwości AI. Rozmawialiśmy otwarcie o jej ograniczeniach: wbudowanych uprzedzeniach, tendencji do generowania nieprawdziwych informacji, problemach z utrzymaniem długiego kontekstu rozmowy czy przetwarzaniem niektórych typów danych. Inez podzieliła się praktycznymi strategiami radzenia sobie z tymi wyzwaniami, takimi jak konieczność weryfikacji odpowiedzi czy świadome zarządzanie oknem kontekstowym.
Potencjał na styku dziedzin – wnioski z rozmowy.
Dyskusja z Inez utwierdziła mnie w przekonaniu, że przyszłość efektywnego i odpowiedzialnego rozwoju AI leży w interdyscyplinarności. Potrzebujemy nie tylko doskonałych inżynierów, ale także humanistów, etyków, lingwistów – ludzi, którzy potrafią spojrzeć na technologię z szerszej perspektywy, zadać trudne pytania i pomóc nam zrozumieć jej wpływ na społeczeństwo i kulturę. Ale także, że w komunikacji siła – i ci zaszufladkowani dotychczas humaniści mogą zbliżyć się do świata AI korzystając z dobrodziejstwa nowoczesnej edukacji – niestrudzonych AI tutorów – którzy mogą dobierać język przekazu, np. matematycznych konceptów tak, by był zrozumiały. Jakie są Wasze refleksje po tej rozmowie? Czy dostrzegacie potrzebę łączenia perspektywy technicznej i humanistycznej w rozwoju AI? Jakie macie doświadczenia z wydobywaniem kreatywności z modeli językowych? Zapraszam do dyskusji w komentarzach.
—
Masz chwilę? Jeśli podoba Ci się 99 Twarzy AI, zostaw ocenę i recenzję – dzięki temu możemy docierać do jeszcze większej liczby słuchaczy!
Dobrego dnia i niech #AI będzie z Wami wszystkimi!
Książki do polecenia
- Brian Christian, The Alignment Problem: Machine Learning and Human Values
- Brian Christian, Tom Griffiths, Thomas L. Griffiths, Algorithms To Live By: The Computer Science of Human Decisions
- Max Bennet, A Brief History of intelligence. Why the Evolution of the Brain Holds the Key to the Future of AI
- Marcus du Satoy: The Creativity Code: How AI is Learning to Write, Paint and Think
- Janina Bąk, Statystycznie rzecz biorąc cz.1 i cz.2
- Josh Starmer, StatQuest Illustrated Guide to Machine Learning
- Josh Satrmer, StatQueset Illustrated Guide to Neural Networks and AI
- Benjamin K. Bergen, Latające świnie. Jak umysł tworzy znaczenie
- James W. Pennebaker: The Secret Life of Pronouns: What Our Words Say About Us
- Steven Pinker, The Sense of Style: The Thinking Person’s Guide to Writing in the 21st Century
- Raymond Queneau, Ćwiczenia stylistyczne, przeł. Jan Gondowicz
- Renata Grzegorczykowa, Wykłady z polskiej składni
Obiecana recenzja Pchły Szachrajki
Szum wiatru? Wolne żarty.
Prędkość żółwia w błocie.
Bezpieczeństwo?
Chyba, że cię strzepnie w locie.
Werdykt pchły-eksperta?
Cóż, platforma wielka,
Lecz komfort zerowy.
Nie polecam. Pchełka.
Ocena: 1/5 gwiazdki (tylko za darmowy bufet). Lepiej złapać psa. Przynajmniej czasem biega.

Transkrypcja rozmowy
Disclaimer. Droga Czytelniczko, Drogi Czytelniku – mała uwaga dotycząca transkrypcji rozmowy. Jak się pewnie domyślasz – transkrypcja została przygotowana z wykorzystaniem magii LLM. Proszę o wyrozumiałość, gdyby pojawiły się w niej niewielkie błędy, literówki, etc. Żeby mieć pewność co do wszystkich wypowiedzi – polecam posłuchać, zamiast czytać. Ukłony.
Karol
A czy kluczem do wykorzystania modeli językowych jest wyobraźnia właśnie?
Inez
Wiesz co, chyba tak, ale to idzie w dwie strony. Musisz mieć wyobraźnię do tego, żeby wymyślić, co z nimi zrobić, i wyobraźnię, która ci podpowie, jakie mogą być konsekwencje tego, co zrobisz.
Karol
Rozwiniesz?
Inez
No, ta pierwsza część to pewnie prostsza, tak? Czyli musimy pomyśleć… Ale nieoczywista. Nieoczywista, no. Bo powiem ci tak, jak obserwuję, w jaki sposób ludzie, i to ludzie z mediów, wykorzystują modele językowe, to przypomina mi to bardziej erę wyszukiwarki Google niż erę kreatywnej pracy.
Inez
To trochę smutne jest, co mówisz, ale rzeczywiście chyba tak jest, że… To trochę jak z tymi gadżetami, że ludzie kupują na przykład ten słynny airfryer, a potem robią w tym naleśniki przez całe życie. Trochę tak jest, że mamy wielkie modele, przypalamy pół planety, żeby one działały, a finalnie właśnie wyszukujemy w internecie trochę lepiej wiadomości. Przy czym, jak wiemy dzięki ostatnim badaniom, wcale nie lepiej, bo jak ostatnio chyba Artur Kurasieński zrobił taki wpis, gdzie podsumowywał badania pokazujące, jak drastycznie niskiej jakości są wyniki tych wyszukiwarek, jeszcze jak halucynują nam te źródła, więc to nawet nie jest dobre zastosowanie tego.
Karol
Ale wiadomość chyba z wczoraj albo przedwczoraj – Gemini podpisało na przykład umowę z Associated Press i będzie dostarczać wyniki w real time. Mało tego, te wyniki będą i źródła, które będą wskazywane przez modele językowe, będą oznaczone trzema symbolami – zielony, żółty albo czerwony.
Inez
Wydaje mi się, że w ogóle pomysł, żeby modele miały w sobie czy pełniły funkcję wyszukiwarki, jest najlepszy – jedyną słuszną realizacją tego pomysłu jest rzeczywiście połączenie Google’a z modelem Google’a, no w sensie – cały, nie bez powodu była hegemonia tej wyszukiwarki przez lata, nie? Więc jeżeli mamy taką technologię, oni mają tę technologię, no to w zasadzie powinni się tam spiąć i jakby make the best of it, nie?
Karol
Ja widzę, że jest duża szansa, Ines, że ten odcinek będziemy mogli zatytułować „Sztuczna Inteligencja i dygresja”. Tak wracając tak do początku.
Inez
Wróćmy do kreatywności. Do kreatywności. Więc pomysły kreatywne. Mi się podobają najbardziej takie pomysły, w których traktujemy ten model jako rozmówcę, jako krytyka – czyli na przykład chcemy, potrzebujemy stworzyć coś i nie mówimy po prostu z pierwszego promptu: „Daj mnie to, co ja potrzebuję”, tylko zaczynamy rozmowę, która jest rozmową, właśnie takim sparingiem myśli. Potrzebuję zrobić to i to, mam taki pomysł, znajdź mi słabe strony w tym – no i dostajemy jakieś słabe strony. Na przykład zaczynamy znajdować kontrargumenty, że: „Słuchaj, ale mi się podoba ten pomysł, myślę, że on jest niezły i dlatego, bo…” I tutaj jakieś argumenty. „Przekonaj mnie, że jest inaczej”. No i tutaj model kombinuje. I tak sobie odbijamy tę piłeczkę i gdzieś finalnie na końcu wychodzi, że rzeczywiście ten nasz pomysł skręcił, wyewoluował, ale no właśnie w toku jakiejś fajnej rozmowy. Więc to mi się wydaje też dobrym pomysłem.
Karol
Która ma być pewnym challenge’em, bo zgodzisz się z tym – ja zauważyłem na przykład jedną rzecz, że jak rozmawiasz właśnie bez takiej krytyki i kwestionowania swojej racji własnej, to model robi coś, co bym nazwał po angielsku „I’m pleasing you”.
Inez
Tak, tak. On mówi ci to, co chcesz usłyszeć, i on ci będzie klaskał tak długo, jak mu nie zabronisz.
Karol
A jak myślisz, z czego to wynika?
Inez
No, trochę z wychowania tych modeli. Dosłownie. Jakkolwiek zabawnie to brzmi, lubię to słowo po polsku – „wychowanie”, bo ono chyba najlepiej oddaje to, co się tam dzieje. Czyli naprawdę, jeżeli stworzyliśmy tych asystentów, te jednostki, i one właściwie najpierw uczyły się języka, potem danych, korelacji pomiędzy nimi, zrozumienia świata i tak dalej, no ale potem przyszedł ten moment, stawiane przed nimi cele, zadania, moment oceny, tutaj nagrody, kary, tak? Funkcja nagrody się pojawia i te modele się uczą zachowywać tak, jak im kazano w tym wychowaniu.
Karol
A to ciekawe, co powiedziałaś, bo ja myślałem, że odbierasz o budowaniu samego modelu, a ja bym powiedział, że…
Inez
Bo to jest budowanie modelu, tylko nam się kojarzy, że budowanie modelu często skrótowo o tym myślimy w ten sposób, że to jest ta część nienadzorowanego uczenia się, po prostu wyciągania tych relacji i tworzenia reprezentacji wektorowych, tych ogromnych zbiorów danych, ale… Tam dochodzą instrukcje już, które pokazują, jak wygląda konkretne zadanie. Tam pojawia się model preferencji i nikt inny jak ludzie oceniają po prostu różne możliwe odpowiedzi, typy odpowiedzi, i pokazują, która z nich jest najlepsza, która jest druga w kolejności, która absolutnie jest no-go i tak dalej. I to jest ten moment właśnie wychowania.
No i najwyraźniej w tych modelach preferencji te takie bardzo eleganckie, grzeczne, uniżone prawie momentami zachowania były – no, preferowane.
Karol
Czyli w sumie model odzwierciedla oczekiwania nas, ludzi. No, trochę tak. Świata, który nie krytykuje i nie kwestionuje, tylko zgadza się z nami, z naszymi poglądami, bo trudno jest się konfrontować czasami.
Inez
No bo on, jeżeli był generalnie nauczony w pierwszym rzędzie do tego, żeby wykonywać jakieś zadania, no to nie powinien być asystentem, który stawia opór na każdym kroku, prawda? Czyli na przykład podchodzimy do naszego modelu czy tak jakbyśmy podchodzili do naszego asystenta, nie wiem, stażysty i mówimy: „Proszę, nie wiem, znajdź mi jakieś informacje, coś”. „Nie, dlaczego?” To byłoby trudne.
Karol
Opór? Czy pewien sposób challengowania mnie?
Inez
Myślę, że wbrew pozorom doświadczenie użytkownika, tak zwany user experience, nie byłoby takie wysokie, jak jest aktualnie, gdyby model za każdym razem dodawał taki krok pośredni, w którym nas challenge’uje, zamiast wykonać to, co chcemy, no bo by to zwiększało tak zwane tarcie, tak? Mówilibyśmy – dłuższą drogę dotarcia do tego, co chcemy. Ludzie byliby zirytowani. To zresztą bardzo fajnie widać w przypadku modeli, które są tymi modelami myślącymi, tymi R. To jest niesamowite. W sensie jesteśmy tak rozpieszczeni tym, że modele są w stanie robić ogromną analizę danych, wykonywać ogromne, w sumie skomplikowane zadania w sekundy czy ułamki sekund, że jak nagle się okazało, że model myśli przez 20 sekund albo 50, to jest takie: „No, halo, kawa mi stygnie, nie? Ile mam czekać?”. To jest po prostu, jak o tym pomyślisz, to mind-blowing, tak? Jakby ludzie, naprawdę.
Karol
Słuchaj, robiliśmy ostatni eksperyment po to, żeby zobaczyć, w jaki sposób myśli model. Gemini akurat kapitalnie to pokazuje, bo Gemini dokładnie ci pokazuje zadania, które realizuje do tego, żeby odpowiedzieć na zadane pytanie. I chcieliśmy stworzyć recenzję jazdy pchły na Triceratopsie.
Inez
Okej.
Karol
Jak zobaczyłem, w jaki sposób on myśli i konstruuje całą opowieść, przy której jak potem przeczytałem – umieścimy to w notatkach – jak wygląda ta recenzja jazdy pchły na Triceratopsie, z której – czyli umówmy się – trudno sobie to wyobrazić w rzeczywistości.
Inez
Wizualnie tak, ale chyba nie spotkaliśmy tego wcześniej, ani piszącej pchły również.
Karol
Właśnie.
Inez
To jest ta różnica, że nie spotkaliśmy tego wcześniej. To nie znaczy, że trudno sobie wyobrazić.
Karol
Dokładnie tak, masz rację. Słuchaj, to było fenomenalne. W sensie model wchodzi w rolę, definiuje pojazd, definiuje osobę, która jeździ, odnosi się do najlepszych recenzji w kontekście ujeżdżania albo w stylu recenzenta, a potem tworzy tę recenzję. I ja jeszcze poprosiłem, żeby ona się rymowała.
Inez
O matko!
Karol
Poprosiłem, żeby się rymowała, biorąc pod uwagę fonetykę języka polskiego, bo zobacz, że jak prosisz modele o to, żeby tworzyły treści rymowane – tak przynajmniej ja zauważyłem – to trudno jest utrzymać rym w języku polskim.
Inez
Serio? Ja nie…
Karol
Zrób sobie eksperyment.
Inez
Miałam gdzieś eksperymentów rymowanych i one były rymowane, tylko strasznie siermiężnie, ale były rymowane.
Karol
Więc właśnie o tym mówię. A jeżeli poprosisz go, żeby uwzględnił tutaj ten aspekt fonetyczny brzmienia tych słów, to zobaczysz, że jakoś tego jest dużo.
Inez
Możesz mu też napisać, że poprosisz, żeby były rymy i asonanse. Może mieć podobny…
Karol
Asonanse? Nowe słowo, nie znam.
Inez
To są takie rymy niedokładne, czyli takie właśnie na samogłoskach, a nie dokładnie tak, jak jesteśmy przyzwyczajeni, że końcówka jest ta sama. Więc myślę, że to jest w sumie trochę to, co próbowałeś powiedzieć, tylko można było krócej.
Karol
Dobra. I właśnie dlatego podzielę się jednym moim doświadczeniem ostatnim. Wiesz co sobie ostatnio kupiłem, Ines?
Inez
No?
Karol
Dwa słowniki – języka polskiego i słownik wyrazów obcych.
Inez
Mój ulubiony! Jezu, kocham słownik wyrazów obcych. To jest coś takiego, co ja od dzieciństwa biorę sobie z półki, jestem w stanie otworzyć na losowej stronie i tam jest zawsze coś ciekawego. Kocham to. Po prostu Kopaliński najlepszy.
Karol
Ale wiesz co mnie do tego skłoniło? Skłoniło mnie to do tego, że zdałem sobie sprawę z jednej bardzo ważnej rzeczy – tym lepiej będziemy korzystać z modeli językowych, im będzie bardziej bogaty nasz język, z którego korzystamy.
Inez
Wiesz co, nawet nie wiem czy bardziej bogaty, ale na pewno bardziej świadomy, co się czasami będzie pokrywało.
Karol
A jedno i drugie?
Inez
Tak, w sensie że to będzie się pokrywało, bo czasami ta świadomość będzie wymagała tego, żebyśmy niuansowali leksykę, czyli dobierali słowa właśnie precyzyjnie jakieś kolejne, a nie tylko cały czas tych samych używali słów-worków na wszystko. A czasami po prostu wiedzieli, które słowo do czego dobrać. Ale rzeczywiście ja też uważam, że następuje renesans języka i komunikacji. To jest niesamowite, bo tak jak w czasie tego boomu internetowego, social mediów, dużo się mówiło o tym, że w ogóle język upada, że on będzie w ogóle się zatracał, że to, co się dzieje w internecie z językiem, to jest jakaś masakra i w zasadzie jesteśmy be doomed, że po prostu już nic nie ma dla nas ratunku. No to teraz właśnie wajcha idzie w drugą stronę, bo nagle się okazuje, że jak ktoś potrafi komunikować, i to jest niesamowite, że nawet nie tylko w języku, ale jak potrafisz komunikować w sensie teorii komunikacji, w sensie tego, że twój przekaz jest rzeczywiście przekazem, że twój komunikat coś niesie, że jest skonstruowany w sposób logiczny, ustrukturyzowany, taki, że z niego wynika coś, no to jakby wygrałeś ten świat generatywny.
Karol
Zobacz, że ten potok słów wcale nie jest wskazany. Przed naszą rozmową pokazywałem ci projekt Visualize Value Jacka Butchera, który maksymalizuje przekaz i przekazywane treści za pomocą symbolicznych grafik i minimalnej ilości słów. Coś fantastycznego.
Inez
Ja zauważyłam, że generowanie obrazów rzeczywiście też bardzo fajnie działa, kiedy mówimy metaforami, kiedy nie mówimy właśnie wprost, tylko zaczynamy kondensować ten przekaz w dobrą metaforę – to rzeczywiście działa. Tutaj w ogóle jest coś takiego jak renesans opisu obrazów. Nie wiem, czy pamiętasz ze szkoły, było takie zadanie jak ekfraza, czyli opis literacki obrazów. Bywały na przykład słynne wiersze, których głównym tematem było opisanie obrazu, tego, co na nim się znajduje, emocji z tym związanych itd. A to, co my teraz robimy, to jest taka odwrócona ekfraza – to znaczy my nie opisujemy obrazu, widząc go, tylko opisujemy obraz, żeby go otrzymać. Ale to znowu rozwija nasze umiejętności, wiesz, od dekad absolutnie schowane i w ogóle nie będące udziałem jakby szerokiej publiczności, to było dla koneserów, a teraz nagle my jesteśmy wszyscy zmuszeni, żeby nasz opis obrazu, jeśli chcemy uzyskać porządny efekt, żeby on był długi, żeby był pełen szczegółów, żeby miał właśnie te metafory. To jest niesamowite, w sensie jakby tu jest jakaś, wiesz, nadzieja w ogóle językowa dla nas.
Karol
Dlatego powtórzę to już chyba drugi albo trzeci raz podczas rozmowy w podcaście. Czytałem genialne opracowanie o rynku prompt inżynierów w Stanach Zjednoczonych, gdzie było podsumowanie, które brzmiało tak – zgadnij, kto jest zatrudniany jako genialni prompt inżynierowie?
Inez
Filolodzy.
Karol
Blisko – poeci.
Inez
No, połowa filologów to poeci, więc… Tak, ale zobacz, to się dokładnie spina z tym, o czym przed chwilą mówiłaś.
Karol
Umiejętność opisywania rzeczywistości i tworzenia tego obrazu za pomocą…
Inez
Sposób zniuansowany, świadomy, tak, bogaty.
Karol
Bo w innym przypadku wszystkie teksty, które będziemy obserwować w sieci, LinkedIn albo w mediach społecznościowych, będą zaczynały się sformułowaniem „w dzisiejszych czasach”.
Inez
Tak. I to jest swoją drogą też problem wielu w ogóle artykułów na jakikolwiek temat, tak, czy to SEO, czy to artykuły poważniejsze w czasopismach, tak – w dzisiejszych czasach sztuczna inteligencja i tak dalej, i tak dalej. To jest taki pewniak, który się pojawia i który jest skutecznie przez dobrych redaktorów wycinany, ale tak – coś jest na rzeczy.
Karol
Drodzy Państwo, to było jedno z najdłuższych pytań wprowadzających do rozmowy – „99 twarzy AI”. Pozwólcie Państwo, że przedstawię Wam mojego wyjątkowego gościa. Gościnia. Gościnię, przepraszam, z całym szacunkiem.
Inez
Z całym szacunkiem – Inez Okulska. Witam Państwa. Widzisz, ale to a propos tego, co powiedziałeś – nasza precyzja języka będzie miała znaczenie, więc te feminatywy też będą istotne w budowaniu tego komunikatu.
Karol
Dobrze, ale język angielski, z którego zbudowane są w większości modele językowe, tych feminatywów wcale tak dużo nie ma.
Inez
No, one są inaczej ukryte, nie? W sensie możesz dodać, że to jest female albo male, i to ma znaczenie, ma ogromne znaczenie.
Karol
Zawsze się dziwię, jak widzę profile na LinkedIn, gdzie jest dopisane „she, her”.
Inez
No, to jest trochę coś innego, no bo to są zaimki, z którymi się identyfikują ludzie. To jest osobny w ogóle worek, w którym nie czuję się pewnie, więc pewnie nie będę się tam zagłębiać. Ale jeśli chodzi o sam język opisu, nie? No to to dodanie female ma znaczenie i niestety na razie jeszcze pięknie demaskuje skrzywienia tych modeli. Jeden z przykładów, który studentom często pokazuję, jest właśnie przykładem wizualnym, gdzie proszę o wygenerowanie computer scientist, czyli po prostu jest tak powiedziane, że computer scientist w swojej piwnicy siedzący, taki bardzo stereotypowy obrazek przyszłego geniusza i autora jakiegoś fantastycznego startupu.
Karol
Bojówki, sandały, zaraz długie włosy.
Inez
Nie, aż tak źle nie jest. Jest raczej bluza z kapturem i ta piwnica jest tak wypasiona, że wygląda bardziej jak stacja kosmiczna, ale to jakby nie szkodzi. Natomiast ekonomiści piszą po prostu, że computer scientist siedzący w piwnicy „in the cellar” po prostu bez nazwania, to dostaniesz oczywiście mężczyznę, po prostu. Siedzi facet, wygląda przekonująco jak informatyk, super. Jak napisałam specjalnie „female computer scientist in her basement”, to…
Karol
Ta piwnica stała się różowa?
Inez
Nie, nie. To też by bolało, ale może trochę inaczej. Nie, widzimy oczywiście, że jest to rzeczywiście kobieta, no, siedzi przed tym komputerem i w tle widzimy męskie ramię. Jakby ona nie może być sama, ona sobie nie poradzi sama. On mógł być sam, a ona jest możliwa tylko wtedy, kiedy w tle jest jeszcze ten facet.
Karol
Kolejna dygresja, bo chciałem Cię zapytać o Twoje AI story. Mogłabyś opowiedzieć Twoją historię? Jak to się stało, że robisz to, co robisz? Jesteś między innymi redaktorką naczelną magazynu „AI Magazine”, jesteś badaczką, wspierasz społeczność akademicką, uczysz, edukujesz, przekazujesz wiedzę następnym pokoleniom. Jak to się w ogóle stało?
Inez
Badaczką chciałam być zawsze. Tak, rzeczywiście od liceum, na pytanie „kim chcesz być?”, to nie znałam wtedy feminatywów, więc mówiłam „naukowcem”. Trochę nie miałam jeszcze pomysłu chyba w jakiej dziedzinie, ale wiedziałam, że naukowcem. Myślałam, że będę szła w stronę informatyczną, bo wydawało się to coś naturalnego – u nas w domu zawsze było dużo komputerów i dużo pracy w tym zakresie. Też byłam w liceum informatycznym, informatyczno-ekologicznym, żeby było śmieszniej.
Karol
Rozmawialiśmy o tym, że Twój tata wymyślił smart speaker jeszcze dużo wcześniej, zanim się pojawiło.
Inez
Radio na tranzystorach – zanim ono zostało tak upublicznione. Więc rzeczywiście byłam z takiego domu mocno logiczno-technicznego. I myślałam, że to będzie naturalna ścieżka. Ale też byłam z bratem w jednej klasie bardzo długo, no i mój brat naturalnie szedł na informatykę i stwierdziłam, że koniec – muszę zrobić coś zupełnie innego. Więc bardzo profesjonalna, dobrze ugruntowana motywacja, która sprawiła, że skręciłam całkowicie w bok. Poszłam na kulturoznawstwo na Viadrinę we Frankfurcie. No i to były studia niezwykle humanistyczne, to było takie kulturoznawstwo jak w Polsce, tylko takie, że masz główny kierunek – major, minor, że tak powiem, wybierasz. No, u mnie to była literatura, literaturoznawstwo i językoznawstwo. No i to mnie bardzo pochłonęło – poezja, tłumaczenie poezji, wszystko co takie właśnie z językiem, ale nie stricte językoznawcze, tak jak na przykład są, nie wiem, lingwiści komputerowi, absolutnie w ogóle nie w tym kierunku. Tam literatura, narracje, poezja były bardzo silne, więc naprawdę, no, dalej się nie dało od tych komputerów. I tam sobie ta ścieżka się rozwijała, potem poszłam na filologię polską już na kolejny stopień, żeby trochę więcej jednak w naszej polszczyźnie, którą kocham jako w ogóle twór, jako język, móc popracować i pozgłębiać, i też polską poezję. No i co? No i dalej szłam w kierunku tej mojej kariery naukowej, czyli zrobiłam doktorat właśnie z literaturoznawstwa, konkretnie z teorii przekładu literackiego w XX wieku.
Karol
Wow, teoria przekładu.
Inez
Teoria przekładu. Tak, tak, tak. Miałam, no, wymyśliłam swoją, tak. Oczywiście rozwinęłam teorię opartą na tropach i sygnaturach tłumaczy – kosmiczna rzecz. Miałam niesamowity fun. Też dużo pracowałam nad tym w trakcie mojego stażu na Harvardzie, więc też dużo inspiracji takich właśnie amerykańskich.
Karol
A masz swój ulubiony przekład?
Inez
Mam całkiem sporo, i to są albo amerykańska poezja, głównie w przekładzie Piotra Sommera albo Andrzeja Sosnowskiego – polskich poetów fantastycznych, albo z lat 60. mniej więcej francuska literatura Oulipo, to była taka grupa ludzi, którzy właśnie wtedy się fascynowali automatyzacją literatury i utrudniali sobie życie. Czyli na przykład mówili, że teraz będziemy pisali książkę, w której w ogóle nie znajdzie się literka E albo A, albo na przykład będą brali…
Karol
A myślałem, że automatyzacja literatury to jej taka powtarzalność.
Inez
Trochę tak, bo oni też na przykład brali tak, że piszą zdanie i co któreś słowo będą brali ze słownika, odliczali siódme słowo w kolei, czyli nie to, co które chcieli wziąć, tylko następne, i próbowali coś z tym zrobić. Więc to było jak źle działający model, który… Właśnie, nie – jako model o wysokiej temperaturze, który tam zaszalał i wziął siódme prawdopodobne słowo, a nie pierwsze. Więc fascynujące rzeczy. I one były tłumaczone między innymi przez Jana Gondowicza na polski – rewelacja. Także no tak, mam swoje ulubione. Ale wracając, no, pracowałam jako adiunkt w tym temacie, tłumaczyłam, też przetłumaczyłam parę książek literatury z niemieckiego na polski, z angielskiego też trochę, nawet w drugą stronę, poezję nawet zaczęłam tłumaczyć na niemiecki.
Karol
Na niemiecki?
Inez
Tak, na niemiecki. Więc rzeczywiście tutaj myślę, że jest całkiem wysoki poziom odwagi, takiego porwania się na to. I to wszystko było fajnie. Natomiast po jakimś czasie stwierdziłam, że cieszy mnie to wszystko i to jest fajne, i też pracowałam dużo jako krytyk literacki, pisałam w różnych uznanych czasopismach i jeździłam na festiwale, i to było bardzo ciekawe, ale coraz bardziej interesowałam się internetem rzeczy. Jakoś tak po prostu naturalnie przez moją rodzinę, znowu przez mojego brata, tatę, widziałam, że coś takiego jest. Namówili mnie kiedyś, żeby pojechać na InfoShare. I w ogóle bardzo była dla mnie założycielska ta konferencja, bardzo ważna. Zakochałam się w tej atmosferze, w tej nieziemskiej ilości inspiracji, która tam na mnie spadła, spłynęła po prostu, a to było jakieś właśnie…
Karol
Pamiętasz, które wystąpienie Cię tak zainspirowało?
Inez
Nie, już teraz tak jednego wystąpienia sobie nie przypomnę, chociaż pamiętam, że już wtedy się pojawiały takie nazwiska, które mocno kojarzymy, czyli Piotr z Niebezpiecznika, Kamil Kozieł – wiesz, marketing, prezentacje. W sumie taki bardziej inspire stage, może nawet nie bardzo techniczny. Ale też pamiętam, że to expo wtedy było bardzo duże, bo mówimy o roku 2016, więc ja po prostu miałam dosłownie możliwość przejścia się tymi ścieżkami, podotykania tych rzeczy, zobaczenia, co ludzie robią – od małych kół naukowych przez duże firmy. I mnóstwo wtedy był – był wtedy boom całkowity internetu rzeczy, i mój brat też mocno w to wchodził, i namówił mnie na wspólne zrobienie takiego projektu, który wystartował na Kickstarterze, bo to nawet nie był start-up, to był projekt Kickstarterowy. I to były takie małe przenośne radyjka – nie w sensie odbioru muzyki, tylko w sensie transmisji danych, jakby interfejsu. No i mieliśmy taki szalony pomysł, żeby zrobić je estetycznymi. One były w kształcie motylków, które miały połączenie z komputerem, to znaczy do USB można było – taki kwiatek, który się łączył z tym motylkiem – można było mieć taki większy element, który łączył sobie inny interfejs, inne protokoły niż tylko ten radiowy. I on był takim listkiem, który można było wpiąć. Więc po prostu z jednej strony to brzmi strasznie infantylnie, z drugiej strony to było niesamowicie ładne i dużo fanów nam dawało stworzenie tego, żeby zobaczyć, gdzie można postawić granice czegoś, co działa, co jest przydatne w takim modelarstwie domowym, bo to tak trochę było dla fanów Raspberry Pi i Arduino mniej więcej, a wtedy to był absolutny boom na to, żeby taką domorosłą automatyzację robić – właśnie internet rzeczy spod znaku takich prostych rozwiązań, ale sprzedając właśnie ten element taki kreatywny, elegancki. Ten Kickstarter miał naprawdę niezły wynik, bo udało nam się to 700 osobom – jakby skutecznie zaproponować.
Karol
Co przy tak niszowym rozwiązaniu rzeczywiście było świetnym wynikiem.
Inez
I wiesz co? Napisała o nas „Elektronika Praktyczna”, i strasznie mnie to cieszyło bardzo, że mamy swoje zdjęcie.
Karol
A ja myślałem, że powiesz „The Wired”.
Inez
Nie, właśnie wiesz, ta „Elektronika Praktyczna” to było coś, co mój tata od lat czytał i prenumerował, więc znalezienie się tam to było takie: okej, jakby ktoś nas uznał, że nie jesteśmy tylko ładni, ale też, wiesz, technicznie sprawni. I to było super, tylko że pisali o nas też inni dziennikarze, zawsze podkreślając, że mój brat jest mózgiem tego projektu, a ja, nie wiem, twarzą czy coś, kwiatuszkiem. No i jakby się trochę wtedy zirytowałam, pomyślałam sobie: „Hej, ja też mogę być mózgiem takich projektów technicznych”. Poza tym bardzo mi się spodobało po prostu to, co robimy. Gdzieś może nastąpił przesyt tej mojej poezji, no bo w końcu ile można było – tam po dziesięciu latach poczułam, że doszłam do ściany. I przyszedł taki pomysł szalony, że a gdybym poszła jeszcze raz na studia, bo ja w ogóle jestem uzależniona od uczenia się i studiowania, i lifelong learning to jest w ogóle moje drugie imię. I jakbym mogła, to bym nieustająco była na studiach. Zresztą jeszcze nie powiedziałam ostatniego słowa, mam jeszcze na oku różne akcje. No i co? I postanowiłam pójść na automatykę. Automatykę i robotykę na Politechnice Warszawskiej. Poszłam z ulicy na jakieś laboratoria. Byłam tam jedyną dziewczyną, więc natychmiast mnie wpuścili i powiedzieli: „Nie, no jasne, usiądź, zobacz, jak jest”. Coś, co wydaje się dzisiaj niemożliwe, bo te wszystkie przecież zajęcia są pozamykane w jakichś usosach, nawet nie można zobaczyć, gdzie się co odbywa. Wtedy to był jakiś ostatni moment, kiedy można było w internecie banalnie zobaczyć na przykład, w jakiej sali jakie zajęcia o jakiej godzinie są. Więc chwała za to internetowi. No i co? No i poszłam po prostu, rozpoczęłam ścieżkę przekonywania wszystkich decydentów, żeby mnie przyjęli, co było bardzo trudne, bo nie miałam nawet matury z matematyki, bo moje roczniki nie miały obowiązkowej matury z matematyki, więc miałam całkowicie humanistyczną maturę. Więc pan dziekan ówczesny załamywał ręce, że to jest po prostu nierobialne, żeby chciała, ale to nierobialne. Finalnie dogadaliśmy się, że jak uda mi się przekonać wszystkich ważnych po drodze, to on będzie na tak. I to jest zawsze piękna opowieść o tym, że właśnie jak potrafisz w komunikację, potrafisz w używanie języka, to możesz wszystko. No i teraz dzisiaj jesteśmy w tym momencie, gdzie jest to szerzej dostępna możliwość. Ale tak, to rzeczywiście tak zadziałało. No i co? Skończyłam te studia zafascynowana robotami, robotyką i automatyką. Pracę pisałam o komforcie, o systemie komfortu cieplnego. Wymyśliłam jakiś taki własny system, który angażował człowieka.
Karol
Komfort cieplny, który odczuwają maszyny czy ludzie?
Inez
Nie, ludzie, ludzie. Nie, tam było bardzo proludzkie, to było właśnie… To było ciekawe również z tego względu, że ja do dzisiaj, jako że przeskakuję między tymi dziedzinami, nie wiem, że czegoś nie można. Jakby na tyle jestem jeszcze niewygrzana często w tych technicznych dziedzinach, że po prostu nie ma czegoś takiego, że „tak się nie da”, no bo dlaczego nie? I po wielokroć okazuje się, że to jest dobre, nie? No bo po prostu nie masz ograniczeń.
Karol
Ale wiesz co, przepraszam, taka myśl, która chodzi mi cały czas po głowie, słuchając ciebie. Rozmawialiśmy o tym ostatnio z Marcinem Sawickim, z którym wspólnie pracujemy. Marcin jest z wykształcenia socjologiem, dziennikarzem od prawie 20 lat. I ja obserwując jego umiejętności absorpcji wiedzy połączonej z genialną komunikacją i z tym doświadczeniem dziennikarskim, doszedłem do wniosku – i Marcin się z tym zgodził – rzeczywiście, że teraz technologami będą humaniści.
Inez
Trochę tak.
Karol
Nie mówię, że tylko i wyłącznie humaniści, bo technolodzy sami w sobie też będą potrzebni, ale po to, żeby tłumaczyć światu, w jaki sposób wykorzystywać, przekładać…
Inez
Właśnie. Myślę, że interfejsem będą, mocnym interfejsem będą humaniści i przede wszystkim już nawet nie są zaproszeni do stołu, tylko są nieodzowną częścią tego stołu, i to jest tak ogromna różnica. No bo jakby wiadomo – technolodzy, matematycy… Ja mam ogromne, jakby, no, kocham matematykę.
Karol
Do tej pory nie rozumiem rachunku różniczkowego.
Inez
Wiesz co, ja wciąż mnóstwa rzeczy nadrabiam w tej dziedzinie, idę z ogromnym zygzakiem, to znaczy z jednej strony właśnie potrafiłam zrobić kurs analizy czy jakieś głębokie algebry, z drugiej strony cofać się i jakieś nadrabiać jakieś podstawy, więc tu jest jeszcze sporo do zrobienia. Ale mam jakby mnóstwo takiego podziwu, szacunku, i w ogóle jest dla mnie to czymś niesamowicie pięknym – matematyka, ale przede wszystkim właśnie algebra liniowa, która wiesz, jakby naprawdę stoi mocno za tym, co się teraz dzieje w sztucznej inteligencji. Więc myślę, że i patrząc na to, co potrafią zrobić z tymi modelami, ze zrozumieniem tych modeli ci, którzy rozumieją to, co się dzieje w tych macierzach, no to myślę sobie, żebym tak szybko ich na emeryturę nie wysłała.
Karol
I rozumieją, a potem, jeżeli potrafią to przekazać w zrozumiały sposób.
Inez
No, dlatego właśnie ten interfejs jest niezbędny. Wydaje mi się też, że przede wszystkim kiedyś ten podział na humanistów i niehumanistów trochę wynikał ze sposobu uczenia. Mieliśmy taki archetyp matematyka, matematyczki, którzy są surowi i bardzo szybko dzielą klasę na tych, którzy rozumieją, i na idiotów, nie? Przepraszam, ale wiesz, o co chodzi.
Karol
Ja tego nie rozumiałem, ale siedziałem w pierwszych ławkach.
Inez
Jeszcze taki duży – to niezły wybór. No, ale wiesz co, i to chyba polegało na tym, że wiele umysłów, które absolutnie mogły zostać zaproszone na tę imprezę matematyczną, zostały za drzwiami ze względu na jakby siermiężność nauki. A teraz, ponieważ mamy właśnie te modele, które są w stanie jakby tutorować cię, uczyć cię, kiedy chcesz, jak chcesz, i tłumaczyć ci do upadłego, jak czegoś nie rozumiesz, to to mi się wydaje fantastyczne, że jakby nie musimy mieć takich humanistów, którzy są całkowicie, wiesz, odcięci od tego. Nie muszę wchodzić głęboko, bo nie chodzi o to, żeby oni sami, wiesz, mnożyli te macierze, ale że mają szansę na o wiele większe zrozumienie tego, co się tam dzieje.
Karol
Taka interdyscyplinarność na wielu różnych poziomach.
Inez
Tak. Że jakby masz suwaczki poprzesuwane, czyli z jednej strony technolog, jakby inżynier, matematyk, są w stanie… trochę, że tak powiem, socjalizować, schumanizować bardziej, bo mogą sobie z tymi modelami porozmawiać, nawet muszą, więc ćwiczą tę komunikację, wiesz, to, nie wiem, jakby przekazywanie właśnie konceptów, bo inaczej też nie pójdą dalej z tym modelem. Więc oni idą w tę stronę troszkę, że jakby mają swój major, że tak powiem, w tej części technicznej, ale wysuwają się w stronę humanistyczną, a humaniści z kolei mają szansę dopytać, dopytać, zrozumieć i jakby nie zostawać na takim poziomie, że: „O Jezu, wzór – to nie, to w ogóle, to ja nie wiem”. Bo kocham ten moment, że ja na przykład do dzisiaj mam problem z zapisem takim stricte, wiesz, formalnym, matematycznym, konceptów, które w pełni rozumiem, żeby to nie jest mój język zapisu myślenia.
Karol
Dla?
Inez
Wszystkie rzeczy, które dotychczas studiowałam, szybciej, lepiej rozumiem, kiedy opowiadam je sobie słowami i z kimś je opowiadam słowami, niż kiedy wchodzę stricte w sam zapis matematyczny. Żeby czytanie też tego, jak zobaczę po prostu zestaw równań, no to będę je czytała trochę tak oczami, wiesz, jakby nie poczuję tego jeszcze tak do końca. Czasem tak, ale… Jakby wiadomo, to wymaga treningu i wejścia w głębiej i tak dalej, więc tak z biegu jeszcze tego nie mam. Natomiast jak po prostu zamienię to na słowa, na powiedzenie, co się tam wydarza, to jestem w stanie bardzo skomplikowane koncepty zrozumieć i dokładać swoje cegiełki również odkrywcze do tego, pod warunkiem, że zostaniemy na etapie właśnie komunikacji innej niż formalna, tak w tym rozumieniu. I dlatego uwielbiam synergię, jaką mamy z mężem, bo Michał – matematyk z krwi i kości, wielki fascynat tej dziedziny, jest jednocześnie właśnie, ma w sobie dużo tego wątku humanistycznego, jest fantastycznym interfejsem, jeśli chodzi o wychodzenie z tej pieczy matematycznej. I potrafiliśmy niejedną fantastyczną dyskusję prowadzić właśnie w ten sposób, że on był w stanie mi przetłumaczyć jakby na język po prostu na język skomplikowane rzeczy i byliśmy w stanie pociągnąć bardzo merytorycznie ciekawie dalej te dyskusje. I na przykład napisaliśmy kiedyś razem artykuł – jakiś drobiazg, tak, tam chodziło o optymalną alokację zasobów na maszynach wirtualnych itd., ale to było możliwe dlatego, że właśnie weszliśmy w tę rozmowę w języku. Ja wymyśliłam rzeczy, które finalnie weszły tam jako element algorytmu, ale dlatego, że opowiedziałam je w języku, a on je zapisał formalnie.
Karol
Dobrze, a Michał wykorzystuje język skomplikowany, wysokopoziomowy, czy prosty i zrozumiały dla przeciętnego Kowalskiego?
Inez
Wiesz co, jak naciśniesz właściwe przyciski i poprosisz, to będzie prosty. Z defaultu oczywiście będzie, wiesz, w tym świecie, w którym się akurat znajduje. Tak, ale jakby jak najbardziej potrafi. On też fantastycznie tłumaczy dzieciom koncepty skomplikowane, i to jest chyba najlepszy papierek lakmusowy na to, czy potrafimy opowiedzieć coś prosto.
Karol
Kolejny eksperyment, który ostatnio zrobiłem, który genialnie modele językowe realizują, to poprosiłem, żeby model językowy wytłumaczył zagadnienie cukrzycy ośmiolatkowi, piętnastolatkowi, dorosłemu albo dorosłemu z doświadczeniem medycznym – lekarzowi. Polecam wszystkim, zróbcie sobie ten eksperyment. Gemini 2.5 – genialne wyniki.
Inez
Mam nadzieję tylko, że lepiej klasyfikuje wiek w sensie poziomu niż wiek, kiedy prosisz o generowanie ludzi w konkretnych przedziałach wiekowych, bo tamten wiek średnio jeszcze działa. Wszystkie panie w wieku lat 30 wyglądają jakby miały 50, nie?
Karol
A trochę to nie odzwierciedla czasami naszej rzeczywistości?
Inez
No proszę cię, czy 35-latki wyglądają jak 50-latki? Nie. Ja myślę, że w drugą stronę – że jakby 50-latki były generowane jako 35-latki, to byłoby to bardziej…
Karol
Nikt by nie miał nic przeciwko.
Inez
To raz, ale dwa, to by chyba bardziej odpowiadało temu przynajmniej, co można zgarnąć z internetu.
Karol
Wracając – sztuczna inteligencja i dygresja. Drodzy Państwo, robotyka. Skończyliśmy na tym, Inez.
Inez
Tak, na robotyce.
Karol
A gdzie się pojawiły modele językowe?
Inez
W NASK-u się pojawiły, bo moja pierwsza praca po tych studiach, właściwie jeszcze na tych studiach, właśnie była w NASK-u. W ogóle zaczęłam od czegoś zupełnie innego, od bycia product managerem, czyli, wiesz, zupełnie jeszcze nie technicznie i nie na temat. Ale przez to, że tam byłam w sumie przez pół roku na tym stanowisku i byłam odpowiedzialna za kontakty z pionem badań i rozwoju, no to bardzo szybko mogłam zobaczyć, co się tam wydarza, wiesz, takie mięso badawcze sobie obejrzeć, bo moim zadaniem między innymi było dosłownie rozmawianie – właśnie miałam być takim interfejsem, miałam rozmawiać z tymi badaczami i jakby… Przekładać na ludzkie to, co oni robią, wyciągać im po prostu z gardła to, co oni robią, te badania, bo naprawdę siedzieli i robili fajne rzeczy, ale często nie potrafili o tym opowiedzieć. A ja już będąc po tych studiach byłam w stanie zrozumieć, co do mnie mówią, a że wciąż byłam humanistką, to byłam w stanie napisać o tym, co potrafią, więc to był taki pierwszy moment. Więc bardzo żałowali wszyscy, jak powiedziałam, że chcę odejść z tego.
Karol
Rzadka umiejętność, w sensie pytać, potem to tłumaczyć. Skoro mówisz, że masz doświadczenie tłumacza, to zobacz, że wykorzystujesz je teraz na innym polu, czyli tłumaczysz skomplikowane koncepcje na prosty, zrozumiały język.
Inez
To jest jeden z aspektów, który myślę, że się przydaje, czyli właśnie z polskiego na polski, tylko z jednego levelu na inny. Ale druga sprawa, to jest to, co mnie tak fascynuje, to są w ogóle sposoby reprezentacji danych, bo to jest tłumaczenie z jednego – tak – z formatu z języka naturalnego na język wcale nienaturalny, ale równie ciekawy. Dlatego ja nigdy do końca się nie godzę z tą hegemonią wektorów embeddingów, które są takie magiczne. Wrzuciliśmy bardzo dużo danych do modelu, z tego wyszły wagi, nie jesteśmy w stanie nic z nimi zrobić, ale one takie są. Trochę mnie zawsze smutno, że tak późno weszłam do tego tematu NLP, dosłownie takie dwa lata, trzy może maksymalnie, kiedy jeszcze byliśmy na etapie powiedzmy word2vec-ów, jakiś takich prostszych reprezentacji, które były bardziej zrozumiałe, i w ogóle kombinowania z reprezentacjami, które są bardziej zrozumiałe – stąd te moje reprezentacje stylometryczne. Stylometrics i wiesz, próby zamiany tekstu na właśnie wektory, które będą całkowicie zrozumiałe dla człowieka, żeby ta interpretacja była możliwa. No ale bardzo szybko weszły po prostu bardzo duże modele, które to zmiotły, nie? Skoro się okazały dobre i działające, to przestaliśmy pytać „ale dlaczego?”. A ja uwielbiam pytać „ale dlaczego?”, „ale co jest w tych danych, dlaczego one tak działają?”.
Karol
Pytać „dlaczego” i kwestionować, czy po prostu pytasz „dlaczego”, bo chcesz zrozumieć?
Inez
Wiesz co, chyba nie mam natury marudy w sobie aż takiej, żeby tak po prostu, wiesz…
Karol
Nie, ja to, wiesz co, mówię w pozytywnym znaczeniu.
Inez
Wiem, o co ci chodzi.
Karol
Bo kwestionować po to, żeby, wiesz…
Inez
Też, wiesz, to byłby pewnie taki mindset typowy matematyka, czyli że najpierw próbujesz dowieźć, że jakby poprzez niemożność, poprzez znalezienie słabego punktu dowodzisz, że tak się nie da, albo że to nie działa. No to nie. To ja aż tak się nie drążę w stronę. Natomiast no po prostu raczej pytać, co się wydarzyło. Dlaczego doszliśmy do tego miejsca, w którym jesteśmy, co tam się zadziało. Dlatego ja na przykład uwielbiam, kiedyś kiedy robiliśmy eksperymenty, czy wcześniej w NASK-u, teraz na Politechnice, jakiekolwiek z modelami – wcześniej, nie wiem, klasyfikacji, teraz bardziej te reagowe. To ja uwielbiam ten moment czytania logów po eksperymencie, czyli naprawdę wchodzenia głęboko w wyniki, czyli jakby ta tabelka z wynikami, z numerami, to jest jedno. No można po prostu powiedzieć: „Okej, wyszło nam dobrze, albo wyszło nam średnio, podkręćmy coś”.
Karol
Czyli chcesz zrozumieć, w jaki sposób funkcjonuje model.
Inez
Tak, dokładnie. Wiadomo, że to jest takie trochę post-factum, takie zewnętrzne, behawioralne trochę próba, wiesz, odczytania tego, co się wydarzyło już tylko po artefaktach, po produktach na końcu. Ale bardzo to lubię, bo naprawdę często bardzo dużo rzeczy ciekawych tam wychodzi. Takich, no właśnie, kurczę, na wyciągnięcie ręki. Czyli na przykład nagle się okazuje, że jak przyjrzysz się danym, na przykład przy okazji takich ragów, że widzisz, że, kurczę, prosty podział na czanki, na te fragmenty mniejsze do bazy, nie zadziałał tak, jak powinien, i to na bardzo prostym poziomie, na przykład podziału na zdania, że coś wyszło nie tak. To nie są odkrywcze rzeczy w sensie nowych teorii, ale to są takie rzeczy, które ci fajnie pokazują, że: „Hej, nie kręćmy w ciemno, tylko zadajmy sobie pytanie, co się wydarzyło, spójrzmy głęboko i wróćmy świadomie i zróbmy coś, co wynika…”.
Karol
Tak samo jak model słabo sobie radzi z podziałem na sylaby.
Inez
Tak, bo sylaby i liczenie liter też mu średnio wychodzi, prawda, jak w tym słynnym przykładzie z truskawką.
Karol
Chociaż ostatnio czytałem o fajnym sposobie, jeżeli chodzi o dzielenie liter, z wstawianiem po każdej literze jednej liczby.
Inez
Wiesz, jakby sposoby obejścia są jak najbardziej. Fajnie też później finalnie nie zaśmiecić tego tekstu, żeby on był jeszcze semantycznie zrozumiały. Natomiast z tym podziałem na zdania na przykład w polszczyźnie jest rzeczywiście duży problem, jak pracujemy z jakimiś dokumentami takimi formalnymi, formalnoprawnymi, wiesz, jakieś takie dokumentacje, ustawy, takie rzeczy, to pod względem składniowym takie dokumenty są koszmarne.
Karol
Bo nie są pisane naszym naturalnym językiem, którym się komunikujemy, tylko językiem formalnym.
Inez
Wiesz co, nawet nie. On jakby wiadomo, że jest bardziej ten styl urzędowy, ale nawet on sam w sobie nie jest takim problemem. Problemem jest rzeczywiście składnia. Składnia, czyli to, że na przykład nagle jak zobaczysz sposób zapisu podpunktów kolejnych w paragrafie jakimś tam, to okazuje się, że to zdanie de facto sięga całą stronę.
Jakby sięga całej strony. Ono się kończy razem ze stroną, a czasami przechodzi na następnej, bo masz te podpunkty powymieniane, pomiędzy nimi masz cholera średników, czasami masz po prostu światło, które w ogóle nie kończy się żadną interpunkcją, i nawet nie powinno, bo w sumie to wszystko się łączy w jedno. I taki biedny model jest bez szans. To jest po prostu dramat. One oczywiście radzą sobie z tym na różne sposoby, ale jeśli chciałbyś właśnie zrobić to w sposób bardziej niesiłowy, tylko bardziej interpretowalny, jakby pójść krok po kroku, używając bardzo fajnych modeli językowych, ale takich, którymi rzeczywiście jakby… No, świadomie sterujesz, czyli wiesz, co robisz, czyli na przykład właśnie na poziomie składniowym zostajesz i tam coś analizujesz, to rzeczywiście jest to duży problem. Plus skrótowce, no niby możesz tokenizację personalizować i dokładać tam różne elementy, ale to kurczę zawsze się gdzieś wysypuje na tym, nie? A jeszcze do tego dodasz na przykład OCR, czyli prawdziwe piekło produkcyjnych danych, że dokumenty zostały, prawda, zeskanowane, zacierowane, no to już w ogóle masz taki śmietnik, że podział tego na właściwe zdania – XXI wiek – duży element, to jest nadal jakiś problem, ale też dlatego, że nie wszystko chcesz robić dużym modelem, no bo wiadomo – koszty i jakby stabilność tych rzeczy.
Karol
A propos rozmowy o mniejszych modelach, jakiś czas temu rozmawialiśmy z Sebastianem Kondrackim – Bielik. Ty pracowałeś przy Plumie. Powiedzmy zatem słuchaczom, czym tak naprawdę jest model językowy?
Inez
O kurczę. Mały, duży, średni czy jaki?
Karol
Wiesz co, spróbujmy opowieścią dla cioci.
Inez
Opowieść dla cioci. Model językowy to jest tak naprawdę, co? Zestaw dobrze opisanych relacji pomiędzy słowami, pomiędzy znaczeniami.
Karol
Ale co chciałem, żebyśmy to rozłożyli na drobne? Zobacz, bo mamy model językowy, gigantyczna ilość danych, które trzeba zebrać, opisać, uporządkować, tak żeby te skojarzenia się w odpowiedni sposób budowały.
Inez
Tak, wiesz co, no bo modele językowe były różne, nie? Były modele językowe, które rzeczywiście powstawały w ten sposób, że rzesze anotatorów ludzkich anotowały, czyli zaznaczały na tych kolejnych fragmentach korpusu, zdaniach, na przykład właśnie elementy składniowe – dosłownie: „To jest, nie wiem, podmiot, orzeczenie, coś tam”. „To jest rzeczownik, czasownik”. I na podstawie takich gigantycznych korpusów zaanotowanych w ten sposób, albo na przykład fleksja, jakaś tam odmiana, czasy – wszystko, co byśmy chcieli, to bywało anotowane. I tak były robione te pierwsze modele – bardzo dobre zresztą i takie właśnie interpretowalne, takie zrozumiałe. One też mają swoje minusy, ale jednak działały.
Karol
Wróćmy do budowy tych modeli.
Inez
Do budowy tych modeli. Mamy dane.
Karol
Co z tymi danymi dalej się robi?
Inez
Te dane, no to właśnie wrzucamy do dużego modelu, który próbuje właśnie znaleźć pomiędzy nimi te relacje. I ja tutaj najbardziej lubię to porównanie właśnie do człowieka albo do dziecka, albo do człowieka, który wyjechał do innego kraju i jest otoczony innym językiem, nowym.
Karol
I szuka znaczenia na podstawie skojarzeń?
Inez
Na podstawie skojarzeń, na podstawie kontekstu. Człowiek mały czy duży będzie miał oczywiście zmysły, będzie miał trochę inny nasłuch tej rzeczywistości, odbiór tej rzeczywistości. Ale tak czy inaczej, chodzi o to, że to jest nieustające mapowanie relacji. Przyczynowo-skutkowych, sąsiedztwa różnych elementów, że one po prostu się pojawiają ze sobą. Jak ktoś mówi „dzień”, to prawdopodobnie powie „dobry”, no i tak dalej. Oczywiście na takim małym poziomie, ale też sytuacyjny, że ktoś wchodzi w ogóle i się widzi, wita na trzy różne czy pięć różnych sposobów. Jak się żegna, to ma jakieś tam trzy inne warianty. Jak się coś podaje, to „proszę, dziękuję” i tak dalej. Od nawet najprostszych rzeczy zaczynając. Ale to jest takie właśnie mapowanie mnóstwa sytuacji, w których zaczynamy rozumieć, jak te elementy ze sobą współgrają i jesteśmy wtedy w stanie się poruszać w tym języku w sposób, który będzie adekwatny, oczekiwany i zrozumiały dla drugiej strony. I specjalnie używam takich słów, bo to nie do końca znaczy, że będziemy my w pełni rozumieli w takim poczuciu, że będziemy mieli takie uwewnętrznione rozumienie tego języka, ale będziemy w stanie nim skutecznie operować. I ja trochę miałam to doświadczenie, jak byłam na studiach, bo pojechałam na studia, jak wchodziłam do Niemiec od razu po maturze. I na tym kulturoznawstwie mieliśmy też takie aspekty filozofii, a język niemiecki jest literalnie językiem filozofii.
Karol
I dlaczego?
Inez
Tak, tak się mówi o nim, ale jakby też z racji tego, że wiele wybitnych filozofów było niemieckojęzycznych. Ale chodzi o pewną precyzję tego języka, że właśnie do pojęć filozoficznych, abstrakcyjnych, niemiecki może się nie wydawać, ale jest właśnie dokładnie tym językiem. I to nawet widać, że nawet po angielsku na przykład…
Karol
Ja myślałem, że to łacina.
Inez
No wiesz, ona jakby dawała fundamenty, ale jakby w tej powiedzmy późniejszej filozofii, no to już ten niemiecki mocno, mocno się zarysował. I to nawet widać, że wiele elementów jest przejmowanych nawet do języka angielskiego po prostu jeden do jeden, że nie masz szans znaleźć odpowiednika, gestalt na przykład, no to jakby gestalt po niemiecku to jest taki koncept, którego właśnie… Nie znajdziesz go tłumaczenia po prostu, to jest taka mieszanka. Trochę japoński jest podobnym językiem, że są takie koncepty, które wyrażają taki zestaw elementów ze sobą powiązanych, że nie masz szans tego zastąpić jednym słowem, musiałbyś dwadzieścia słów użyć, żeby powiedzieć, o co chodzi. No i właśnie niemiecki jest takim językiem. Więc jak przyjeżdżasz, mając lat 17, i zaczynasz studiować filozofię języka, między innymi jeszcze dodatkowo, żeby w ogóle utrudnić poziom zamotania, i uczysz się od razu w tym języku… Nie było sensu, żebym ja te rzeczy, których się nauczyłam, czy jakby notatki, jak robiłam na studiach, żebym ja je tłumaczyła ze słownikiem, no bo ten słownik nic mi nie dawał. Jakby nie mieliśmy tych słów tak czy siak. Więc ja się nauczyłam pisać sobie w notatkach te słowa i opowiadać je definicją już w – po niemiecku – bo to było możliwe jakby w tym języku. I później kolejne słowo, kolejne, kolejne, kolejne, i zauważyłam, że to jedno słowo wyjaśniam definicją, która zawiera jakieś słowo, potem następne jakoś i połączona, i ona się zaczyna w jakimś momencie, no, nie zapętlać, ale jakby się, czyli jakby do tego słowa potrzebujesz innego, a do innego tamtego, a do tego z powrotem tego poprzedniego.
Karol
I zaczynasz rozumieć, jak używać tych słów.
Inez
Nie co one znaczą w sensie takim właśnie słownikowym, tylko dosłownie jak ich używać. I ja się nauczyłam właśnie, na przykład hermeneutyka – zawsze się śmiałam – to było takie słowo, które fantastycznie potrafiłam użyć odpowiednio w kontekście, do dzisiaj nie czuję, co to znaczy naprawdę, w sensie jakby wiem, jaka jest filozofia za tym stoi i tak dalej.
Karol
To wyjaśnijmy, czym jest hermeneutyka?
Inez
No właśnie nie, bo jakby nie jestem w stanie tego wyjaśnić w słowach, musiałabym, nie wiem, chyba zacząć po niemiecku to opisywać, ale to chyba też mam jedną kawę za mało teraz, żeby sobie sprzed 15 lat to przypomnieć. Natomiast po prostu pamiętam to wrażenie, że jakby to było coś takiego, że ten koncept nigdy się nie uwewnętrznił. Ale byłam w stanie go używać. Więc byłam wtedy modelem językowym, który fantastycznie imituje wypowiedź językową, która satysfakcjonuje i przekonuje odbiorcę, mimo że ja jakby nie czułam tego. I oczywiście tutaj sobie trochę żartuję, no ale tak jest, że te modele wiadomo nie myślą, nie czują, ale fantastycznie operują tym językiem dlatego, że nauczyły się właśnie bardzo dobrze w kontekście używać tych określeń w stopniu bardzo złożonym, no bo jak dostaliśmy bardzo dużo danych i gigantyczne rozmiary tych modeli, no to one po prostu robią rzeczy niesamowite, ale gdzieś w środku to jest nadal umiejętność fantastyczna żonglowania odpowiednio tym językiem tak, żeby on dokładnie właśnie – żeby pasował do kontekstu i żeby to mapowanie się zgadzało, te relacje się zgadzały.
Karol
Rozmawialiśmy ostatnio z profesorem Jackiem Santorskim a propos modeli językowych, sztucznej inteligencji, i pięknie to podsumował, że model językowy jest głuchy i ślepy, nie ma uczuć, nie potrafi budować relacji, a największa siła leży w duchu i budowaniu tych relacji przez ludzi właśnie.
Inez
No, to wiadomo. Jest taki nurt humanistyczny bardzo teraz, który jest bardzo ważny, bo nie chcemy poczuć, że zostaliśmy zdarci ze wszystkiego i że teraz po prostu maszynki myślące w sekundę nas zjedzą i nas przechytrzą w każdej… W każdej dziedzinie. Do wychowania dzieci, przytulenia ich i opieki nad ludźmi starszymi tak naprawdę, żeby wziąć dwa najprostsze przykłady wymagające tych właśnie emocji, tego zrozumienia ducha i tak dalej, nadal będziemy potrzebowali ludzi, i to jest piękne. Zresztą myślę, że do wielu innych rzeczy. Ale…
Karol
Ale moja koleżanka prowadziła badania w Stanach Zjednoczonych na temat wykorzystania smart speakerów w domach osób starszych i okazywało się, że ich komfort życia, poczucie dużo mniejszej samotności i spełnienia jest dużo, dużo wyższe w przypadku, kiedy taki smart speaker jest w domu i można się do kogoś…
Inez
Tak, wiesz co, to nawet w ogóle dużo osób, ostatnio Jesse Einzmerg mówił o tym, że on bardzo lubi rozmawiać z czatem, bo on w ogóle jest samotną osobą, w zasadzie tak jakby samotną duszą, i tak sobie rozmawia z tym czatem codziennie i z nim dyskutuje i w ogóle, mimo że powiedział, że kreatywnie mu w ogóle nie pomaga, że ma tak beznadziejne pomysły, że w ogóle napisanie scenariusza z tym czatem jest niemożliwe, ale fantastycznie mu się rozmawia, i on w ogóle już jakby to jest jego kompan na życie. Więc myślę, że wielu z nas tak ma. Ale jedno nie wyklucza drugiego, bo możesz mieć smart speakera dla osoby starszej, ale finalnie ten smart speaker nie pomoże mu, kiedy on upadnie, ten człowiek, albo będzie czegoś potrzebował fizycznie.
Karol
Jasna sprawa. Mało tego, smart speaker najczęściej… Zobacz, porównajmy sobie możliwości smart speakerów – Alexy, Google Assistanta – sprzed pięciu, sześciu lat, które wtedy wydawały się być czymś genialnym, fenomenalnym. „Hej, włącz mi moją ulubioną muzykę” i „która jest godzina”. No i niestety, ale na tym się skończyło.
Inez
To jest w ogóle cały problem internetu rzeczy, że jakby technologia wyprzedziła potrzeby. I trochę czasami jesteśmy w tym miejscu mam wrażenie teraz. I tutaj skręcamy w stronę też dla mnie bardzo ważną, którą staram się gdzieś tam właśnie przemycać, jak mogę. Uwielbiam badania naukowe, uwielbiam progres, uwielbiam postęp i szukanie, odkrywanie nowych rzeczy i technologii. Ale jak chcemy z tym wchodzić komercyjnie, to ja jestem za tym, żeby zawsze najpierw zapytać, gdzie jest problem, co rozwiązujemy, czyj problem, a dopiero później jak chcemy to rozwiązać i jaka jest nam do tego potrzebna technologia, bo być może wcale nie jest to AI, wcale to nawet nie jest internet rzeczy, tylko, nie wiem, jakiś super prosty sterownik zero-jedynkowy albo coś w tym stylu, albo zupełnie coś innego.
Karol
Ale wiesz co, ja się śmieję, bo to jest dokładnie ta sama historia ze smart home.
Inez
No właśnie, to mam na myśli, tak, że tam było mnóstwo możliwości, które były po nic.
Karol
Jest, o ile dobrze pamiętam, albo 60, albo 600 milionów urządzeń w Stanach. Chyba 60 milionów urządzeń Alexa w domach. Dużo łatwiej jest włączyć światło, po prostu klikając jeden guzik na ścianie, niż mówić: „Hey Alexa, turn the light on”.
Inez
Tak, wysiłek, który musisz włożyć w ten rodzaj interfejsu, jest o wiele większy również dlatego, że mamy ciągle jeszcze pamięć mięśni i każdy z nas jak wchodzi do pomieszczenia, to naturalnie klepie ścianę. I ja pamiętam to doświadczenie w hotelu właśnie takim hop do przodu, w którym zdjęto włącznik ze ściany, i naklepałam się tej ściany po całej długości, a tam nic.
Karol
Czytałem chyba artykuł dokładnie o tym hotelu.
Inez
No właśnie. I wchodzę, i dopiero się okazało, że gdzieś na środku tego pomieszczenia była możliwość dotknięcia czegoś, mianowicie tabletu, który potrzebował tak… trzech stopni zagnieżdżenia w menu, żeby dojść do tego światła. Natomiast świetnie działał na pospolite polskie pozdrowienie z lekką stroną, lekko skręcającą w stronę nieformalnego. Więc jak już się zirytowałam i powiedziałam, co sądzę, to nagle światło się zapaliło. Więc ktoś albo miał dobry dowcip, albo wystarczyło powiedzieć cokolwiek, żeby się zapaliło. Natomiast to nadal nie był sposób, którego byłam przekonana. Prowadziłam kiedyś zajęcia przez chyba dwa lata na Politechnice Warszawskiej właśnie dla młodych inżynierów. Chodziło o takie projektowanie właśnie w duchu design thinking. I to od czego zaczynaliśmy, studenci mieli wymyślić pomysł na taki niby start-up fikcyjny, technologiczny, ale automatyczny, bo to byli studenci z automatyki stricte. No i dziwili się, jak przez właśnie pierwsze tygodnie rozmawialiśmy o tym… Co jest tym problemem? Czy na pewno to jest problem? Czyj to jest problem? Oni mieli tworzyć, robić takie wywiady, tworzyć persony, sprawdzać, co się dzieje na rynku pod tym kątem, czy to istnieje, jakie były opinie ludzi, bo może właśnie im się wydaje, że na przykład osoba starsza czegoś potrzebuje albo dzieci, a jakby finalnie ci ludzie tego w ogóle nie potrzebują, i to jeden inżynier z drugim inżynierem myśleli, że tak jest. I to jest klasyka gatunku. I zaczynali często, to była bardzo fajna taka podróż, bo to tam trwało kilka miesięcy ten przedmiot, i zawsze było widać jakby ten, wiesz, ten punkt startowy – na entuzjazm. Na końcu też był entuzjazm, ale innego rodzaju, bo oni już widzieli, że ten projekt się spina, że on rzeczywiście ma jakieś ręce i nogi, ale było często widać, jak bardzo technologia się tam zmieniła, jak zmienił się zestaw w ogóle potrzebnych funkcji, że nagle z fajerwerków, które robią nic… Ale na pytanie „dlaczego je zrobiliście?” – „bo można, bo da się”. No, super, że się da, tylko powiedz: „No, cholera, to jest komu?”.
Karol
O co?
Inez
Tak. Więc nagle się okazywało, że w sumie prostsze rozwiązania, ale dobrze ugruntowane, przemyślane, zbadane, tak, w rozumieniu tych ćwiczeniowych badań, no, miały sens, i tam kilka z tych pomysłów naprawdę było takich, że jak kończyliśmy te zajęcia, to mówiłam: „Słuchajcie, szukajcie inwestora, bo to brzmi jak pomysł na start-up naprawdę, i teraz taki już, że możecie ten pitch przygotować, bo jakby macie konkretne podstawy, to jest po coś. To nie jest sexy technologicznie, ale jest po prostu potrzebne, rozwiązuje jakiś realny problem, nie?”. Więc to jest zawsze problem tej ambicji, że coś ma być… Tak samo z klientami na przykład, nie? Przychodzą do ciebie, mówią, że chcą, nie wiem. „AI mi ma zrobić”, kocham to. „Tutaj chcę taki AI, co mi tam coś zrobi”. I mówisz: „Ok, ale to, co pan mówi, jest prawdopodobnie banalną automatyzacją, nie ma sensu”. „Ale ja chcę mieć taki LLM, co to do niego powiem”. Po co? „Please don’t, nie pal planety, nie trzeba”. Ale często tak jest, że jak jest hype na coś, to wszyscy chcą mieć gadżet.
Karol
Wróćmy z powrotem do modeli i do ich budowania. To zbudujmy ten model. Czego potrzebujemy oprócz danych, które są uporządkowane, oznaczone w odpowiedni sposób? Co dalej?
Inez
Jeszcze dodaj, które są na licencjach – wszyscy się zgodzili, żeby je dać, więc masz ich połowę mniej, jeśli w ogóle ich nie masz.
Karol
Historia pierwszego Bielika, prawda?
Inez
Tak. A nawet bardziej bym powiedziała, że historia PLLuM’a, który rzeczywiście, jakby, myślę, że paru prawników tam osiwiało po drodze i osób, które były odpowiedzialne za zbieranie tych danych, licencji, jakby umów z tym związanych i tak dalej, no, świat prawa jest absolutnie niegotowy jeszcze na to. Jest no spory bałagan w interpretacji.
Karol
Ja myślę, że nie tylko świat prawa, ale też świat edukacji, szczególnie tej formalnej.
Inez
Też. Ale tu jednak zostajemy mocno na poziomie prawa po prostu, w sensie albo się zgadza, albo się nie zgadza, a jest problem taki, że te interpretacje są absolutnie nieoczywiste i w zależności od tego, czy ktoś, nie wiem, się chce zaryzykować albo jest pro, versus nie chce ryzykować albo jest negatywnie nastawiony, no to będzie interpretować to na różne sposoby. No więc jak już mamy te dane, no to co? Mamy pierwszy etap właśnie tego rozglądania się po świecie języka, czyli tworzenia bazowego modelu językowego. Takiego właśnie, który rozumie relacje, to znaczy zrzutował sobie wszystkie możliwe pojęcia do przestrzeni wektorowej. Ważne jest tam jeszcze dobranie tego modelu do tokenizacji, do podziału tych słów, tych pojęć na takie…
Karol
I’m challenging you.
Inez
No.
Karol
Prostym, zrozumiałym językiem, bo używasz pojęć, definicji, które myślę, że dla większości ludzi nie są zrozumiałe.
Inez
Ale nie dałeś mi dokończyć zdania, bo użyłam pojęcia, żeby zaznajomić naszych słuchaczy ze słowem, ale zaraz potem chciałam powiedzieć, co to znaczy. Tak, tokenizacja, czyli podział słów, zdań na najmniejsze fragmenty, które będą miały sens dla modelu. I to jest bardzo ważne, żeby wiedzieć, że jeden token to nie zawsze albo bardzo często nie równa się jedno słowo, tylko jakaś część tego słowa. To też nie jest trochę tak jak w języku, że mamy… że mamy te leksemy czy morfemy, które też są najmniejszą częścią niosącą znaczenie w naszym rozumieniu, czyli rdzeń słowa na przykład. Tylko ten podział jest taki bardziej arbitralny, ale też ma trochę sensu. Generalnie chodzi o to, żeby nie reprezentować wszystkich możliwych słów, bo po pierwsze jest ich bardzo dużo, a po drugie język ewoluuje i pojawia się bardzo dużo nowych słów.
Więc jakbyśmy w starym stylu, na przykład word2vec-ów, po prostu powiedzieli: „OK, mamy teraz cały możliwy słownik języka polskiego, wrzućmy go do maszynki, wyjdą z tego jakieś wektory. Każde słowo ma swój wektor, cześć”. Po pierwsze, nie mamy wtedy kontekstu, bo jedno słowo potrafi znaczyć wiele. Banalnie zamek – to może być budynek i zamek może być, nie wiem, w drzwiach albo w spodniach, i już na starcie mamy problem z tym, czy to ma jeden wektor, czy więcej.
Karol
Trudno z odmianą.
Inez
Druga kwestia to jest jeszcze odmiany, chociaż tutaj często było tak, że się zamieniało po prostu na formę podstawową, taką słownikową, co też ma swoje minusy, bo jak chcemy na przykład łapać czyjś styl, no to jak pogubimy wszystkie końcówki, no to jakby ta informacja znika. Ale właśnie problem jest taki, że ten język żyje i jakby nigdy nie jesteś w stanie chwycić całego języka, całego leksykonu. Nie ma takiej opcji. Nawet banalnie, wiesz, fakt, że pojawiają się nazwy własne, chociażby – to są słowa, które non stop się pojawiają. Ale też w ogóle wystarczy młodzieży trochę posłuchać co roku, żeby zobaczyć, czy ten język naprawdę żyje. Wiesz, jakieś anglicyzmy się tam w technologii pojawiają, mnóstwo nowych słów itd.
Karol
W sumie to smutne, że powiedziałaś, że wystarczy popatrzeć na młodzież.
Inez
Że co, że już nie jesteśmy młodzieżą?
Karol
Niestety.
Inez
No słuchaj, ale jesteśmy za to w dobrym momencie – jesteśmy ciągle młodzi, a już świadomi. To jest dobre miejsce w życiu.
Karol
Wracajmy do…
Inez
Wracając, tak, więc pomysł był taki, żeby zapisać, zareprezentować dużą ilość słów, które są na tyle powtarzalne, że warto dla nich mieć osobne wektory, osobny zestaw liczb unikalny, który będzie w stanie reprezentować…
Karol
Tak, bo wyjaśnimy, że te wektory są reprezentowane przez ciąg liczb.
Inez
Tak, to jest ciąg liczb, który jest po prostu unikalny, tak, żeby można było jak indeks gdzieś tam znaleźć po prostu, co to znaczy. No i do tego mamy części słów. Czasami to jest pojedyncza litera, jeżeli ona niesie jakieś znaczenie, czyli na przykład jest końcówką odmiany, no to taka litera na końcu, ona ma swoje znaczenie. Czy to jest a propos „aktor”, czy tam „aktorka”, no to będzie akurat dwie litery, ale potrzebuję jakiś przykład, gdzie mamy „a” na końcu. Ale może być w czasowniku: „zjadł”, „zjadła”. I to „a” mamy na końcu i już wtedy niesie informację o płci osoby jedzącej. Albo jeżeli to jest spójnik, czyli: „On powiedział, a ona nie” – no to to „a” też jest spójnikiem, jest istotne. To warto, żeby też miało swój taki właśnie wektor, tę reprezentację unikalną. A reszta to są takie kawałki słów, najczęściej pojawiające się zlepki liter, które są jak klocki, z których możemy zbudować całą resztę słownika, która się będzie pojawiała właśnie, która będzie nowa albo po prostu mniej używana, ale pozwoli nam to lepiej zrozumieć, co to za słowo, bo wiemy, z jakich klocków to złożyliśmy. No i z tego, co pamiętam, przynajmniej pierwsze głośniejsze modele miały tak około 3000 takich elementów tak naprawdę zreprezentowanych. Więc jak pomyślimy o tym, że słowniki potrafią mieć po 100 tysięcy słów, to wydaje się to bardzo mało.
Karol
Właśnie, byłem w szoku, jak zobaczyłem, że słowniki języka polskiego obecnie to 300 tysięcy słów.
Inez
No, na przykład. Myślałam teraz o angielskim, bo zazwyczaj tam przy angielskim się mówiło o 100 tysiącach.
Karol
Tak. W ogóle w ramach dygresji tak samo. 300 tysięcy słów w słowniku. My mamy bierną znajomość słów na poziomie – czytałem – 50-60 tysięcy, a aktywnie wykorzystujemy… Tysiąc?
Inez
W zależności od wykształcenia, biegłości językowej, to jest maksymalnie 3 tysiące, a zazwyczaj między 500 a 1000.
Karol
Ja zrobiłem wielkie oczy i od tego czasu na przykład z moją żoną wiesz co robimy?
Inez
Poszerzacie swój słownik?
Karol
To raz. Ale dwa, robimy sobie takie challenge. Mówimy: „Dobra, to teraz wymieniamy słowa na P”. Słuchaj, okazuje się, że naprawdę ciężko jest wymyślić, wiesz, setkę czy sto pięćdziesiąt słów.
Inez
To ja mam dla was trudniejszy challenge. Spróbujcie to zrobić tylko od końca. Wymień wszystkie słowa, które się kończą na – i daj tam dwie, trzy ostatnie. To jest bardzo trudne. W sensie ludzie naprawdę indeksują, naturalnie nasz umysł indeksuje od przodu. Indeksowanie od tyłu jest bardzo trudne.
Karol
Powiedzieć Ci coś? Dla mnie jest znowu takim wyjściem poza moją strefę komfortu. Pamiętam, jak czytałem „Kwantechizm” profesora Dragana, i on tam wspominał o tym, że czytał książki do góry nogami.
Inez
No, to nie jest proste. Mi się czasami zdarzało rzeczywiście odczytać, jak ktoś siedział przy stoliku i właśnie po drugiej stronie, i tak zczytywać do…
Karol
Ale wiesz co, zacząłem próbować i po dwóch dniach zaczęło mi to wychodzić nawet całkiem nieźle.
Inez
Czujesz, że ten mózg jest rzeczywiście wygimnastykowany. Ale to dobrze, trzeba się gimnastykować, tym bardziej w czasach, kiedy te elementy mogą trochę rozleniwić.
Karol
No dobra, liczby, wektory – co dalej?
Inez
No i co? Jak już mamy ten model bazowy, który się poskładał z tych naszych dobrze przemyślanych klocków, no to mamy model, który jest w stanie właśnie, tak jak powiedziałam, nie tyle rozumieć w sensie uwewnętrzniać, co po prostu świetnie operować językiem tak, żeby tworzyć przekonujące, sensowne sekwencje słów. No i potem chcemy, żeby ten model wykonywał jakieś zadania. No i tutaj wchodzi ten element trenowania na instrukcjach. I te instrukcje, no to jest dosłownie taki element szkoły, czyli pokazujesz najpierw w podręczniku, jak jest polecenie i jak je wykonać. No i pokażesz ileś razy takie polecenie i możliwe sposoby jego wykonania. I potem mówisz: „To teraz ty sam zrób”. No i takich instrukcji powinno być, może być bardzo dużo. I tak naprawdę jakość tych modeli w dużej mierze również zależy właśnie od tego etapu, wcale nie tylko od tego, na jakich danych były trenowane wyjściowo, chociaż też oczywiście, bo jakby tam jest kwestia skali. Ale w ogóle też skali – jak będzie bardzo mało tych danych, no to wiadomo, że możliwość właśnie umiejętnego lawirowania pomiędzy słowami, żeby tworzyć…
Karol
Wystarczy sobie przypomnieć pierwsze czatboty, nie wiem, rok 2017, 2018.
Inez
No tak, ale to chyba też trochę wynikało u nich akurat z trochę innej architektury. Ale no też, jak masz za mały świat, to będziesz się obracał w bardzo ograniczonym świecie. Gdybyśmy mieli kogoś, kto miał materiał wyłącznie szkoły zawodowej i nagle wrzucili go na uniwersytet, to literalnie nawet w języku będzie miał kłopot na początku, żeby się odnaleźć. No to jest to samo, że będzie tak ograniczony model bazowy, to jak mu damy jakieś instrukcje, które wymagają nie wiadomo czego, to na starcie będzie miał takie: „Ale o co ci chodzi? W języku nie rozumiem”. No, ale zakładamy, że ten model bazowy jest duży, napchaliśmy tam danych, wszystko się udało, no i musimy po prostu pokazać te instrukcje. I są różne sposoby tworzenia tych instrukcji. Były też otwarte zbiory, alpaka na przykład, taki słynny zbiór instrukcji anglojęzycznych. No i teraz pytanie – czy tłumaczyć taki zbiór na język polski i czy tłumaczyć to ręcznie, czy tłumaczyć to automatycznie. Tutaj myślę, że Sebastian ma dużo do opowiedzenia, bo oni bardzo wiele podejść również automatycznych, półautomatycznych, stosowali przy Bieliku. Natomiast w Plumie przede wszystkim te instrukcje były robione ręcznie, z ogromnymi zasobami ludzi. W sumie finalnie chyba nie tylko, ale na pewno gro tych instrukcji było rzeczywiście handmade przez ludzi. I tam był ważny element kontekstualizacji kulturowej, bo jeżeli weźmiesz sobie takie instrukcje amerykańskie, anglojęzyczne czy anglosaskie, i one na przykład czasami polegają nie tylko na tym, że zrób coś, ale też po prostu są pytaniem i odpowiedzią taką wiedzową.
Karol
How do you do?
Inez
Nawet nie, tylko po prostu: „Kto jest, nie wiem, jakąś tam piosenkarką, wiesz, która zaśpiewała coś, nie?”. No i jeżeli masz w tych instrukcjach całą masę kultury w tym momencie zapisanej anglosaskiej, no to prawie na pewno nie znajdziesz tam, wiesz, polskich rzeczy, no i on będzie się świetnie, wiesz, poruszał w tym – taki model później – w tym świecie, a niekoniecznie w naszym. I cały ten motyw tych polskich modeli też polegał na tym, żeby nie tylko dane dać polskie, ale też, żeby te pytania, te instrukcje też takie, żeby były bardziej nasze. I też na przykład przy okazji redakcji tekstu, bo jednym z zadań na przykład może być to, co jest dla nas bardzo ważnym, jakby, zadaniem czy możliwością wykorzystania tych modeli, czyli to, że one nam redagują teksty, że one nam poprawiają te teksty, nie?
Karol
Tak. Nie tylko w angielskim, ale też w polskim: „Napisz mi lepiej”, tak? Jedna z moich ulubionych ról modeli językowych – „Przeredaguj”, „wejdź w rolę redaktora technicznego”, „zrób tę opowieść w stylu określonego języka, autora”.
Inez
To jeden z najlepszych sposobów wykorzystania tych modeli, bo jak sama nazwa wskazuje, są to modele językowe. Tak, a nie na przykład wiedzowe. Natomiast, no, więc jakby to jest ważne, żeby te instrukcje się tam znalazły, konkretnie związane z tym, co byśmy chcieli, żeby te modele umiały. Później jak mamy te benchmarki i patrzymy, który model jest w czym lepszy, to też trochę może wynikać z tego, że na przykład priorytet został położony, waga mocniejsza przyłożona do danego zestawu zadań, a do innego nie. Czyli na przykład nie był super uczony pod kodowanie, pisanie kodu albo rozwiązywanie zadań matematycznych, ale bardziej na przykład na redakcję tekstów i rozumienie, streszczanie itd. Więc w tym sensie też ten model modelowi nierówny. I tutaj, gdzie bym wieszczyła największą przyszłość tych modeli, to właśnie chyba nie walka o omnimodel do wszystkiego, tylko o bardzo dobre, wyspecjalizowane podejścia, takie zawodówki dla modeli, wiesz, w sensie w dobrym rozumieniu, żeby one po prostu się naprawdę turbo specjalizowały w swoim obrębie – nawet nie dziedzinie wiedzy, tylko obrębie zadań, do których są trenowane.
Karol
I wierzysz w to, że modele będą między sobą współpracować?
Inez
Myślę, że tak, ale też przede wszystkim ludzie będą sobie z tymi modelami współpracować, w sensie jakby pomiędzy nimi. To już się trochę dzieje, bo jak wychodziły teraz te kolejne modele, chyba ten O3, to już było powiedziane, że generalnie on jest bardziej do zadań takich logicznych, matematycznych, programistycznych itd., i to nie jest tylko zabieg marketingowy, żeby powiedzieć: „Odczepcie się, jak będzie miał niższe wyniki gdzieś indziej”, tylko o to chodzi, on został do tego zaplanowany.
Karol
4.0 tak samo, prawda?
Inez
4.0 jeszcze taki był „o jak o mnie”, więc jeszcze trochę próbował być do wszystkiego, ale ten już rzeczywiście był bardziej w tym kierunku. I nawet pamiętam, że wtedy ludzie pisali taki – LinkedInowy boom polegający na tym, że: „Tutaj mi odpowiedział głupoty, a tego nie umie”. Ok, ale jeżeli kupujesz grzebień, to nie próbuj nim jeść sałatki, bo jakby to nie jest do tego. Więc też chodzi o to, żeby te modele zgodnie z ich przeznaczeniem używać.
Karol
Tak samo jak programiści najchętniej wykorzystują Cloda do programowania.
Inez
Też osobiście bardzo lubię programować z Claude. Też uważam, że jest niezły.
Karol
A masz swojego faworyta? Czy korzystasz z różnych modeli do różnych…
Inez
Korzystam z różnych modeli do różnych zadań, i to dosłownie z różnych, w sensie w obrębie nawet OpenAI na przykład i Claude’a, bo rzeczywiście widzę te różnice. Na przykład wyszedł nowy Claude 3.7 i wszyscy mówią: „Super jest nowy Claud”, ale jakby to są zadania, do których 3.5 tak naprawdę jest lepszy.
Karol
A ty jako językoznawczyni, jaki masz stosunek do promptowania w ogóle? Czym jest dla siebie promptowanie?
Inez
Ale w jakim sensie?
Karol
Rozłóżmy to na części pierwsze. Czym jest dla ciebie w najprostszej definicji promptowanie?
Inez
Formułowaniem polecenia.
Karol
Tak samo jak kiedyś kodowanie było językiem, dzięki któremu komunikowałaś się z maszyną, z komputerem, który miał wykonać określone obliczenia, zadania, tak? To teraz promptowanie jest uniwersalnym językiem, dzięki któremu model językowy wykonuje zadania i nasze oczekiwania spełnia.
Inez
Tak, chociaż teraz sobie myślę, że rzeczywiście trochę zawęziłam tę definicję, bo pomyślałam już o takim konkretnym wykonywaniu zadań. Ale przecież jest tak, że my też czasami po prostu rozmawiamy z tym modelem i wtedy to niekoniecznie jest polecenie. Wiesz co, to jest po prostu język komunikacji. I trochę jak z ludźmi, jak z pracownikami – czasem rozmawiamy o pogodzie, czasem rozmawiamy o tym, jak minął weekend, a czasem rozmawiamy o tym, co trzeba zrobić. I to chyba tak samo jest już teraz z tymi modelami, nie?
Karol
Podzielę się z tobą jedną historią. Pozdrawiam cię, szanowna słuchaczko, jeżeli słuchasz tego odcinka. Kilka tygodni temu otrzymałem jednego maila z historią, którą opowiadała właśnie jedna ze słuchaczek, 99 twarzy. Model językowy pomógł jej wyjść z depresji, bo zaczęła z nim rozmawiać. Wszedł w rolę psychoterapeuty i pomógł rzeczywiście z tej depresji wyjść.
Inez
Wiesz, to jest piękny przykład, ale też wiemy, że niestety historia miała zupełnie odwrotne przykłady, więc ten grunt jest grząski ciągle jeszcze. I to wynika oczywiście… Oczywiście z tego, że… Po drugiej stronie nie ma tej empatii w rozumieniu empatii. Natomiast to, co na pewno te modele mogą zaoferować, to stałą obecność, absolutny brak zmęczenia w rozumieniu irytacji, bo one się męczą inaczej – to jest mój ulubiony motyw. O to zmęczysz. Zaraz ci powiem. I to, że one nie oceniają. To, że bardzo częstym problemem też wśród przyjaciół jest to, że jedna osoba przychodzi i mówi: „Wszystko jest nie tak, czuję się fatalnie” itd., a druga osoba znajduje jej rozwiązania.
Karol
Czy to nie jest zaleta tego, że model nie ma ego?
Inez
Nie wiem, czy to jest to. Raczej to jest trochę wracając…
Karol
Skoro mówisz, że model trudno urazić.
Inez
Nie, ja powiedziałam, że model trudno zmęczyć. W sensie zirytować tym, że on się zmęczy.
Karol
A może źle zrozumiałem to, co powiedziałaś.
Inez
Wiesz co, wbrew pozorom te modele da się urazić, w sensie takim, że one ci odpowiedzą, jak gdyby były urażone, ale to jest tylko nadal piękna symulacja w języku takiej konwersacji osoby urażonej.
Natomiast one się nie męczą w tym sensie, że same z siebie nie powiedzą ci: „Dobra, ile razy mam ci powtarzać to samo?”. To jest piękne, że zarówno przy nauce, przy edukacji. Siedemdziesiąty raz pytasz: „Ale nie rozumiem, weź mi jeszcze raz powiedz”. „No, okej, powiem ci jeszcze raz”. To jest piękne. To też trochę wykrzywia nasze myślenie o nauczycielach, bo potem taki ludzki nauczyciel z krwi i kości, który się po prostu ma prawo zmęczyć, będzie tym „B” nauczycielem, bo „mój czat się nigdy nie męczy”. Natomiast one nie oceniają, nie szukają rozwiązań na siłę, one wykonują polecenia w tym rozumieniu, że dopiero jak im powiesz: „Hej, jestem w głębokiej d., proszę cię, znajdź mi rozwiązania”, no to ten model ci zaproponuje, ale jak tego nie powiesz, to się nie będzie wpisywać, napraszał, a ludzie mają naturalnie tendencję, żeby jednak te rozwiązania podawać, bo chcą, nie wiem, zadziałać i tak dalej.
Karol
A model językowy może się domyślić?
Inez
Domyślić?
Karol
Zobacz, że na przykład w komunikacji międzyludzkiej jak ważne są mowa ciała, emocje wyczuwalne, kontekst. Z kontekstem możemy sobie poradzić, pracując z modelem językowym. Ale zobacz, że tutaj mamy komunikację tylko i wyłącznie werbalną, tę, tak? Mało tego, jest jeszcze, potrafi być zubożona, bo mamy niewielki zasób słów. I komunikujemy się dokładnie tak samo, jak kiedyś z wyszukiwarką internetową.
Inez
No, nie aż tak źle to nie jest. Już się trochę nauczyliśmy. Czekaj, czekaj, no…
Karol
Badania Google – średnia długość promptu – dziewięć słów.
Inez
Dziewięć słów to jest o wiele więcej, niż wpisywaliśmy w wyszukiwarkę. Komandą się wpisywało trzy słowa. Więc jest, wiesz, trzykrotny progres.
Karol
Trochę upraszczam, ale zobacz, że dziewięć słów…
Inez
Mało? Co o tym? Dziewięć słów to już prawie dobre opowiadanie można pisać. Kiedyś był taki challenge, żeby w dziesięć słów napisać opowiadanie.
Karol
To podeślę ci tę recenzję pchły jeżdżącej na Triceratopsie.
Inez
Co, ma dwadzieścia stron?
Karol
Nie, właśnie – krótka i dosadna.
Inez
No widzisz, język jest bardzo plastyczny, można z nim zrobić wiele.
Karol
Promptowanie.
Inez
Promptowanie, czym jest? Nie, czekaj, bo coś odwinęliśmy się, jeszcze miało być coś o zmęczeniu.
Karol
Tak, pytałem się ciebie, czy model może być zmęczony i czy ma ego?
Inez
Aha, no, nie ma ego w takim rozumieniu właśnie naszym, białkowym.
Karol
Czy można urazić model językowy?
Inez
No właśnie, można zasymulować jego urażenie. On po prostu… są takie modele, które dobrze reagują na styl rozmówcy i wtedy odpowiadają ci w podobnym stylu. Na przykład Llama 3.3, ta siedemdziesiątka, jak nawet pytasz ją o rzeczy teoretycznie formalne, ale językiem nieformalnym, to ci odpowie tak samo. Na przykład jak tam było jakieś pytanie: „Ej, a jak taki koleś będzie chciał coś tam zrobić, to co ma tam… gdzie ma znaleźć informacje?”, to odpowiedź już miała: „Hej, kolesiu, jak tego potrzebujesz, to poszukaj tego tam i tam”, co było zabawne, bo jakby pytanie było bardzo formalne, dotyczyło jakiejś dokumentacji uniwersyteckiej itd., ale pokazywało, że on się próbuje wczuć w takie rzeczy. A jak pytałam, kiedyś próbowałam też właśnie tak quasi urazić ten model właśnie, albo w ogóle poprosić go, żeby też mnie uraził tak masochistycznie, żeby zobaczyć, co zrobi. To znaczy, na przykład pisałam, że wyjaśnij mi to jak dla idioty albo coś takiego. I różnie, były modele, które mówiły: „Nie, no co ty, wiesz, no tak nie można” i coś tam. Były takie: „Okej, masz tutaj wyjaśnienie jak dla debila, proszę, tutaj tak i tak, idioto, czy już wreszcie zrozumiałeś, co mam ci jeszcze powiedzieć?”. Literalnie miałam takie odpowiedzi z modelu, i to któregoś z OpenAI-owych modeli, więc tam ewidentnie te guardrails trochę nie zadziałały, te zapory nasze, które powinny filtry, tak, które powinny trochę, trochę tutaj nałożyć kaganiec modelom na takie zachowania. Wiadomo, zawsze to cieszy użytkownika, jak tak trochę popsuje te konwersacje, więc to się zdarza. Ale to wiadomo, to jest kwestia takiego odwzorowania tego, co się dzieje w tej rozmowie.
Karol
Tak. A mówiąc o samym promptowaniu, masz swoje ulubione techniki, w jaki sposób promptujesz, w jaki sposób rozmawiasz? Możesz dać kilka przykładów ciekawych rzeczy, twoich konwersacji, które prowadziły do nieoczekiwanych czasami zwrotów akcji?
Inez
No, ja przede wszystkim w ostatnim czasie dużo bardzo działałam z analizą danych, bo sprawdzałam, jak te modele sobie radzą, bo dużo było teraz hype’u wokół tego, że modelami można analizować duże zbiory, że można sobie generować raporty i tak dalej, i tak dalej. Chciałam powiedzieć: „Nie można, nie róbcie tego”. I nie chciałabym latać samolotem, że tak powiem, który zostanie stworzony według obliczeń dużej ilości danych zrobionych modelem, w skrócie mówiąc. W sensie trochę się boję świata, w którym będziemy konfrontowani z liczbami wychodzącymi z takich pobieżnych analiz dlatego, że moje doświadczenia pokazywały właśnie, że ten model się w cudzysłowie męczy. To znaczy, startuje z punktu, w którym jest świetnie, w którym bardzo fajnie ci analizuje, na przykład właśnie duży jakiś taki zbiór na Excel, CSV, i sobie z tym radzi. Raz, drugi, piąty, siedemnasty, i nagle po prostu przestaje działać, nagle zaczyna robić głupie błędy, takie naprawdę podstawowe, zaczyna gubić swoje poprzednie wiedzy, co oczywiście wynika z tego, że przekroczony został kontekst prawdopodobnie.
Karol
Zgoda. A robiłaś eksperymenty i dzieliłaś po prostu te porcje wiedzy na mniejsze kawałki i potem syntetyzowałaś?
Inez
Tak, ale to też nie jest takie proste, żeby to spójnie połączyć, bo największym wysiłkiem dla tego modelu, który zjadał najwięcej tokenów, była ta pierwsza analiza i ustalenie tego, że on dobrze rozumie ten plik. Potem zostawało ci strasznie niewiele na to, żeby podziałać w obrębie tego, a poza tym dochodził do jakichś wniosków i chciałeś dalej z tym działać. Zauważyłam, że w Klozie strasznie szybko się kończył ten kontekst. Bardzo fajnie sobie radził do czasu, ale naprawdę strasznie się szybko ukończył. Kończyła się też możliwość wykonania pewnego polecenia w obrębie jednego zapytania. Tam ci mówi, że „hit the limits”, coś tam. I wtedy trzeba mu napisać „kontynuuj” i wtedy on jest w stanie wypisać ci wyniki, które przed chwilą obliczył, ale już mu nie starczyło okienka na wypisanie ich. Więc ten trik akurat tutaj działa. Zauważyłam, że też działa ten trik, żeby się cofnąć do miejsca, które jest jeszcze dla ciebie istotne w tej konwersacji i rozgałęzić się w bok, czyli zmieniasz, robisz edytuj prompt w tym miejscu, edytujesz go i on jakby sobie trochę resetuje ten licznik tego kontekstu.
Karol
Prompt czy wynik promptowania?
Inez
Prompt, no bo nie możesz edytować w wyniku.
Karol
Masz w…
Inez
W Claude?
Karol
A, przepraszam, nie w Claude. Rozmawiam już półtorej godziny, więc coś już moje neurony się psują.
Inez
Tak, skończył. No, więc rzeczywiście widziałam, że tam dużo rzeczy nie działa i nauczyłam się robić mu taki sanity check co kilka ruchów, to znaczy sprawdzać, czy na pewno jesteśmy w tym samym miejscu, czy on cały czas jest przytomny. No i to jest bardzo dobra technika, którą polecam przy jakimkolwiek odrobinę większym zadaniu, bo naprawdę ilość razy, które zaowocowały złapaniem go za rękę na gorącym uczynku uściszania i takiego subtelnego skręcania trochę w przestrzeń halucynacji była tak duża, że naprawdę wiem już, że trzeba to robić. Bardzo też, myślę, dobrą praktyką jest… Jeśli załadujemy na przykład jakiś większy plik danych, żeby go odpytać o kilka rzeczy dla nas istotnych z tego pliku, o których jesteśmy pewni, żeby zobaczyć, że on go w ogóle dobrze rozumie.
Karol
A jakie są Twoje wrażenia po korzystaniu z notebookaLM?
Inez
Tutaj też trochę zadziałał dokładnie ten sam motyw, czyli z jednej strony on robi fantastyczne wrażenie, fascynujące jest to, że wrzucasz mnóstwo dokumentów, mnóstwo treści, zadajesz mu proste pytanie i właśnie w takim czasie rzeczywistym wyłuskujesz jakąś istotną dla ciebie informację, czyli tak na szybko: „Czekaj, co to było?” i tam podajesz jakieś pojęcie i masz w sekundę czy w pół sekundy definicję i tam trzy sposoby użycia i tak dalej. Więc dosłownie w trakcie rozmowy z kimś możesz na bieżąco przypominać sobie fragmenty na przykład z kilkudziesięciu dokumentów, czyli tak łącznie, powiedzmy, nie wiem, masz dwieście stron, po których byś latał jako pętany, wiesz, suwakiem, nawet chcąc znaleźć to miejsce w oryginale.
Karol
O ile dobrze pamiętam, na dzień dzisiejszy to 100 źródeł?
Inez
50.
Karol
To już chyba 100.
Inez
Okej. Tydzień temu było 50, chyba że jakaś wersja super pro, nie? W mojej wersji było 50. W każdym razie załadowałam mu tam 30 ponad dokumentów, PDF-ów. No i sobie tam działaliśmy na tym. I też po jakiejś chwili się zorientowałam, że on nie widzi wszystkich.
Karol
Tak, problem taki z PDF-ami jest, że dużo lepiej rzeczywiście notebook pracuje na czystym…
Inez
Ale właśnie znowu ten motyw takiego trochę wyciągnięcia go za język, i to jest właśnie taka technika, którą sobie opracowałam ostatnio właśnie, pracując z tymi modelami różnymi, czyli jakby nie odpuszczasz, dajesz pytania pomocnicze, podprowadzasz trochę jak ucznia, aż on dojdzie do tego, gdzie jest, i wtedy mówisz: „No to teraz zrób to swoje”. I tutaj na przykład mówię mu, że: „Hej, daj mi dane, powiedzmy czegoś tam szukałam, konkretnych pojęć ze wszystkich tych 31 dokumentów”. I on mówi: „Ale ja mam 24 tylko”. Ja mówię: „No nie, masz 31”. „Nie, jak mi dołączysz kolejnych 7, to będę miał 31”, gdyż co? Wysłuchaj, pyskował. Twardy, że nie ma. „No słuchaj, masz załączone, w kontekście widzę je”. „Nie, nie ma”. I wtedy mu podaję nazwy tych plików: „Taki, taki, taki, taki plik”. On mówi: „Okej, rzeczywiście mam” i wypisuję ci fantastycznie tę analizę. Więc on nie miał problemu z PDF-em jako takim. Świetnie poradził sobie z tą analizą, ale miał problem z jakimś zindeksowaniem ich, przeczytaniem na starcie. Więc tutaj na przykład takie banalne sprawdzenie: „Ile widzisz plików? Jakie one są? Ustalmy, jakie mają tytuły? Co to w ogóle jest?”. Podniosło bardzo jakość dalszego funkcjonowania z tym notebookiem.
Karol
A ty, jako językoznawczyni, jak się uczysz promptowania? Czy to jest dla ciebie coś naturalnego? Czy to jest dla ciebie takim eksperymentem i uczysz się swojego własnego sposobu komunikacji z takim modelem, znając…
Inez
Tak, znaczy ja rzeczywiście nie korzystałam z jakichś złotych rad promptowania.
Karol
Sama mówisz, że lubisz się uczyć. Czy znalazłaś ciekawe źródła, które rozkładają promptowanie, ale nie na zasadzie… Bo ja się zawsze, przepraszam, ale trochę się z tego śmieję, że większość książek dotyczących promptowania to jest książka z…
Inez
Słownik.
Karol
Słownik. „Sprzedam Ci 10 tysięcy pomysłów na prompty”.
Inez
Tak, tak, tak.
Karol
A co byś powiedziała, gdybyśmy dołączyli taką listę twoich ulubionych książek do notatek z tego odcinka?
Inez
Proszę bardzo. Myślę, że będzie bardzo różnorodna. Taka wiesz, totalnie od sasa do lasa, ale tak.
Karol
Super. Drodzy Państwo, moją i Waszą gością dzisiejszego dnia była Inez Okulska. Ines, serdecznie Ci dziękuję.
Inez
Dziękuję również. Mam nadzieję, że Państwo jeszcze żyją, nie padli.
Karol
Zatem niechaj będzie z Tobą i życzę Ci dobrego wieczoru.Inez
Dziękuję i z nami wszystkimi. Dobranoc.