Współpraca reklamowa z wydawnictwem Szczeliny.
Podobnie jak wiele innych rdzennych ludów na całym świecie, Maorysi przez wiele pokoleń cierpieli z powodu okrutnego kolonialnego traktowania. W 1867 roku na mocy ustawy o szkołach dla rdzennej ludności, która ustanowiła angielski jedynym językiem nauczania w szkołach, maoryskie dzieci były poniżane, a nawet bite za posługiwanie się własną mową. Gwałtowna urbanizacja, która ogarnęła kraj na początku XX wieku, doprowadziła do rozpadu i rozproszenia rdzennych społeczności, osłabienia maoryskich ośrodków kultury i degradacji języka. Liczba osób posługujących się językiem te reo spadła z 90 procent do 12 procent populacji maoryskiej. Kiedy sto dwadzieścia lat później Nowa Zelandia, czyli Aotearoa, jak Maorysi pierwotnie nazwali swoją ziemię, zmieniła obowiązująca politykę, pozostali jedynie nieliczni nauczyciele języka te reo, którzy mogliby go ożywić. Podobnie jak wiele innych języków przed nim te reo niemal zniknął z powierzchni ziemi.
Trudno jest w pełni oddać tragedię utraty języka. Strata ta znacząco wykracza poza zniknięcie formy komunikacji. Każdy język zawiera w sobie bogatą historię, kulturę i wiedzę; jest zbiorowym dziełem milionów ludzi, którzy poszukują dźwięków i form pisemnych, by uchwycić najsubtelniejsze obserwacje dotyczące wszechświata, życia i ludzkich doświadczeń, by dzielić się ze sobą oszałamiającym pięknem i bolesnymi porażkami, by nauczać dzieci, uczyć się od starszych, by wyrażać miłość. Właśnie z tych powodów badacze podczas prac nad nową technologią skupili się najpierw na języku.
Utrata języka to nie tylko tragedia globalna, ale też osobista. Odcięcie od własnego dziedzictwa i wzmacniane groźbami przemocy narzucenie obcych tradycji to najbrutalniejszy sposób ustalenia hierarchii pomiędzy tym, czyja historia, kultura i wiedza zasługują na przekazanie, a czyje są tak nieistotne, że można je wymazać.
Duże modele językowe przyspieszają wymieranie języków. Nawet w przypadku modeli sprzed kilku generacji, takich jak GPT-2, istnieje tylko kilka języków na świecie, którymi posługuje się wystarczająca liczba osób i które są udokumentowane w internecie w wystarczającym zakresie, by spełnić wymagania tych modeli w zakresie danych.
Duże modele językowe przyspieszają wymieranie języków. Nawet w przypadku modeli sprzed kilku generacji, takich jak GPT-2, istnieje tylko kilka języków na świecie, którymi posługuje się wystarczająca liczba osób i które są udokumentowane w internecie w wystarczającym zakresie, by spełnić wymagania tych modeli w zakresie danych. Według UNESCO spośród ponad 7 tysięcy języków, które nadal istnieją, prawie połowa jest zagrożona wyginięciem, mniej więcej jedna trzecia z nich jest obecna w internecie, mniej niż 2 procent jest obsługiwanych przez Google Translate, a według własnych testów OpenAI tylko piętnaście, czyli 0,2 procent, jest obsługiwanych przez GPT-4 z dokładnością powyżej 80 procent. Podczas gdy te modele będą się stawać częścią infrastruktury cyfrowej, dostępność internetu dla różnych społeczności językowych – a wraz z nią możliwości ekonomicznych – będzie coraz mniejsza, skłaniając je do priorytetowego traktowania nauki i posługiwania się językiem dominującym, takim jak angielski, zamiast własnym.
W obliczu tego nieuchronnego zagrożenia egzystencjalnego – zasadniczo odmiennej koncepcji od tej, w którą wierzą badacze – para rdzennych mieszkańców, Peter-Lucas Jones i Keoni Mahelona, po raz pierwszy zwróciła się ku sztucznej inteligencji jako potencjalnemu narzędziu pomagającemu nowemu pokoleniu użytkowników języka przywrócić mu dawną żywotność. Jones, który jest Maorysem, i Mahelona, który jest rdzennym Hawajczykiem, są partnerami w pracy i w życiu. Mahelona opowiada, że spotkali się i zakochali w sobie, gdy przyśniło mu się, że jeśli przeprowadzi się do Nowej Zelandii, spotka chłopca z plemienia Maorysów, z którym będzie dzielił życie.
W 2012 roku obaj przenieśli się z Wellington z powrotem do Kaitāia, miasta, w którym urodził się Jones, położonego na północy Aotearoa. Jones został dyrektorem generalnym Te Hiku Media, publicznej stacji radiowej nadającej w języku te reo, należącej do szerszej sieci mediów i innych organizacji zaangażowanych w rewitalizację tej mowy. Nowa rola otworzyła przed nim nowe szanse. W ciągu ponad dwudziestu lat nadawania Te Hiku zgromadziło bogate archiwum nagrań osób mówiących w języku te reo, w tym nagranie jego własnej babci Raihy Moeroa, urodzonej pod koniec XIX wieku i mówiącej z akcentem jeszcze niezniekształconym przez wpływ angielskiego. Jones chciał również nagrać liczne wywiady z maoryską starszyzną, by udokumentować ustną historię i język te reo, zanim odejdą. Nagrania te jego zdaniem mogłyby stanowić cenne źródło wiedzy językowej, portal do przeszłości, dzięki któremu nowe pokolenia użytkowników języka mogłyby usłyszeć jego oryginalne brzmienie i nawiązać łączność z doświadczeniem przodków.
Wyzwaniem okazała się transkrypcja nagrań dźwiękowych, tak żeby mogły być pomocne w nauce języka, którym włada zaledwie garstka nauczycieli. Dlatego w 2016 roku, kiedy OpenAI dopiero zaczynało działalność, Jones zwrócił się do Mahelony, zajmującego się w tym czasie przebudową strony internetowej Te Hiku, z pytaniem o możliwość rozwiązania tego problemu. Mahelona, człowiek o wszechstronnej wiedzy, studiował inżynierię mechaniczną w Olin College, pierwszy dyplom magisterski zdobył z zarządzania w biznesie, a drugi z fizyki i nanotechnologii, jako nowozelandzki stypendysta Fundacji Fulbrighta. Szybko więc wpadł na pomysł wykorzystania sztucznej inteligencji: dzięki starannie wytrenowanemu modelowi rozpoznawania mowy te reo Te Hiku byłoby w stanie transkrybować swoje repozytorium nagrań przy pomocy zaledwie kilku osób posługujących się tym językiem.
W tym miejscu historia Te Hiku całkowicie odbiega od modelu rozwoju sztucznej inteligencji OpenAI i Doliny Krzemowej. Doskonale znając niszczycielskie skutki kolonialnego wywłaszczenia, Jones i Mahelona byli zdecydowani zrealizować projekt tylko wtedy, gdy będą mogli zagwarantować trzy rzeczy: zgodę, wzajemność i suwerenność ludu maoryskiego, na każdym etapie rozwoju. Oznaczało to, że jeszcze przed rozpoczęciem projektu musieli uzyskać zgodę tej społeczności i jej starszyzny, zapytać, czy w ogóle chce tego przedsięwzięcia. Szukając danych treningowych, zwracali się o pomoc wyłącznie do osób, które w pełni rozumiały, do czego dane te będą wykorzystywane, i były skłonne wziąć udział w projekcie; by zmaksymalizować korzyści płynące z modelu, słuchali użytkowników języka, sugerujących, jakie zasoby do nauki języka byłyby najbardziej pomocne; kiedy zaczęli dysponować własnymi zasobami, postawili na kupowanie procesorów graficznych i serwerów, by szkolić modele bez uzależnienia od chmury jakiegokolwiek giganta technologicznego.
Co najważniejsze, Te Hiku stworzyło proces, dzięki któremu zebrane dane pozostawały zasobem przynoszącym korzyści, nie wykorzystywano ich do żadnych działań, na które społeczność nie wyraziła zgody, ani takich, które mogłyby ją wykorzystywać i szkodzić jej lub w inny sposób naruszać jej prawa. Zgodnie z maoryską zasadą kaitiakitanga, czyli opieki, dane pozostawałyby pod nadzorem Te Hiku, nie byłyby swobodnie publikowane w internecie. Te Hiku udzielałoby licencji tylko organizacjom szanującym wartości maoryskie i zamierzającym wykorzystywać je w projektach, na które społeczność wyraziła zgodę i uznała za pomocne.
„Dane są ostatnią dziedziną do kolonizacji” – powiedział mi Mahelona. Dawne imperia odbierały ziemię rdzennym społecznościom, a następnie zmuszały je do odkupienia jej na nowych, restrykcyjnych warunkach i zasadach, jeśli chciały odzyskać prawo własności. „Sztuczna inteligencja to po prostu ponowne zagarnianie ziemi. Wielkie firmy technologiczne lubią gromadzić dane za darmo – żeby budować, co tylko zechcą, niezależnie od tego, jaki jest ich ostateczny cel – a następnie sprzedawać to z powrotem jako usługę”.
Przeczytaj też: Co nam zabiera sztuczna inteligencja?
Od początku do końca Jones i Mahelona realizowali projekt bez kompromisów. W pewnym momencie rozpoczęli kampanię edukacyjną, by nauczyć Maorysów więcej o sztucznej inteligencji, a także zorganizowali konkurs, by pozyskać od społeczności dane i ich opisy. W ciągu dziesięciu dni Te Hiku zgromadziło 310 godzin wysokiej jakości transkrypcji audio z około 200 tysięcy nagrań zarejestrowanych przez blisko 2,5 tysiąca osób. Poziom zaangażowania był zaskoczeniem dla wielu badaczy zajmujących się AI, co poświadcza zaufanie i entuzjazm, jakie podejście Te Hiku wzbudziło w społeczności. Ludzie z ogromną chęcią przekazywali swoje dane i wyrażali zgodę na udział w projekcie, mając pełne zaufanie, że Te Hiku będzie nadal odpowiednio nimi zarządzać.
Ta pula danych to nic w porównaniu z 680 tysiącami godzin nagrań audio, które OpenAI pobrało z internetu w celu trenowania swojego narzędzia do rozpoznawania mowy Whisper. Jednak z doświadczeń Te Hiku można wyciągnąć lekcję, że 310 godzin wystarcza do opracowania pierwszego modelu rozpoznawania mowy te reo z osiemdziesięciosześcioprocentową dokładnością. Podczas gdy OpenAI dąży do opracowania pojedynczych, ogromnych modeli sztucznej inteligencji, zdolnych do wykonywania wszystkich zadań, co wymaga zebrania jak największej ilości danych, Te Hiku po prostu starało się stworzyć mały, wyspecjalizowany model, który doskonale radzi sobie z jednym celem. Ponadto Te Hiku skorzystało z międzynarodowej społeczności open source zajmującej się sztuczną inteligencją: jako punkt wyjścia wykorzystało bezpłatny model rozpoznawania mowy Mozilla Foundation o nazwie DeepSpeech, który sam w sobie jest dziełem innej wizji rozwoju sztucznej inteligencji. Podobnie jak Te Hiku Mozilla wyszkoliła model wyłącznie na danych przekazanych za pełną zgodą i zbudowała go przy użyciu architektury sieci neuronowej, opracowanej przez laboratorium badawcze chińskiej firmy Baidu z siedzibą w rejonie zatoki San Francisco. W sumie Te Hiku wykorzystało tylko dwa procesory graficzne.
Napisałam o Te Hiku, zanim ChatGPT stał się dominującym paradygmatem rozwoju sztucznej inteligencji, ignorując przy tym zgodę, wzajemność i suwerenność. Jednak w ciągu ostatnich lat zaczęłam postrzegać radykalne podejście Te Hiku jako jeszcze bardziej istotne. Krytyka, którą przedstawiam w tej książce, dotycząca szerszej wizji OpenAI i Doliny Krzemowej, nie ma na celu całkowitego odrzucenia sztucznej inteligencji. Odrzucam jedynie niebezpieczne przekonanie, że szerokie korzyści płynące z AI można czerpać wyłącznie z wizji tej technologii, która wymaga całkowitej rezygnacji z naszej prywatności, sprawczości i wartości, w tym wartości naszej pracy i sztuki, na rzecz imperialnego z ducha projektu centralizacji.
Te Hiku pokazuje inną drogę. Sugeruje, że sztuczna inteligencja i jej rozwój mogłyby wyglądać zupełnie inaczej. Modele mogą być małe i dostosowane do konkretnych zadań, a dane treningowe mogą być ograniczone i znane, co eliminuje skłonność do powszechnych, wyzyskujących i szkodliwych psychicznie praktyk.
Te Hiku pokazuje inną drogę. Sugeruje, że sztuczna inteligencja i jej rozwój mogłyby wyglądać zupełnie inaczej. Modele mogą być małe i dostosowane do konkretnych zadań, a dane treningowe mogą być ograniczone i znane, co eliminuje skłonność do powszechnych, wyzyskujących i szkodliwych psychicznie praktyk oraz pochłaniającego wszystko ekstraktywizmu związanego z produkcją i obsługą ogromnych superkomputerów. Tworzenie sztucznej inteligencji może być napędzane przez społeczność, oparte na ugodzie, z poszanowaniem lokalnego kontekstu i historii; jej zastosowanie może wspierać i wzmacniać marginalizowane społeczności; zarządzanie nią może być inkluzywne i demokratyczne.
Te Hiku nie jest jedyną organizacją poszukującą nowych ścieżek rozwoju sztucznej inteligencji. Podczas zbierania materiałów do tej książki wielokrotnie inspirowały mnie liczne organizacje i ruchy na całym świecie, które powstały, by przeciwstawić się imperiom AI, dochodzić swoich praw do samostanowienia i wyobrażać sobie nową drogę rozwoju.
Tłumaczył Piotr Grzegorzewski

Fragment pochodzi z książki Imperium sztucznej inteligencji. Sny i koszmary w OpenAI Sama Altmana Karen Hao w przekładzie Piotra Grzegorzewskiego, która ukazała się nakładem wydawnictwa Szczeliny. Książkę można zamówić na stronie wydawnictwa.