Polacy nie gęsi, swoje AI mają. "Narzędzie na trudne czasy"

13 godziny temu 154
Reklama 3 tysiące złotych na miesiąc.

"Biznes Klasa" to program money.pl dostępny na YouTube. Szef redakcji Łukasz Kijek prowadzi w nim rozmowy z przedsiębiorcami - o ich życiu, biznesie, zarobkach i wielu innych sprawach. Gościem ostatniego odcinka był Sebastian Kondracki, współtwórca Bielik AI, prezes Fundacji Spichlerz.

Dalsza część artykułu pod materiałem wideo

Zobacz także:

Zanim zaufasz ChatGPT, zobacz jak działa polski Bielik - Sebastian Kondracki w Biznes Klasie

Polacy nie gęsi, swoje AI mają

W czasach, gdy prym w rozwoju sztucznej inteligencji wiodą giganci technologiczni, w Polsce powstał projekt inny niż wszystkie. Bielik AI - duży model językowy wyszkolony głównie na danych w języku polskim - został zbudowany nie w Dolinie Krzemowej, oddolnie, w ramach działań Fundacji Spichlerz. - Nie sądzę, że powstanie w Polsce drugi OpenAI, ale dzięki Bielik AI może powstać dużo zwinnych, sprytnych firm, które zrobią swoje i w niszy będą globalnym liderem - mówi Sebastian Kondracki, współtwórca Bielika.

Wyróżnikiem Bielika jest jego narodowe zakorzenienie i możliwość uniezależnienia się od tzw. bigtechów. Aż 90 proc. danych treningowych stanowią teksty w języku polskim. Dla porównania, w globalnych modelach ten udział sięga ledwie 8 proc. Efekt? Model rozumie język potoczny, emocjonalny, a nawet mowę z błędami. - Mówisz "chleb i margaryna", a model wie, że chodzi o ciężką sytuację ekonomiczną - tłumaczy Kondracki.

Suwerenność technologiczna Polski

Ale Bielik to nie tylko lepsze zrozumienie polskiego kontekstu. To także realna odpowiedź na problemy związane z przetwarzaniem danych. W przeciwieństwie do chmurowych modeli takich jak GPT, Bielika można uruchomić lokalnie, całkowicie offline. - Nie interesuje nas nic, on nigdzie nic nie wyśle, nigdzie nic nie przetworzy na zewnętrznych serwerach - tłumaczy Kondracki. To kluczowe przy pracy z danymi wrażliwymi, np. w sektorze zdrowia, bankowości czy administracji.

Model liczy 11 miliardów parametrów - stosunkowo mało w porównaniu z gigantami pokroju GPT-3.5, ale wystarczająco dużo, by skutecznie przetwarzać język i działać na jednej karcie graficznej. - To jak z samochodami - nie zawsze potrzebujesz limuzyny, czasem wystarczy zwinna furgonetka do zadań specjalnych - wyjaśnia obrazowo Kondracki.

Dzięki otwartej licencji, Bielik jest darmowy nawet do zastosowań komercyjnych. To, co kosztuje, to sprzęt - czyli GPU - ale już samo korzystanie z modelu nie generuje kosztów tokenowych, które w przypadku globalnych rozwiązań mogą sięgać tysięcy dolarów miesięcznie. - Każdą dokumentację, log czy transakcję można "dobielić", ile tylko karta graficzna obsłuży - mówi Kondracki.

Niemcy uczą się od Polaków AI

Ambicje twórców Bielika sięgają także poza granice Polski.

Polacy kojarzą się z dobrą technologią, Bielik dobrze wymawia się po niemiecku, to stwierdziliśmy, że stworzymy projekt "Der Bielik". Teraz mamy taki oddzielny zespół natywnych Niemców, którzy właśnie bardzo mocno przygotowują testy Bielika w języku niemieckim, ale już pod kątem właśnie kulturowych, różnic między niemieckim z różnych landów, czy też pomiędzy Austrią a Niemcami, Szwajcarią. Chcemy troszeczkę mocniej zająć się tym językiem niemieckim - zdradza Kondracki.

Dodatkowo polski model językowy (LLM) stworzony przez grupę pasjonatów pracujących głównie weekendami i po godzinach, trafi do jednego z najpopularniejszych systemów AI na świecie - Perplexity. Zapowiedział to CEO Nvidii Jensen Huang. Nvidia, pierwsza spółka na świecie z wyceną powyżej 4 bilionów dolarów i SpeakLeash podpisały też list intencyjny dotyczący współpracy. - Już trenujemy model wnioskujący (z ang. reasoning - przyp. red.), trenujemy też model multimodalny. Nawet Niemcy nie są tak zaawansowani w swoich pracach - wskazuje Sebastian Kondracki.

Polskie firmy i urzędy już korzystają z Bielik AI

Projekt już dziś znajduje zastosowanie w praktyce. Testy przeprowadził m.in. Zakład Ubezpieczeń Społecznych, gdzie Bielik okazał się najlepszym rozwiązaniem. Korzystają z niego także banki - w tym do anonimizowania danych przesyłanych do zewnętrznych modeli, a także upraszczania komunikacji z klientem. Z Bielika korzystano również podczas polskiej prezydencji w UE, a nawet w eksperymentalnym projekcie związanym z Międzynarodową Stacją Kosmiczną.

Choć Fundacja Spichlerz nie działa dla zysku, to model biznesowy wokół Bielika zaczyna się klarować. - Chcemy iść drogą Linuxa - oddolnie, z pomocą społeczności i sponsorów, ale z otwartym kodem i licencją. Na tej bazie mogą powstawać tysiące komercyjnych rozwiązań - ocenia Kondracki. Marzeniem zespołu jest, by w Polsce rozwijały się specjalizowane modele dla poszczególnych branż - od medycyny po media.

W tym duchu powstał projekt Obywatel Bielik - obywatelska inicjatywa mająca na celu zbieranie zdjęć polskich potraw, zabytków czy przyrody, które posłużą do stworzenia pierwszego polskiego modelu multimodalnego. - Nie potrzebujemy zdjęć artystycznych, potrzebujemy polskich - podkreśla Kondracki.

Choć Fundacja nie korzysta z finansowania rządowego, współpracuje z instytucjami publicznymi, m.in. w zakresie danych, wdrożeń i edukacji. - Chcę mieć na plecach wiele marek, ale żeby nikt nie mówił mi, jak trenować - zastrzega Kondracki, porównując sytuację do niezależnych sportowców.

Dziś Bielik to efekt pracy wolontariuszy, realizowany po godzinach. - Myślę, że w tym modelu ta karma wraca - mówi współtwórca. I dodaje: - Bielik to archiwum języka, ale też narzędzie, które zostanie z nami na trudne czasy.

W poprzednich odcinkach "Biznes Klasy" Łukasz Kijek rozmawiał z:

Przeczytaj źródło