Mythos i GPT‑5.5: gdy przeglądarka ma 271 złych dni, a AI uczy się hakować

Nowa fala cyberataków: co mają wspólnego Mythos, GPT‑5.5 i 271 luk w Firefoksie

Firefox po prostu miał gorszy dzień. Tylko że trwający kilka miesięcy i kończący się listą 271 załatanych podatności. Tyle luk w kodzie przeglądarki wyłapał specjalistyczny model Claude Mythos, rozwijany przez Anthropic, podczas jednego z audytów bezpieczeństwa. Kilka tygodni później testy brytyjskiego AI Safety Institute pokazały, że GPT‑5.5 od OpenAI radzi sobie na podobnym poziomie w złożonych scenariuszach ofensywnego cyberbezpieczeństwa.

Brzmi jak sci‑fi? Niestety to już zwykły raport z działu „security”. Według najnowszych analiz ekspertów zajmujących się bezpieczeństwem przeglądarek, skala błędów odkrywanych przez generatywną AI to sygnał, że zmieniają się zasady gry: modele nie tylko pomagają znajdować luki, ale są w stanie uczyć się ich wykorzystywania w coraz bardziej autonomiczny sposób.

Mythos i GPT‑5.5 należą do nowej generacji dużych modeli językowych. Na papierze „piszą teksty” jak inne chatboty, w praktyce zostały mocno podkręcone pod analizę kodu, wyszukiwanie błędów, generowanie proof‑of‑concept exploitów i symulowanie zachowania atakującego. To ta sama klasa narzędzi, która potrafi pomóc przy refaktoryzacji projektu, ale też w kilka minut złożyć działający scenariusz ataku na serwer.

Ten tekst celuje w trzy grupy: specjalistów bezpieczeństwa, administratorów i zarządy firm technologicznych. Język zostawiamy jednak po ludzkiej stronie – bez doktoratu z kryptografii, za to z prostymi przykładami. Skupimy się na trzech osiach: nowych typach ataków możliwych dzięki AI, przygotowaniu zespołów bezpieczeństwa oraz tym, jak regulacje i ład korporacyjny próbują nadążyć za tym wyścigiem.

Po drodze zahaczymy też o zaufanie do chatbotów i o to, jak strategie bezpieczeństwa dużych firm AI trafiają na poziom zarządów. To dobry kontekst dla tematów poruszanych w analizie reklam w chatbotach AI i zaufania użytkowników czy w tekście o nowej roli Head of Preparedness w OpenAI.

Jak AI rozkłada Firefoksa na czynniki pierwsze: od automatycznego bug bounty do fabryki exploitów

Co właściwie znaczy, że Mythos „znalazł” 271 luk w Firefoksie? Nie chodzi o magiczne olśnienie maszyny. To połączenie trzech elementów: dostępu do dużych fragmentów kodu źródłowego, zdolności do generowania i uruchamiania proof‑of‑concept exploitów oraz automatycznego testowania zachowania przeglądarki w dziwnych, mało oczywistych scenariuszach.

Model uczy się na wzorcach błędów występujących w przeszłości. Potem pracuje jak wyjątkowo uparty stażysta: przechodzi po plikach linijka po linijce, zaznacza miejsca, które „pachną” błędem, buduje minimalny przykład, który wywołuje podejrzane zachowanie, i podsuwa wszystko zespołowi bezpieczeństwa. Z tą różnicą, że robi to w nocy, nie marudzi i nie potrzebuje onboarding’u.

Liczba 271 obejmuje pełne spektrum problemów. Część to drobiazgi wpływające na stabilność. Część to potencjalne wycieki danych. Wśród nich są też podatności, które w rękach zdeterminowanego atakującego można zamienić w przejęcie przeglądarki, zdalne wykonanie kodu czy kradzież sesji użytkownika. Sporo z nich dotyczy obszarów wysokiego ryzyka: modułów renderowania stron, parsowania multimediów czy systemu dodatków.

Z punktu widzenia obrońców to turbo‑wzmacniacz znanych praktyk. Klasyczny bug bounty i code review robiły swoje, ale po przejściu Mythosa nagle okazuje się, że produkt, który uchodził za „dobrze przetestowany”, wygląda jak ser szwajcarski. Różnica tkwi w intensywności i systematyczności analizy – człowiek zwykle przeskakuje po fragmentach, model grzebie wytrwale wszędzie.

Moneta ma drugą stronę. Te same modele, odpowiednio „nakarmione”, potrafią pomóc atakującym: priorytetyzują luki, szacują ich atrakcyjność, proponują gotowe sekwencje ataku. Dla specjalisty bezpieczeństwa to moment, w którym na myśl o backlogu z triage’u zaczyna się lekko pocić.

W tle dzieje się jeszcze jedna rzecz: podobne algorytmy coraz częściej analizują nie tylko kod, ale też zachowanie użytkowników i treści generowane przez chatboty. Z tego punktu już blisko do pytań o zaufanie, manipulację oraz modele biznesowe oparte na reklamie, o czym szerzej piszę w analizie reklam w chatbotach AI.

Nowe scenariusze ataków zasilane AI: od phishingu na sterydach po masowe skanowanie podatności

Wyobraź sobie poniedziałek rano w dziale IT. Kawa jeszcze nie zdążyła się zaparzyć, a w skrzynce czeka kilkadziesiąt maili phishingowych. Zero literówek. Poprawna polszczyzna, wewnętrzny żargon firmy, poprawne nazwiska z działu finansów. Link prowadzi na stronę, która piksel w piksel przypomina panel banku. To nie jest „kuzyn z Nigerii”. To spersonalizowana kampania przygotowana przez model, który przejrzał raporty, profile na LinkedInie i dokumenty wyciekłe z poprzedniego incydentu.

Mythos i GPT‑5.5 dodają do tego kolejne warstwy. Po pierwsze, automatyczne wyszukiwanie podatności w popularnym oprogramowaniu – od przeglądarek po serwery i frameworki webowe – w tempie, które przypomina historię z 271 lukami w Firefoksie opisywaną przez Michała Duszczyka w „Rzeczpospolitej”. Po drugie, symulację i optymalizację całych łańcuchów ataków. Modele potrafią doradzić kolejny krok, dobrać narzędzia, dorzucić listę poleceń „krok po kroku”. Nagle ktoś, kto ma umiarkowane doświadczenie, jest w stanie przeprowadzić operację, która jeszcze niedawno wymagała małego zespołu seniorów.

Trzeci element to super‑realistyczne treści: phishing podszywający się pod zarząd, syntetyczne nagrania głosu prezesa, deepfake’i wideo z „pilną prośbą o przelanie środków”. W tle wraca temat cyfrowych sobowtórów i granicy między legalną rekonstrukcją a nadużyciem wizerunku. Konsekwencje takich praktyk opisuję szerzej w tekście o cyfrowych sobowtorach gwiazd.

Różnica między „starym” a „nowym” krajobrazem cyberataków jest dość brutalna. Kiedyś ograniczeniem była kreatywność i czas atakującego: ile maili jest w stanie napisać, ile linii kodu przejrzeć. Teraz duża część tej pracy spada na model, który się nie męczy i nie robi przerw na Teamsy. Dyskusja nie powinna się więc kręcić wokół demonizowania AI, tylko trzeźwego przyjęcia faktu, że skala i tempo ataków rosną.

Im więcej dzieje się automatycznie, tym bardziej zaczyna się też chwiać zaufanie użytkowników do systemów AI. Jeśli ten sam typ modelu generuje pomocne podpowiedzi w pracy, a jednocześnie jest narzędziem w rękach przestępców, pytanie o granice komercjalizacji – chociażby przez reklamy w chatbotach – przestaje być wyłącznie marketingową ciekawostką i staje się tematem bezpieczeństwa, do którego wracam w tekście o zaufaniu do chatbotów.

Jak przygotować działy bezpieczeństwa i zarządy na erę Mythos i GPT‑5.5

Co z tym zrobić po stronie firm, poza symbolicznym „wyłącz wifi”? Pierwszy krok to potraktowanie modeli AI nie jako gadżetu do generowania podsumowań spotkań, ale jako nową warstwę narzędzi w całym cyklu bezpieczeństwa.

W praktyce oznacza to integrację modeli w procesach security: wspomagają code review, skanowanie podatności, analizę logów i threat hunting. Jeżeli atakujący korzystają z tej klasy narzędzi, obrona powinna operować na podobnym poziomie. W wielu zespołach testy z użyciem Mythosa czy GPT‑5.5 pokazują, że narzędzie najlepiej sprawdza się w duecie z doświadczonym analitykiem – model przegląda oceany danych, człowiek decyduje, które fale są naprawdę groźne.

To wymusza zmianę kompetencji. Specjalista bezpieczeństwa nie musi zostać prompt engineerem, ale powinien rozumieć, jak działają modele, gdzie zawodzą, jak je „dopytywać” i jak łączyć ich odpowiedzi z klasycznymi metodami. Krótkie, praktyczne szkolenia – choćby warsztaty z red‑teamingu z udziałem modeli – zaczynają być tak samo ważne, jak kurs z obsługi nowego SIEM‑a.

Drugi wektor to komunikacja z zarządem. Ryzyko AI trzeba tłumaczyć w języku biznesu, nie w słowniku z konferencji DEF CON. Prosty scenariusz „co jeśli nasz firmowy odpowiednik Firefoksa też ma 271 luk i nikt ich nie znajdzie” zwykle działa na wyobraźnię lepiej niż wykresy. Dobrą praktyką są regularne raporty dla zarządu, w których bezpieczeństwo w kontekście AI jest osobną sekcją, a nie dopisanym na końcu akapitem.

Duzi gracze AI sami zaczynają formalnie organizować bezpieczeństwo. Pojawiają się stanowiska skupione wyłącznie na przygotowaniu na ryzyka systemowe i scenariusze „czarnego łabędzia”. Przykładem jest nowa rola Head of Preparedness w OpenAI, o której szerzej piszę w analizie strategii bezpieczeństwa OpenAI. To sygnał dla zarządów: bezpieczeństwo AI nie jest już eksperymentem w labie, tylko tematem ze slajdów dla rady nadzorczej.

Od strony operacyjnej dochodzi jeszcze polityka korzystania z zewnętrznych modeli: jakie dane wolno wysyłać do chmury, które zadania wymagają izolowanego środowiska, jak często przeprowadzać testy red‑teamingowe z użyciem AI. Coraz częściej firmy organizują wewnętrzne „hackatony bezpieczeństwa”, gdzie developerzy i zespół security wspólnie atakują własne systemy z pomocą modeli, a potem w tej samej konfiguracji bronią się przed tymi samymi wektorami.

Przy okazji bezpieczeństwa firm pojawia się też mniej oczywisty temat – bezpieczeństwo podróży. Zespoły latają na konferencje, roadshow, spotkania z partnerami. Przy ocenie ryzyka wyjazdu przydają się serwisy w rodzaju HikersBay, które pomagają szybko zorientować się w poziomie bezpieczeństwa czy kosztach życia w danym mieście. To drobiazg, ale jeśli firma poważnie myśli o bezpieczeństwie, to myśli o nim nie tylko w data center.

Regulacje, etyka i co dalej: od cyfrowych sobowtórów po odpowiedzialność za ataki z udziałem AI

Pytanie, które coraz częściej pada w kuluarach konferencji: kto jest odpowiedzialny, gdy atak oparty na Mythosie czy GPT‑5.5 wykorzystuje luki odkryte automatycznie w przeglądarce? Twórca modelu, operator, który go odpalił, czy tylko sam atakujący? To nie jest już abstrakcyjna debata dla prawników. Regulatorzy w Unii Europejskiej i na innych rynkach projektują właśnie przepisy dotyczące systemów wysokiego ryzyka i obowiązków producentów modeli.

Równolegle narasta temat cyfrowych sobowtórów. Modele zdolne do idealnego naśladowania głosu lub wizerunku mogą być użyte do ataków na zarządy, inwestorów czy partnerów biznesowych: fałszywe wystąpienie prezesa, spreparowana wypowiedź członka rady nadzorczej, „nagranie” z poufnego spotkania. W osobnym tekście o AI i zmarłych gwiazdach opisuję, jak trudne stają się pytania o prawo do wizerunku, zgodę i granice komercjalizacji – w cyberbezpieczeństwie te same dylematy nabierają jeszcze bardziej konkretnych konsekwencji.

W debacie regulacyjnej przewijają się dziś kilka głównych kierunków. Obowiązkowe testy modeli przed wdrożeniem, z naciskiem na scenariusze ofensywne. Wymóg dokumentowania sposobu użycia AI w systemach krytycznych – od bankowości po infrastrukturę. Rosnąca odpowiedzialność zarządów za wdrażanie standardów bezpieczeństwa AI, podobnie jak stało się to wcześniej z ochroną danych osobowych. Część ekspertów postuluje też, by zgłaszanie incydentów, w których atakujący korzystali z generatywnej AI, było obowiązkowe, a nie dobrowolne.

Na tym tle 271 luk w Firefoksie odkrytych przez AI przestaje wyglądać jak jednorazowa wpadka konkretnej przeglądarki. To raczej zapowiedź nowego układu sił między atakującymi a obrońcami. Firmy, które dziś potraktują Mythos, GPT‑5.5 i ich następców jako realny element strategii bezpieczeństwa – z całym ciężarem organizacji, procedur i odpowiedzialności – jutro będą miały trochę mniej przykrych niespodzianek. Reszta dowie się o zmianie reguł gry z kolejnego raportu o „niespodziewanie” odkrytych setkach luk w produkcie, z którego korzystają ich klienci.