Claude 5 pod lupą: FrontierMath, rynki predykcyjne i wyścig Anthropic vs OpenAI o giełdę

Claude 5 pod lupą: FrontierMath, rynki predykcyjne i wyścig Anthropic vs OpenAI o giełdę

Claude 5, FrontierMath i giełdowe zakłady: o co w ogóle chodzi

Pierwszy raz wszedłem na rynek predykcyjny dotyczący Claude’a „tylko na chwilę”, żeby zobaczyć, o co w tym chodzi. Godzinę później wciąż scrollowałem wykresy, a kawa dawno wystygła. Tak wygląda 2026: modele AI wychodzą częściej niż nowe sezony seriali, a ludzie obstawiają ich wyniki w benchmarkach za prawdziwe pieniądze.

Rynki predykcyjne to w gruncie rzeczy giełda zakładów o przyszłość. Ktoś zadaje pytanie w stylu: „Czy Claude osiągnie X punktów w FrontierMath do 30 czerwca?” albo „Która firma wejdzie pierwsza na giełdę: Anthropic czy OpenAI?”. Inni kupują udziały w odpowiedziach „tak” lub „nie”. Cena takiego udziału w dolarach zamienia się w coś bardzo podobnego do prawdopodobieństwa. Jeśli kontrakt „Anthropic IPO przed OpenAI” kosztuje 0,64 dolara, rynek mówi: „Dajemy temu mniej więcej 64% szans”.

Wokół Claude 5 – następcy linii Claude 3.x – urosła już cała rodzina takich rynków. Jedne dotyczą wyniku na FrontierMath do konkretnej daty, inne pierwszego dnia kapitalizacji Anthropic przy debiucie giełdowym, jeszcze inne bezpośredniego pojedynku: kto szybciej rozpakuje swój prospekt emisyjny, Anthropic czy OpenAI. To nie jest poradnik inwestycyjny. Interesuje mnie bardziej, co społeczność „wycenia” swoim portfelem i jak to wygląda oczami zwykłej osoby: inwestora detalicznego, developera czy kogoś, kto po prostu śledzi wyścig w AI z boku.

Postaram się mówić prosto, bez żargonu, ale bez uciekania od liczb. Bez nich rozmowa o IPO i miliardowych wycenach brzmi jak opowieść o smokach. Fajna, tylko niewiele z niej wynika.

Jak wyniki FrontierMath pompowały wyceny Anthropic i wyobraźnię inwestorów

Claude 5 ma być kolejnym skokiem w stronę modeli, które nie tylko „kojarzą wzorce”, ale potrafią rozwiązywać naprawdę trudne zadania. I właśnie tu pojawia się FrontierMath. To zestaw zadań z matematyki wyższego poziomu – z pogranicza olimpijskiej matmy, teorii algorytmów i zadań, na których wykłada się niejeden doktorant. Chodzi o sprawdzenie, czy model umie rozumować krok po kroku, a nie tylko zgadywać następną frazę.

Na rynkach predykcyjnych FrontierMath stał się czymś w rodzaju „egzaminu państwowego” dla Claude’a. Kontrakty typu „Anthropic Claude score on FrontierMath Benchmark by June 30?” mają już dziesiątki tysięcy dolarów obrotu i płynnie reagują na każdy sygnał: nieoficjalne benchmarki, prezentacje dla partnerów, przecieki od testerów. Gdy rośnie wiara, że Claude dogoni, a może przegoni konkurencję w FrontierMath, od razu widać to w cenach innych rynków.

Po kilku wieczorach researchu w sieci widać prosty schemat. Im więcej optymizmu wokół FrontierMath, tym śmielej wyceniane są scenariusze związane z IPO Anthropic – choćby rynki, które pytają wprost o zamknięcie kapitalizacji w dniu debiutu powyżej 500 czy 600 miliardów dolarów. Jeden z komentatorów finansowych powiedział niedawno w rozmowie, że „Anthropic coraz wyraźniej porządkuje strukturę właścicielską pod wejście na parkiet”, a serwisy informacyjne w stylu euronews.com zaczęły przebąkiwać o rozmowach z bankami inwestycyjnymi i przygotowaniach do kolejnych rund finansowania.

Mechanizm jest dość bezlitosny. Dobre benchmarki → łatwiej sprzedać historię o „przełomowym modelu” → większy apetyt funduszy na kolejne miliardy → rosną oczekiwania co do dnia debiutu. FrontierMath jest sexy dla inwestorów, bo wyższa matematyka uchodzi za namiastkę „prawdziwego rozumowania”. A jeśli model lepiej rozumie dowody, równania i abstrakcyjne struktury, to – w uproszczeniu – powinien też lepiej liczyć ryzyko kredytowe, pisać złożony kod i analizować dane finansowe.

Problem w tym, że rynki zazwyczaj reagują nie tylko na raporty, ale też na hype. Wystarczy jeden głośny tweet o świetnym wyniku w benchmarku, by na kilka dni podbić ceny kontraktów. Granica między „model z najlepszym benchmarkiem” a „firma warta setki miliardów” robi się wtedy cienka jak papier, szczególnie gdy emocje dochodzą do czerwoności.

Kto pierwszy na giełdę: Anthropic czy OpenAI i co naprawdę obstawia społeczność

Najciekawszy dla mnie jest rynek wprost pytający: „Will Anthropic or OpenAI IPO first?”. Wolumen idzie tam już w dziesiątki tysięcy dolarów, a kursy przesuwają się jak wahadło. Raz górą jest OpenAI, innym razem Anthropic. W ostatnich tygodniach coraz częściej widać jednak scenariusz, w którym to Anthropic wychodzi na prowadzenie – kontrakty „Anthropic pierwsze na giełdzie” są po prostu droższe.

W tle pojawiają się doniesienia o rozmowach obu firm z bankami inwestycyjnymi, o rearanżacji udziałów między gigantami Big Tech, a także o tym, jak rynek prywatny zaczyna operować na liczbach z kilkuset miliardami dolarów kapitalizacji. Nie chodzi o jeden przeciek, raczej o to, że te liczby zaczęły się powtarzać w różnych rozmowach. Jeden z anonimowych traderów, z którym wymieniłem kilka wiadomości na czacie, skomentował bez ogródek: „To nie jest kolejna firma SaaS, to nowa warstwa infrastruktury. Jak AWS dla inteligencji”. Tego typu narracje robią swoje.

Jak to wygląda w uproszczonych „szansach”? Na wielu wykresach dominuje scenariusz, że Anthropic wyprzedzi OpenAI na drodze do IPO, ale wciąż zostaje przestrzeń na twist fabularny: opóźnienia regulacyjne, nowe finansowanie prywatne, spektakularny kontrakt rządowy. Część uczestników rynku gra bardzo krótki horyzont – wynik FrontierMath w ciągu dwóch, trzech miesięcy. Inni kupują kontrakty z datą rozstrzygnięcia w perspektywie roku lub dwóch, licząc właśnie na odpowiedź na pytanie: kto pierwszy na parkiet i z jaką mniej więcej kapitalizacją.

Co ważne, wyceny nie kręcą się tylko wokół benchmarków. Liczą się też kontrakty z administracją, regulacje, reputacja i cała otoczka etyczna. W tekście o relacji Pentagonu z Anthropic pisałem już, jak bardzo wojskowe i rządowe zamówienia potrafią zmienić odbiór firmy w oczach inwestorów. OpenAI ma z kolei wielki brand konsumencki, ogromny ruch w ChatGPT i ciężką infrastrukturę po stronie Microsoftu. Anthropic wydaje się nieco „czystszym” zakładem – bez tylu konsumenckich produktów, bardziej skoncentrowanym na samych modelach Claude.

Patrząc po tym, jak ustawiają się kontrakty, coraz częściej mam wrażenie, że społeczność rynków predykcyjnych głosuje portfelem na narrację, w której Anthropic nie tylko technicznie dogania OpenAI, ale pojawia się przed nim na giełdowym gongu.

Co z tego wynika dla inwestorów detalicznych, pracowników IT i ludzi śledzących AI z boku

No dobrze, ale co mnie obchodzi, że ktoś obstawia Claude 5 i FrontierMath za dolary?

Jeśli jesteś inwestorem detalicznym, rynki predykcyjne mogą być dodatkowym termometrem nastrojów. Nie chodzi o to, żeby od razu logować się i handlować kontraktami, tylko żeby zobaczyć, jak rynek wycenia konkretne scenariusze przed tym, jak kupisz ETF technologiczny albo akcje spółki żyjącej z integracji AI. Jeśli widzę, że kontrakty na bardzo wysoką kapitalizację Anthropic przy IPO są wyceniane agresywnie, to sygnał, że prywatny rynek jest już mocno rozgrzany i część bajki o wzrostach została „sprzedana” z wyprzedzeniem. Z drugiej strony, te rynki są turbo wrażliwe na hype – ludzie obstawiają nie tylko kalkulatorem, ale też sercem i timeline’em na X.

Druga perspektywa to pracownicy branży: developerzy, analitycy, produktowcy budujący narzędzia na API modeli. Dla nich wynik FrontierMath czy scenariusz IPO to nie jest abstrakcja. Od tego, kto wygra wyścig po najlepszy model i kto szybciej wejdzie na giełdę, zależy, gdzie wylądują największe budżety na programy partnerskie, granty, cloudowe kredyty, a czasem po prostu: gdzie warto rozwijać swoje skille. W artykule o dodawaniu pełnej internacjonalizacji w NodeJS pokazywałem, jak nowoczesny stack i integracja z AI coraz częściej idą w parze. Dopiero gdy zobaczyłem, ile zespołów traktuje Claude’a jako „drugiego senior developera” przy code review, dotarło do mnie, że te modele naprawdę wchodzą do kodu, a nie tylko do ciekawostek na LinkedInie.

Trzecia grupa to osoby zainteresowane kulturą i etyką AI. Dla nich rynki predykcyjne to trochę jak barometr presji komercyjnej. Im wyżej rynek wycenia Anthropic i OpenAI, tym większa presja, żeby monetyzować modele w każdej możliwej niszy – także tam, gdzie robi się nieprzyjemnie. W tekście o cyfrowych sobowtórach zmarłych gwiazd pisałem, jak bardzo modele generatywne mieszają na rynku treści, głosów i wizerunków. Jeśli inwestorzy zakładają setki miliardów kapitalizacji, presja na „odblokowanie” kontrowersyjnych zastosowań tylko rośnie.

Sam traktuję rynki predykcyjne jako jeden z kilku sygnałów przy śledzeniu AI: obok benchmarków, własnych eksperymentów z modelami i lektury długich raportów finansowych. Czasem sprawdzam je na telefonie gdzieś między kawą a planowaniem kolejnego wyjazdu, przełączając się w tym samym czasie na HikersBay albo przegląd cen noclegów, żeby policzyć sobie budżet podróży. Wysoka technologia spotyka zwykłe życie w jednej przeglądarce.

Na koniec suchy wniosek: FrontierMath da się przeliczyć na dolary, wolumen i kurs kontraktu. Na spokojny sen inwestora już niekoniecznie.


Leave a Reply

Your email address will not be published. Required fields are marked *