Wyścig pośród największych firm zajmujących się sztuczną inteligencją trwa na dobre. Anthropic, twórca czatbota i modelu AI Claude 3, rzuca wyzwanie dotychczasowym liderom rynku, czyli ChatGPT i Microsoft Copilot. Testy porównawcze wskazują, że Claude 3 przewyższa możliwościami ChatGPT 4 od OpenAI pod wieloma względami. Czy tak jest naprawdę? Sprawdźmy.
Na początku warto zaznaczyć, że Claude 3, dostępny jest w trzech wariantach Opus, Sonnet i Haiku. Sonnet jest dostępny w ograniczonej formie w darmowym planie (co już bije na głowę ChatGPT, za który w wersji najnowszej, czyli GPT4 trzeba zapłacić), pozostałe modele takie jak Opus, dostępne są w formie płatnej w przystępnych planach cenowych.
Claude 3 – wiedza ekspercka
Modele Opus, Sonnet i Haiku wykazują wyższą dokładność niż ChatGPT 4 w wiedzy eksperckiej na poziomie licencjackim (86,8% vs 86,4%), rozumowaniu na poziomie magisterskim (50,4% vs 35,7%), matematyce szkolnej (95% vs 92%), rozwiązywaniu problemów matematycznych (60,1% vs 52,9%), kodowaniu (84,9% vs 67%) oraz rozumowaniu nad tekstem (83,1% vs 80,9%). Zobaczcie zestawienie poniżej:

Bierzcie tylko pod uwagę, że to porównanie zostało dostarczone przez firmę Anthropic, więc należy to traktować z pewną dozą sceptycyzmu.
Multimodalne możliwości i kontekst
Oprócz wysokiej dokładności, Claude 3 oferuje zaawansowane możliwości multimodalne, umożliwiając zaawansowaną analizę zarówno tekstu, jak i obrazów. Ta funkcja ma kluczowe znaczenie dla przetwarzania złożonych, nieustrukturyzowanych informacji w różnych formatach, co pozwala na bardziej kompleksowe zrozumienie danych niezależnie od ich prezentacji. Zachwytom na temat możliwości czatbota w tej dziedzinie na Twitterze nie ma końca.
Ponadto, Claude 3 wyposażony jest w standardowe okno kontekstowe o rozmiarze 200 tys. tokenów (około 800 stron) oraz możliwość obsługi 1 miliona tokenów w zastosowaniach korporacyjnych i specyficznych dla danego zadania. Dla mniej ogarniętych w slangu czatbotowym tłumaczę, że to tak jakbyście zadali zapytanie czatbotowi składające się z 800 stron 🙂 Zdaniem Anthropic on ma perfekcyjnie ogarnąć takie kompleksowe prompty i ze zrozumieniem zwrócić odpowiedź.
Wracając do tematu, to ogromna przewaga nad ChatGPT 4, który obecnie oferuje 32 tys. tokenów publicznie (128 tys. tokenów w wersji prywatnej).
Testy wykazały, że modele Claude 3 wyśmienicie radzą sobie z zapamiętywaniem i wykorzystywaniem ogromnych ilości informacji, prawie zawsze znajdując odpowiednie szczegóły w obszernych danych.

Niższe koszty i wysiłki na rzecz bezpieczeństwa AI
Claude Opus, flagowy model serii, oferowany jest w przystępnej cenie 15 dolarów za milion tokenów, co odzwierciedla trwający trend spadku kosztów przetwarzania danych w AI. To również zdecydowanie taniej niż ChatGPT w wersji 4.
Anthropic deklaruje też, że modele Claude 3 są neutralne i zaprojektowane z myślą o rozwiązywaniu problemów związanych z AI oraz zagrożeń, takich jak dezinformacja i naruszenia prywatności. Firma stosuje ramy „konstytucyjnej AI” w celu monitorowania i zwiększania bezpieczeństwa oraz neutralności modeli, chociaż całkowite wyeliminowanie uprzedzeń pozostaje wyzwaniem. To oczywiście takie marketingowe bajania, ale warto przetestować Claude pod tym kątem.
Konkurencja dla ChatGPT i Microsoft Copilot?
Chociaż Claude 3 nie jest wolny od ograniczeń, to na pewno stanowi poważną konkurencję dla dotychczasowych liderów rynku AI, takich jak OpenAI czy też Microsoft. Dzięki wyższej dokładności, zaawansowanym możliwościom multimodalnym, rozszerzonemu oknu kontekstowemu oraz konkurencyjnym cenom, Anthropic stawia się w roli nowego, obiecującego gracza w przestrzeni sztucznej inteligencji. Czatbota przetestujecie tutaj.