
DeepSeek wyróżnia się tym, że jest najwyraźniej znacznie tańszy. Podczas gdy lider branży OpenAI wydał ponad 100 milionów dolarów na rozwój GPT-4, DeepSeek opracował swój model za 6 milionów dolarów. Ta przewaga kosztowa została osiągnięta dzięki zastosowaniu wysokiej klasy chipów Nvidia A100 w połączeniu z innymi stosunkowo tańszymi procesorami.
Eksperci twierdzą, że liczba ta jest myląca, ponieważ nie uwzględnia szerszych kosztów badań i rozwoju, pozyskiwania danych, wydatków na personel, kosztów infrastruktury i inwestycji w sprzęt.
Wydajność i funkcje
Podobnie jak ChatGPT, DeepSeek działa poprzez dostarczanie odpowiedzi na pytania i jest porównywalny z modelem o1 OpenAI w matematyce i kodowaniu. Jest to model „rozumowania”, który myśli i reaguje tak jak ludzie, co czyni go szczególnie przydatnym do celów biznesowych i obsługi klienta.

Performance compared Source: Artificial Analysis Graphic: Jasmine Cui and Joe Murphy / NBC News
System jest szczególnie dobry w demonstrowaniu swojego procesu rozumowania w rozwiązywaniu problemu poprzez rozbicie procesu rozumowania na etapy. Może również, podobnie jak człowiek rozwiązujący łamigłówkę, prześledzić swoją logikę i w razie potrzeby skorygować wcześniejsze kroki.
To przejrzyste podejście pozwala użytkownikom wiedzieć, w jaki sposób dochodzi do swoich rekomendacji.
DeepSeek budzi obawy natury etycznej
Pojawienie się DeepSeek w krajobrazie sztucznej inteligencji rodzi ważne pytania o konsekwencje jego technologii, zwłaszcza biorąc pod uwagę, że został on przeszkolony na szkielecie drogiego sprzętu, który mógł zostać opracowany w celu złamania amerykańskiej kontroli eksportu.Chociaż wydajność jego modelu R1, który jest w stanie odtworzyć funkcjonalność o1 OpenAI, ale za ułamek kosztów, jest imponująca, ujawnia również możliwość niemonitorowanych lub nieetycznych praktyk w rozwoju sztucznej inteligencji w pozostałej części świata.
Zdolność firmy do pomyślnego włączenia chipów Nvidia A100, które wcześniej były ograniczone przez przepisy USA, jest czerwoną flagą dotyczącą autentyczności firmy i tego, jak takie technologie mogą być wykorzystywane do obalenia porządku międzynarodowego.
zgodność reakcji Deep Seek na wrażliwe wydarzenia historyczne z cenzurą chińskiego rządu jest niepokojąca, ponieważ pokazuje, że model ten może być wykorzystywany do wspierania narracji kontrolowanych przez państwo, co może ograniczyć użyteczność i wiarygodność modelu na całym świecie. Tak więc, gdy rynki reagują na to postrzegane zagrożenie dla amerykańskiej supremacji technologicznej, szersze implikacje strategii DeepSeek – innowacyjnej, ale moralnie rozsądnej – muszą zostać dokładnie przeanalizowane.
,