Kayıtlar

yapay zeka maliyet analizi etiketine sahip yayınlar gösteriliyor

DeepSeek Gerçekleri: Efsaneler, Teknolojik Başarılar ve Sosyal Medya İddialarının Analizi

Resim
DeepSeek, son dönemde yapay zeka (YZ) dünyasını sarsan bir Çinli şirket olarak öne çıkıyor. Ancak sosyal medyada dolaşan iddiaların çoğu gerçeği yansıtmıyor. İşte  bilimsel veriler, raporlar ve şeffaf analizlerle  DeepSeek'in başarısının arkasındaki gerçekler: 1. DeepSeek'in Teknolojik Başarısı: MOE Mimarisi ve Verimlilik DeepSeek,  Experts Karışımı (MOE)  mimarisiyle geleneksel modellerden farklılaşıyor. Bu mimari, 671 milyar parametreden sadece  37 milyarını  aktifleştirerek hesaplama maliyetlerini düşürüyor, ancak performansı koruyor  6 . Örneğin: Kodlama görevlerinde  %73.78 başarı oranı (Humaneval testi). Matematik problemlerinde  %84.1 doğruluk (GSM8K testi)  7 . Uzun bağlam penceresi : 128 bin token işleyebilme kapasitesiyle rakiplerini geride bırakıyor  6 . Bu performans,  NVIDIA H800 ve H100 GPU'ları  kullanılarak elde edildi. Ancak ABD ihracat kısıtlamaları nedeniyle H100'ler sınırlı kullanıldı  ...