SaTA Tech

Kayıtlar

MOE mimarisi etiketine sahip yayınlar gösteriliyor

DeepSeek Gerçekleri: Efsaneler, Teknolojik Başarılar ve Sosyal Medya İddialarının Analizi

- Şubat 09, 2025

DeepSeek, son dönemde yapay zeka (YZ) dünyasını sarsan bir Çinli şirket olarak öne çıkıyor. Ancak sosyal medyada dolaşan iddiaların çoğu gerçeği yansıtmıyor. İşte bilimsel veriler, raporlar ve şeffaf analizlerle DeepSeek'in başarısının arkasındaki gerçekler: 1. DeepSeek'in Teknolojik Başarısı: MOE Mimarisi ve Verimlilik DeepSeek, Experts Karışımı (MOE) mimarisiyle geleneksel modellerden farklılaşıyor. Bu mimari, 671 milyar parametreden sadece 37 milyarını aktifleştirerek hesaplama maliyetlerini düşürüyor, ancak performansı koruyor 6 . Örneğin: Kodlama görevlerinde %73.78 başarı oranı (Humaneval testi). Matematik problemlerinde %84.1 doğruluk (GSM8K testi) 7 . Uzun bağlam penceresi : 128 bin token işleyebilme kapasitesiyle rakiplerini geride bırakıyor 6 . Bu performans, NVIDIA H800 ve H100 GPU'ları kullanılarak elde edildi. Ancak ABD ihracat kısıtlamaları nedeniyle H100'ler sınırlı kullanıldı ...

Devamı