Çin merkezli yapay zeka şirketi DeepSeek, yeni nesil R2 yapay zeka modelini geliştirme çalışmalarını sürdürüyor. Bu yeni modelle ilgili gelen ilk bilgiler oldukça çarpıcı.
Özellikle dikkat çeken bir iddia, DeepSeek R2 modelinin eğitim maliyetinin, sektördeki önemli oyunculardan OpenAI’nin GPT-4 modeline göre yüzde 97 oranında daha düşük olabileceği yönünde.
Eğitim sürecinin ise tamamen Huawei’nin Ascend 910B yapay zeka GPU’ları (grafik işlem birimleri) kullanılarak gerçekleştirildiği ifade ediliyor.
MALİYET AVANTAJI
DeepSeek R2’nin, önceki R1 modelinin parametre sayısını iki katına çıkararak toplamda 1.2 trilyon parametreye sahip olacağı iddiaları da ortaya atılıyor.
Maliyet açısından ise, GPT-4 modeline kıyasla yüzde 97.3 oranında daha ucuz olduğu belirtiliyor.
Bu bilgiler doğru çıkarsa, DeepSeek R2, piyasada en düşük maliyetli yapay zeka modellerinden biri olma potansiyeline sahip ve özellikle şirketler için cazip bir seçenek sunabilir.
Ayrıca, DeepSeek R2’nin eğitim sürecinde Huawei’nin Ascend 910B yapay zeka çip setinden yüzde 82 oranında verimlilik elde edildiği iddia ediliyor.
Bu durum, DeepSeek’in yeni yapay zeka modeli için yerel kaynakları etkin bir biçimde kullandığını gösteriyor.
Huawei yapay zeka çiplerinin kullanımı, şirketin yapay zeka tedarik zincirini kendi modeline entegre etmesine olanak tanırken, dışa bağımlılığı da azaltıyor.