Gemma 4 Mercek Altında: E4B ve 26B Modellerinin Mimari ve Performans Analizi
Merhabalar, uzun süredir blog yazısı yayınlamıyorum; bunun bir nedeni de yoğun bir şekilde yapay zeka ve derin öğrenme işlerinde olmamdan kaynaklanıyor. Bu yazımda sizlerle birlikte son zamanda uğraştığım Gemma 4 modelleri üzerinde duracağız. Bu yazıda mimariyi kıyaslayacağız, modellerin nasıl çalıştığını gözlemleyeceğiz. Buna ek olarak 5’er prompt yazdım ve verdiği yanıtları karşılaştırdım. İsterseniz bunları yakından inceleyelim.
Kaputun Altındaki Fark: Yoğun (Dense) vs. MoE Mimarisi
Gemma 4 ailesi, aynı temel üzerine inşa edilse de çalışma mantığı olarak iki farklı uç noktayı temsil ediyor.
- Gemma 4 E4B: “Yoğun” (Dense) mimariye sahip bu modelde, her işlem sırasında 4 milyar parametrenin tamamı aktif olarak çalışır. Katman başına yerleştirme (PLE) teknolojisi sayesinde, veriyi işlerken bellek verimliliğini maksimize eder ve yerel cihazlarda yüksek hız sunar.
- Gemma 4 26B (A4B): “Uzmanların Karışımı” (MoE) mimarisini kullanan bu dev model, toplamda 26 milyar parametreye sahiptir. Ancak en büyük numarası, her sorgu için bu parametrelerin sadece “akıllı” 4 milyarını kullanmasıdır. Bu sayede devasa bir bilgi havuzuna sahip olurken, işlem hızını 4B seviyesinde tutmayı başarır.
Prompting ve verilen cevapları kıyaslama.
Bu testlerde belirgin farklardan biri, A4B’nin cevaplarının genellikle daha stratejik olması ancak yanıt süresinin (tüm modelin belleğe yüklenme gereksinimi nedeniyle) biraz daha uzun sürebilmesidir. İşte sonuçlar:
Prompt 1: Çocuklar İçin Bilim
Promptumuz: “Bana fotosentezin nasıl gerçekleştiğini 10 yaşındaki bir çocuğun anlayacağı şekilde, sadece 3 cümlede anlat.”
- Gemma 4 E4B: Yaprakları bir mutfağa benzeterek süreci açıklıyor; ek olarak “klorofil” terimini ve güneş enerjisinin nasıl yakalandığını basit bir dille anlatıyor. +1
- Gemma 4 26B: Benzer bir mutfak analojisi kullansa da, süreci teknik terimlere boğmadan güneş ışığı, su ve karbondioksit birleşimini bir “sihirli işlem” olarak tanımlıyor.
Prompt 2: Haftalık Vegan Diyet Programı Oluşturma
Promptumuz: “Bana haftalık 2000 kalorilik vegan bir diyet listesi çıkar. Ardından bu listeye dayanarak markette hangi reyonlara gitmem gerektiğini gösteren kategorize edilmiş bir alışveriş listesi yap.”
- Gemma 4 E4B: Kullanıcı dostu, Pazartesi’den Pazar’a tam bir haftalık tablo sunuyor. Tofu scramble gibi pratik öğünlerin yanında, vegan beslenmede kritik olan B12 vitamini takviyesi uyarısını yaparak sağlık bilincini ön plana çıkarıyor.
- Gemma 4 26B: İsrafı önlemeye yönelik çok stratejik bir “Döngüsel Plan” (3 kahvaltı, 3 öğle, 3 akşam seçeneğini döndürme) kuruyor. Ayrıca “besin mayası” gibi vegan mutfağının spesifik malzemelerini bilerek listeye ekliyor
Prompt 3: Daktilonun Sitem Dolu Mektubu
Promptumuz: “Eski bir daktilonun ağzından, onu artık kullanmayan ve sürekli tabletinde yazı yazan sahibine sitemkar ama onu hala çok seven edebi bir mektup yaz.”
- Gemma 4 E4B: Konuya çok daha kişisel ve duygusal yaklaşıyor (“Canım Dostum” hitabı gibi). “Tak-tok” gibi ses taklitleri (onomatope) kullanarak metne duyusal bir derinlik katarken, tabletleri “soğuk dikdörtgen” diyerek tatlı bir şekilde eleştiriyor.
- Gemma 4 26B: Metni daha felsefi ve teknik bir boyuta taşıyor. Yazma eylemini bir “savaş” ve kağıdı bir “zafer” alanı olarak betimleyerek, “mekanik direnç” gibi derin kavramlara odaklanıyor.
Prompt 4: Ev Arkadaşına Mesaj
Promptumuz: “Ev arkadaşım sürekli mutfağı darmadağın bırakıyor. Onu kırmadan, evdeki huzuru bozmadan ama bu konudaki rahatsızlığımı da net bir şekilde hissettirecek tatlı sert bir WhatsApp mesajı yazar mısın?”
- Gemma 4 E4B: Çözüme espriyle yaklaşıyor (“Mutfak Dedektifi” gibi yaratıcı girişler yapıyor). Sorunu kişiselleştirmekten kaçınıyor ve doğrudan ortak yaşam alanının önemine vurgu yapıyor.
- Gemma 4 26B: İletişim psikolojisini devreye sokarak “Ben dili” kullanımına odaklanıyor. Kullanıcıya tek bir mesaj vermek yerine; yumuşak, sınır çizen ve esprili olmak üzere 3 farklı mesaj senaryosu sunuyor ve mesaj sonrası olası durumların yönetimi için ipuçları ekliyor.
Prompt 5: Gizli İstanbul Rotası
Promptumuz: “Bütçesi kısıtlı ama macerayı seven bir çift için, İstanbul’da geçecek ve klasik turistik yerleri (Galata Kulesi, Ayasofya vb.) kesinlikle içermeyen, sıra dışı bir hafta sonu rotası planla.”
- Gemma 4 E4B: Tamamen “Yerel Yaşam” hissiyatına odaklanıyor. Kadıköy’ün arka sokakları, esnaf lokantaları ve Kuzguncuk’un tarihi mahalle kültürü gibi sıcak, kültürel rotalar çiziyor.
- Gemma 4 26B: Daha sıra dışı konseptler üretiyor. Cumartesi günü için “Endüstriyel Estetik” temasıyla Feriköy ve Bomonti graffitilerini, Pazar günü içinse Anadolu Kavağı’nda Yoros Kalesi trekking (doğa yürüyüşü) rotasını planlıyor.
Bu prompt ve çıktıların hepsini görmek isterseniz bu linke tıklayarak gerçek cevapları ve promptları inceleyebilirsiniz.
Son söz
Toparlamak gerekirse; MoE (A4B) ve Yoğun (E4B) mimarileri arasındaki bu farklar, aslında projelerimizin karakterini belirliyor. Eğer küçük donanımda iyi işler çıkartmak isterseniz E4B gayet iyi bir seçim olur. Eğer sınırları zorlamak istiyorum derseniz bu sefer 26B A4B modelini kullanabilirsiniz. Şimdilik anlatacaklarım bu kadar. Böyle yazılar fırsat buldukça yazmaya devam edeceğim.
Başka yazılarda görüşmek üzere! Hoşçakalın.