Derecelendirme

ELO vs Glicko vs TrueSkill: Küçük Ligler İçin Hangi Derecelendirme Sistemi Daha Adil?

Rekabet · 3 Mart 2026 · 5 dk okuma · 88 görüntülenme

Küçük liglerde doğru derecelendirme sistemi seçmek hem rekabet dengesini korur hem de oyuncu memnuniyetini artırır. Ancak hangi sistem; ELO, Glicko veya TrueSkill — küçük liglerin ihtiyaçlarına göre gerçekten daha adildir? Bu yazıda aktiflik, takım boyutu ve hile direnci gibi pratik kriterler üzerinden derinlemesine karşılaştırma yapıyor, örnekler ve uygulanabilir öneriler sunuyorum.

Giriş: Neden doğru sistem kritik?

Küçük liglerin dinamikleri büyük liglerden farklıdır: maç sıklığı düşüktür, oyuncu sayısı sınırlıdır ve takım kompozisyonları sık değişebilir. Bu koşullar altında bir derecelendirme sistemi yanlış sinyaller üretebilir — örneğin güçlü oyuncular yüksek gözlemsel hata (noise) yüzünden yanlış sınıflandırılabilir veya haksız avantajlar ortaya çıkabilir. Bu nedenle sistem seçimi, sadece doğruluk değil aynı zamanda uygulanabilirlik, şeffaflık ve hileye karşı dayanıklılık üzerinden değerlendirilmelidir.

ELO, Glicko ve TrueSkill — Temel farklar

ELO: Basit ve yaygın

ELO, iki oyunculu (ya da takımların tek bir puana indirgenebildiği) rekabetlerde kullanılan en basit sistemdir. Güncelleme formülü beklenti (expected score) üzerinden çalışır ve sadece mevcut rating ile maç sonucu kullanılır.

Avantaj: Uygulaması ve açıklaması kolay; düşük hesaplama maliyeti.
Dezavantaj: Oyuncu belirsizliğini (uncertainty) doğrudan modellemez; çok az maç yapanlarda puan güvenilir olmayabilir.

Glicko (ve Glicko-2): Belirsizliği hesaba katan ELO türevi

Glicko, her oyuncuya bir rating ve bir de RD (rating deviation) atar. RD, oyuncunun gerçek seviyesinin tahminindeki belirsizliği gösterir. Glicko-2 ayrıca volatilitiy (oyuncu performansındaki değişkenlik) kavramını ekler.

Avantaj: Az maç yapan oyuncuların belirsizliği açıkça modelleyerek daha doğru geçişler sağlar; ilk yerleşim daha esnektir.
Dezavantaj: İdeal parametreleri bulmak ELO'ya göre daha karmaşıktır; uygulama biraz daha hesaplama gerektirir.

TrueSkill: Takım tabanlı ve tam istatistiksel model

Microsoft tarafından geliştirilen TrueSkill, oyuncuların yeteneklerini normal dağılım parametreleri (mu, sigma) ile temsil eder ve takım maçlarını doğal olarak destekler. Ayrıca eş zamanlı olarak tüm takım üyelerinin katkısını modelleyebilir.

Avantaj: Takım boyutları değişken olan ligler için uygundur; belirsizlik ve performans değişkenliği doğrudan model içinde yer alır.
Dezavantaj: En karmaşık ve hesaplama yoğun yöntem; doğru kullanımı için istatistiksel bilgi gerekir.

Karşılaştırma Kriterleri

Şimdi üç sistemi küçük liglerin sıkıntılarına göre karşılaştıralım: aktiflik (maç sıklığı), takım boyutu ve hile / manipülasyona karşı dayanıklılık.

1) Aktiflik: Az maç yapan oyuncular

Küçük liglerde oyuncular haftada 1-2 maç oynayabilir veya ayda bir. Bu durumda:

ELO: Az maçla ELO puanı çok oynayabilir; yeni gelen güçlü oyuncular uzun süre düşük puanda kalarak lig dengesini bozabilir.
Glicko: RD sayesinde az maç yapanların puanı daha yüksek belirsizlikle gösterilir; yeni maçlarda bu belirsizlik hızla düzelir. Bu, küçük liglerde hızlı konverjans için faydalıdır.
TrueSkill: Sigma (belirsizlik) ile benzer fayda sağlar; ayrıca takım içi varyasyonu değerlendirir. Özellikle bireysel performans verisi azsa TrueSkill'in toplu güncelleme yeteneği işe yarar.

Pratik tüyolar: Küçük liglerde kısa bir provisional (deneme) dönemi (ör. 5 maç) uygulayın ve bu dönemde RD/sigma yüksek olsun. Böylece ilk yerleşim hataları kısa sürede düzelir.

2) Takım boyutu: Sabit mi, değişken mi?

Takım yapısı değişkense (2v2, 3v3 karışık) veya ligde eşleşmelerde rastgele takımlar kuruluyorsa:

ELO: Takım oyunlarını tek bir puana indirgemek gerekir; bu süreç bilgi kaybettirir ve bireysel katkıyı hesaba katmaz.
Glicko: Aslında takım maçlarını desteklemek mümkün ama model doğrudan takım kompozisyonunu ayrıştırmaz.
TrueSkill: Takım boyutları ve değişken kompozisyonlar için en doğal seçimdir; her oyuncunun etkisini izole eder.

Örnek: 3v3 maçta bir oyuncu sürekli olurken diğerleri değişiyorsa, TrueSkill o oyuncunun sigma değerini düşürerek daha doğru bir yetenek tahmini verir.

3) Hile direnci ve manipülasyon

Hile ve manipülasyon küçük liglerde daha yıkıcıdır çünkü az sayıda maç tüm sıralamayı bozabilir.

ELO: Basitliği hile tespitini zorlaştırmaz; ama anormal sonuçlar güçlü bir etki yapar (ör. yüksek seviye oyuncunun düşük seviyeye kasması).
Glicko: RD artışı anormal aktivite veya belirsizlik durumlarını işaret eder; toplu olarak RD takibi şüpheli davranışları ortaya çıkarabilir.
TrueSkill: Sigma ve modelin bütünsel güncelleme yaklaşımı, tek seferlik anomalilerin etkisini azaltabilir; ancak karmaşık hile senaryolarında mutlaka ek kurallar (rapor sistemi, manuel inceleme) gereklidir.

Not: Hileye karşı en etkili savunma tekniksel model değil, model + politika kombinasyonudur: hesap doğrulama, minimum maç sayısı, IP denetimi, rapor ve itiraz mekanizması.

Hangi durumda hangi sistemi seçmelisiniz?

Aşağıda sık görülen küçük lig senaryoları ve öneriler yer alıyor.

Çok az maç, bireysel rekabet (ör. haftada 1 maç) : Glicko tercih edin. RD, ilk belirsizlikleri yönetir; parametreleri (tau, RD limitleri) ile oynayarak lig içi ritme uyarlama yapılabilir.
Farklı takım boyutları veya sık takım değişimleri : TrueSkill en adil seçimdir. Takım kompozisyonu bilgisiyle bireysel katkıyı daha doğru tahmin eder.
Basit, düşük kaynaklı uygulama isteniyorsa : ELO iş görür; fakat provisional maç sayısını artırın ve düzenli yeniden calibrasyon uygulayın.
Hile riski yüksekse : Glicko veya TrueSkill ile birlikte ek politikalar uygulayın; anomalileri RD/sigma üzerinden otomatik işaretleyin.

Uygulamaya geçirirken pratik öneriler

Başlangıç (placement) maçları: 5-10 maçlık provisional dönem ile başlayın; bu süre boyunca oyuncuların RD/sigma yüksek tutulur.
Minimum maç kuralı: Haftada/ayda belirli maç sayısının altındaki oyuncuları ayrı klasmanda gösterin veya puan değişimini sınırlandırın.
RD/Sigma takibi: Glicko/TrueSkill kullanıyorsanız RD/sigma'yı yöneticiler için gösterin; ani düşüş veya yükselişleri otomatik bayraklayın.
Ağırlıklandırma: Büyük turnuvalar veya playoff maçlarına daha yüksek K (ELO) veya daha düşük RD etkisi uygulayın — böylece kritik maçlar daha belirleyici olur.
Şeffaflık: Oyunculara hangi parametrelerin kullanıldığını ve provisional kurallarını açıkça söyleyin; güven artırır.

Sonuç: Küçük ligler için en adil seçim hangisi?

Kısa cevap: Duruma göre değişir. Ancak pratikte:

Eğer lig çoğunlukla bireysel ve maç sıklığı düşükse, Glicko genellikle en dengeli tercihtir.
Eğer takım boyutları değişken veya takım tabanlı rekabet ön plandaysa, TrueSkill en adildir.
Basitlik ve düşük teknik maliyet öncelikliyse, dikkatli parametre ayarıyla ELO yeterli olabilir.

Son öneri: Küçük liglerde hiçbir sistem tek başına mucize değildir. En iyi sonuç, doğru derecelendirme modelini politikalar (minimum maç, provisional dönem, hile tespiti) ve düzenli izleme ile birleştirdiğinizde ortaya çıkar.

Kısa aksiyon listesi (uygulamaya hızlı geçiş için)

Lig yapısını analiz edin: maç sıklığı, takım bileşimi, oyuncu sayısı.
Glicko ile pilot uygulama yapın (1-2 ay) — RD hareketlerini gözlemleyin.
TrueSkill düşünüyorsanız küçük bir test grubu ile takım maçlarını simüle edin.
Hile politikaları ve minimum maç kurallarını aynı anda devreye alın.

Özetle, küçük liglerde adillik ancak modelin belirsizlikleri doğru yönetmesi, takım dinamiklerini hesaba katması ve hileye karşı proaktif politikalarla desteklenmesiyle sağlanır. Hangi sistemi tercih ederseniz edin, veri toplayın, izleyin ve parametreleri lig gerçeklerine göre düzenleyin.