Giriş
Yerel ligler — satranç kulüpleri, mahalli e-spor turnuvaları veya haftalık masa tenisi ligleri — adil ve işe yarar bir derecelendirme sistemi gerektirir. Bu yazıda ELO, Glicko ve TrueSkill sistemlerini uzman gözüyle inceliyor; her birinin hangi koşullarda daha adil ve pratik olduğunu örneklerle açıklıyoruz.
ELO, Glicko ve TrueSkill: Kısa Tanıtım
ELO: Basit ve yaygın
ELO, tarihte en çok bilinen puanlama sistemlerinden biridir. Temel fikir: bir oyuncunun beklenen skoru, rakiplerin puan farkına bağlıdır. Beklenen skor E = 1 / (1 + 10^{(R_b - R_a)/400}) formülüyle hesaplanır. Gerçek sonuç (0-1 arası) ile beklenti arasındaki fark puanı etkiler. K-factor (katsayı) sistemi ne kadar hızlı güncelleneceğini belirler.
Glicko: Güven aralığı (RD) ekler
Glicko, ELO'nun dezavantajlarına yanıt olarak geliştirildi. Her oyuncu için yalnızca bir skor değil, aynı zamanda bir rating deviation (RD) yani belirsizlik değeri de tutulur. RD büyükse o oyuncunun gerçek gücü konusunda belirsizlik fazladır; RD küçükse puan daha güvenilirdir. Glicko-2 sürümlerinde ayrıca volatilite (sigma) parametresi vardır; oyuncunun performans değişkenliği modele alınır.
TrueSkill: Bayesian yaklaşım ve takımlar
TrueSkill Microsoft tarafından geliştirilmiş, Bayesian istatistik tabanlı bir sistemdir. Her oyuncu için ortalama (mu) ve belirsizlik (sigma) tutulur. TrueSkill takımlar halinde maçları doğal şekilde işler ve eşzamanlı çoklu oyuncu sonuçlarını (örneğin 4 takımlı bir maç) destekler. Güncellemeler, oyuncuların olası gerçek yetenek dağılımını güncelleyen istatistiksel işlemlerle yapılır.
Karşılaştırma Kriterleri
Hangi sistem daha adil sorusunu cevaplamak için kriterlerimiz:
- Hızlı adaptasyon: Yeni veya hızla değişen oyuncu gücü
- Belirsizlik yönetimi: Az maç yapmış oyuncuların güvenilirliği
- Takım maçları ve çoklu oyuncu sonuçları
- Beraberlik/draw yönetimi
- Basitlik ve açıklanabilirlik
- Hesaplama maliyeti ve uygulama kolaylığı
Derinlemesine Karşılaştırma
1) Adalet ve doğruluk
ELO: İyi seçim olduğunda uzun vadede makul bir sıralama verir; ancak yeni oyuncular veya düşük maç sayısında yanıltıcı olabilir. K-factor ile belli ölçüde telafi edilebilir.
Glicko: RD sayesinde az maçlı oyuncuların belirsizliği görünür olur; bu yüzden hem adil hem de doğru sonuç verir. Özellikle maç hacmi düzensiz ise iyi çalışır.
TrueSkill: Bayesian güncellemeler daha güçlüdür; özellikle takım bazlı veya çok oyunculu senaryolarda doğruluğu yüksektir. Kısa sürede daha doğru sıralamalar üretebilir.
2) Yeni oyuncular ve az maç
ELO'da yeni oyuncu başlangıç puanı önemlidir; yanlış başlangıçler uzun süre etkili olur. Glicko ve TrueSkill başlangıç belirsizliğini kullanarak yeni oyuncuları daha doğru değerlendirir. Örnek: Haftada 2 maç yapan yeni bir oyuncu Glicko/TrueSkill ile daha hızlı güvenilir hale gelirken ELO ile yüksek K gerekebilir ve sıra dalgalanması artar.
3) Takım maçları ve çoklu katılımcı maçlar
Takım tabanlı liglerde TrueSkill öne çıkar; çünkü takım performansını oyuncu seviyesine ayrıştırmak için tasarlanmıştır. ELO basit tekveto eşleşmelerde uygundur; takım maçlarında ek dönüşümler veya ortalamalar gerektirir. Glicko takımlar için genişletilebilir ama TrueSkill kadar yerleşik değildir.
4) Beraberlik (draw) ve maal sonuçları
Satranç gibi beraberliğin sık olduğu sporlarda ELO ve Glicko iyi çalışır; beraberlik beklenen değere göre uygun güncelleme yapar. TrueSkill de beraberlikleri kabul eder ancak parametre ayarına dikkat etmek gerekir (draw margin).
5) Şeffaflık ve kabul edilebilirlik
ELO en şeffaf olanıdır; formülü basittir ve oyuncular sonuçlarını kolayca anlayabilir. Glicko biraz daha karmaşıktır ama yine açıklanabilir. TrueSkill, bayesyen hesaplar nedeniyle oyunculara tam formülle anlatılması zor olabilir; ancak sonuçlar genelde daha adildir.
6) Hesaplama ve uygulama maliyeti
ELO en az hesaplama gerektirir. Glicko orta düzeyde, TrueSkill ise takım hesapları ve dağılım güncellemeleri nedeniyle daha fazla hesaplama ister. Yerel liglerde modern sunucular için TrueSkill'in maliyeti genellikle sorun olmaz; ancak düşük kaynaklı sistemlerde ELO veya Glicko tercih edilebilir.
Pratik Senaryolar ve Öneriler
Küçük, haftada birkaç maç yapan amatör lig
- Öneri: Glicko.
- Neden: Az maç sayısı ve düzensiz katılım nedeniyle belirsizliği (RD) modellemek adaleti artırır.
- İpucu: RD için başlangıç değeri yüksek verin; düzenli maç yapanların RD'sini zamanla düşürün.
Hızlı tempolu, sık oynanan e-spor ligi (takım maçları)
- Öneri: TrueSkill.
- Neden: Takım kombinasyonlarını ve bireysel katkıları daha iyi ayırır; sık maçlarda hızlı adaptasyon sağlar.
- İpucu: Maç sonu güncellemeleri gerçek zamanlı yapılırsa eşleştirme kalitesi yükselir.
Satranç veya tekli, dengeli maçların olduğu lig
- Öneri: ELO veya Glicko.
- Neden: ELO'nun şeffaflığı oyuncu kabulü sağlar; Glicko ise yeni oyunculara karşı daha adildir.
- İpucu: Eğer beraberlik yaygınsa ELO iyi işler; eşzamanlı RD takibi isteniyorsa Glicko'yu tercih edin.
Kısa süreli turnuvalar ve az sayıda maç
- Öneri: TrueSkill tercih edilebilir.
- Neden: Az sayıda maçla bile Bayesian güncellemeler daha güvenilir sonuç verebilir.
Uygulama ve Ayar Önerileri
Her sistemin başarılı uygulanması için dikkat edilecek noktalar:
- Başlangıç puanı: Yeni oyuncuya atanan başlangıç puanı büyük etki yapar. Glicko/TrueSkill'de belirsizliği yüksek tutmak daha güvenlidir.
- Katsayı/K-Factor: Lig istikrarına göre ayarlayın. Rekabet seviyesinin yüksek olduğu liglerde düşük K, yeni oyuncuların çok olduğu liglerde yüksek K daha uygundur.
- İzleme: Zaman içinde rating dağılımını gözleyin; inflation veya deflation varsa parametreleri yeniden değerlendirin.
- İnaktivite: Uzun süre oynamayanların belirsizlik değerini artırın (RD/sigma yükseltilir) ki geri döndüklerinde hızla yeniden değerlendirilebilsinler.
- Manipülasyona karşı koruma: Sandbagging (bilerek düşük puan tutup kolay maç kazanma) için minimum maç sayısı ve performans değişim limitleri uygulayın.
Örnek: Glicko ile Basit Güncelleme Mantığı
Oyuncu A RD'si yüksek (ör. 350) ve oyuncu B RD'si düşük (50) olsun. A, güçlü bir rakibi yenerse RD düşer ve puan yükselir; çünkü beklenen sonuçta A'nın belirsizliği hesaba katılır. Bu durum, ligde nadir maç yapan kişilerin aşırı dalgalanmasını engeller ve puanın güvenilirliğini artırır.
Pratik not: Küçük yerel liglerde adil sonuç almak için genellikle Glicko en 'çok yönlü' çözümdür; takımlar ve sık maç içeren ortamda TrueSkill'e geçiş düşünün.
Uygulama Araçları ve Kaynaklar (Kısa)
Çoğu dilde hazır kütüphaneler bulunur. ELO basit bir fonksiyonla uygulanabilir. Glicko ve TrueSkill için açık kaynak kütüphaneler ve paketler mevcuttur. Gerçek zamanlı eşleştirme ihtiyacı varsa TrueSkill tabanlı çözümler daha fazla altyapı gerektirebilir.
Sonuç
Tek bir "en adil" sistem yoktur; her biri belirli koşullarda daha uygundur. Özetle:
- ELO: Basit, şeffaf, tekli maçlar için ideal.
- Glicko: Düşük maç sayısı, düzensiz katılım ve belirsizlik yönetimi gereken yerel ligler için genelde en pratiktir.
- TrueSkill: Takım maçları, sık oynanan ligler ve hızlı adaptasyon gereken durumlarda en güçlü tercihtir.
Lig kurucuları için öneri: Başlangıçta Glicko ile başlayın; zamanla maç hacmi ve takım bazlı ihtiyaç artıyorsa TrueSkill'e geçmeyi değerlendirin. ELO ise çok basit, az teknik altyapının olduğu ortamlarda hâlâ makul bir seçimdir.
Kapanış
Bu rehber yerel liginizin koşullarına uygun kararı vermenize yardımcı olmak için hazırlandı. Hangi sistemi uygulamayı düşündüğünüzü ve lig yapınızı paylaşırsanız, daha somut parametre ve uygulama önerileri sunabilirim.