Giriş
Küçük ligler, amatör turnuvalar ve lokal rekabet ortamları, büyük rekabet havuzlarına göre farklı zorluklar taşır: daha az maç, düzensiz katılım, yeni oyuncuların sık gelmesi ve sonuçların istatistiksel olarak daha gürültülü olması. Bu bağlamda hangi derecelendirme (rating) sisteminin gerçek performansı, adaleti ve kullanılabilirliği daha iyi yansıttığını anlamak sahadaki karar vericiler için kritik önemdedir. Bu yazıda ELO, Glicko/Glicko-2 ve TrueSkill sistemlerini küçük ligler açısından karşılaştıracağım; teknik farkları, avantajları, dezavantajları, örnek vakalar ve pratik önerilerle sonuca ulaşacağız.
1. Sistemlerin kısa tanıtımı
ELO
ELO, sıfırdan başlayan oyuncuları puanlayıp maç sonuçlarına göre güncelleyen en eski ve en basit yaklaşımdır. Beklenen skor hesaplanır ve gerçek sonuçla farkı K katsayısı ile çarpılarak puana yansır. Basitlik en büyük gücü; hesaplama kolay, anlaşılması basit.
Glicko / Glicko-2
Glicko, ELO'yu geliştiren bir yöntemdir. Her oyuncu için iki değer tutar: ortalama (rating) ve belirsizlik (RD - rating deviation). Glicko-2 ek olarak volatilite (sigma) parametresi ekler. RD, oyuncunun derecesinin ne kadar güvenilir olduğunu gösterir; maç oynanmadıkça RD artar, oynandıkça azalır. Böylece az maç yapan oyuncular daha belirsiz kabul edilir.
TrueSkill
Microsoft tarafından geliştirilen TrueSkill, özellikle takım oyunları ve çoklu oyuncu maçları için uygundur. Her oyuncu için ortalama ve belirsizlik (mu, sigma) tutar ve Bayesçi bir güncelleme mekanizması kullanır. Takımlar, eş zamanlı maçlar ve draw ihtimali gibi durumlarda daha esnek davranır.
2. Küçük liglerin spesifik zorlukları
- Az sayıda maç: Her oyuncudan düşük sayıda veri gelir; sistemin hızlı öğrenmesi gerekir.
- Düşük tekrar: Aynı rakiplerle sık karşılaşma, aşırı overfitting riskini artırır.
- Yeni katılımlar: Bir lig sürekli yeni oyuncu alıyorsa başlangıç politikası önem kazanır.
- İnişli çıkışlı katılım: Oyuncular arası etkinlik farklılıkları RD veya sigma ile yönetilmelidir.
3. Küçük liglerde sistemleri teknik açıdan karşılaştırma
3.1 Öğrenme hızı (convergence)
ELO: Basit ELO, sabit K ile çalışıyorsa yeni oyuncular için ya çok yavaş (küçük K) ya da istikrarsız (büyük K) davranır. Provisional dönemler (ilk N maçta yüksek K) ile hızlandırılabilir.
Glicko: RD sayesinde sistem, az maç yapan oyuncunun sonuçlarına ihtiyatla yaklaşır; ancak doğru RD başlangıcı ve güncelleme aralığı seçilirse, gerçek seviyeyi daha hızlı ve güvenilir gösterir.
TrueSkill: Bayesçi yapısı sayesinde özellikle takım oyunlarında daha hızlı öğrenir; bir oyuncunun maçtaki etkisini diğer oyuncuların bilgilerinden çıkarmak için çok avantajlıdır.
3.2 Belirsizlik ve adalet
Belirsizlik: Glicko ve TrueSkill doğrudan belirsizliği modelledikleri için küçük liglere uygundur. ELO bu yeteneğe sahip değildir; belirsizlik ancak K değeriyle dolaylı olarak yönetilir.
Adalet: Az maçlı oyuncuların şans eseri yüksek veya düşük performansları, Glicko ve TrueSkill ile daha ölçülü güncellenir. Böylece 1-2 şans maçına dayanıp haksız sıralama oluşması engellenir.
3.3 Takım maçları ve çoklu oyuncu senaryoları
TrueSkill, takım tabanlı liglerde ELO ve Glicko'ya göre daha gerçekçi sonuç üretir; çünkü bir maçta oyuncuların katkılarını birlikte değerlendirir. Glicko'nun standart formu bire bir maçlara odaklıdır; takım maçlarında uygulanması mümkünse bile ekstra kurallar gerekir.
3.4 Hesaplama ve uygulama zorluğu
ELO en kolay uygulanandır. Glicko orta zorlukta; RD ve volatilite güncellemeleri, periyodik işlem gerektirir. TrueSkill en karmaşık olandır: faktör grafikleri ve iteratif güncellemeler gerektirir; hazır kütüphaneler olmasına rağmen implementasyon maliyeti yüksektir.
4. Pratik örnekler ve simülasyon senaryoları
Basit bir senaryo düşünün: 12 kişilik bir lig, haftada 1 maç, sezon 10 hafta. Oyuncuların çoğu 10 maçın altında kalacak. Gerçeklik: çok gürültülü sonuçlar.
- ELO ile: İlk 3 haftada birkaç sürpriz galibiyet, ELO'nun bazı oyuncuları aşırı yukarı çekmesine sebep olabilir; provisional kuralı yoksa sıralama yanıltıcı olur.
- Glicko ile: RD başlangıcı yüksek tutulursa (ör. 350), ilk birkaç maç sonrası RD düşer; ancak sistem sonuçları aşırı değerlendirmez. Lig sonunda sıralama daha güvenilir olur.
- TrueSkill ile: Takım bazlı maçlar varsa en doğru katkı çıkarımı yapılır; bireysel varyans modellemesi sayesinde hem ekip hem birey adaleti artar.
Örnek sayısal: Yeni bir oyuncu ELO 1200 ile başlıyorsa ve ilk iki maçını kazanırsa ELO +40 alabilir; Glicko'da yüksek RD sayesinde puan artışı daha mütevazı olur.
5. Hangi durumda hangi sistemi seçmelisiniz?
- ELO tercih edin: Lig çok küçük ve basit ise, hesaplama maliyeti kritikse, takım oyunları yoksa ve uygulamada sadelik istiyorsanız. Ayrıca mevcut altyapı ELO için hazırsa tercih edilebilir.
- Glicko/Glicko-2 tercih edin: Küçük liglerde genellikle en iyi dengeyi sağlar. Az maç, düzensiz katılım ve yeni oyuncuların sık geldiği ortamlarda Glicko'nun RD'si adalet sağlar. Glicko-2, volatiliteyi modelleyebildiği için performans dalgalanmalarını da yakalar.
- TrueSkill tercih edin: Takım mücadelelerinin olduğu liglerde, çok oyunculu formatlarda veya oyuncuların rol bazlı katkılarının çözülmek istendiği durumlarda en iyi sonuç TrueSkill ile alınır. Ancak uygulama ve hesaplama maliyeti daha yüksektir.
6. Uygulama ipuçları ve parametre ayarları
- Yeni oyuncular: Provisional dönemde yüksek K (ELO) veya yüksek RD/varsayılan sigma (Glicko/TrueSkill) kullanın.
- İstikrarsız katılım: Glicko'da inaktif dönemlerde RD artırma; aktiflik döngülerine göre RD düşürme stratejisi uygulayın.
- Hile ve manipülasyon: ELO'da sandbagging (bilerek düşük performans) riski yüksek. Glicko/TrueSkill ile belirsizlik hep izlenerek etkisi azaltılabilir.
- Maç sıklığı: Haftalık güncelleme küçük liglerde uygun; çok seyrek güncelleme RD'nin çok büyümesine sebep olabilir, çok sık güncelleme ise gürültüyü aşırı yansıtabilir.
7. Örnek uygulama senaryosu — Tavsiye
Küçük, haftalık tek kişilik maçlardan oluşan amatör bir lig için pratik öneri:
- Başlangıç: Glicko-2, başlangıç RD = 350, sigma varsayılan.
- İlk 5 maç için provisional: RD daha düşük düşürülmesin (yani daha belirsiz kalsın) böylece rastgele galibiyetlerin etkisi sınırlansın.
- Sezon ortası: Haftalık otomatik RD güncellemeleri; inaktif oyuncuların RD'sini artırın.
- Takım maçlarına geçiş planı varsa TrueSkill kullanımını değerlendirin.
Sonuç
Küçük ligler için genel bir kural yoktur, fakat pratikte Glicko/Glicko-2 genellikle en iyi dengeyi sunar: az maçta belirsizliği yönetir, adaleti korur ve implementasyonu aşırı karmaşık değildir. ELO basitlik isteyenler için uygundur fakat belirsizlik yönetiminden yoksundur. TrueSkill ise takım ve çoklu oyuncu ortamlarında en doğru sonucu verir; maliyet ve karmaşıklık göz önünde bulundurulmalı.
Özet öneri: Eğer lig tekli maçlardan oluşuyor ve uygulama kolaylığı istiyorsanız ELO'yu basitçe kullanabilirsiniz; ancak liginizde düzensizlik, yeni oyuncu akışı ve düşük maç sayısı varsa Glicko-2 tercih edin. Takım bazlı ya da karma formatlarda TrueSkill en uygun çözümdür.
Uygulama yaparken başlangıç parametreleri, provisional kuralları ve inaktif oyuncu yönetimi en az sistem seçimi kadar önemlidir. Bunlara dikkat ederek küçük liginizde hem gerçek performansı daha iyi yansıtan hem de oyunculara adil davranan bir derecelendirme sistemi kurabilirsiniz.