Küçük liglerde doğru puanlama sistemi seçmek, sadece kazanan- kaybeden cetveli yapmak değil; katılımcıların motivasyonunu, maçların dengeli eşleşmesini ve lig sonucunun adilliğini doğrudan etkiler. Bu yazıda ELO'nun sınırlılıklarını kısaca özetleyip TrueSkill, Glicko (ve Glicko-2) ile çeşitli hibrit yaklaşımların hangi senaryolarda daha uygun olduğunu beş gerçek dünya vaka çalışması üzerinden derinlemesine inceliyoruz.
Neden ELO yeterli değil? Küçük liglerin özel zorlukları
ELO basit, hesaplaması hızlı ve anlayışı kolay bir sistemdir. Ancak küçük liglerde aşağıdaki sorunları sıkça doğurur:
- Başlangıç değerleri ve soğurma: Yeni bir sporcunun gerçeği yansıtması için çok sayıda maç gerekir; yanlış başlangıç skoru uzun süre hata yaratır.
- Belirsizlik takibi yok: ELO, oyuncunun güven aralığını (uncertainty) takip etmez; yeni ya da düzensiz oynayanlarla başa çıkamaz.
- Takım/çok oyunculu maçlar: Çok oyunculu veya takım bazlı maçlarda ELO doğal ayrıştırma yapmakta zorlanır.
- Zamana bağlı volatilite: Uzun süre oynamayanlarda gerçek performans değişiklikleri hesaba katılmaz.
TrueSkill, Glicko ve Hibrit — Temel farklar
TrueSkill: Microsoft tarafından geliştirildi; Bayesçi bir modeldir. Her oyuncu için ortalama (mu) ve belirsizlik (sigma) tutar. Takım maçlarını, çoklu oyunculu maçları ve eksik sonuçları doğal olarak işler. Matchmaking (eşleştirme) için idealdir.
Glicko / Glicko-2: Glicko, ELO'nun üzerine belirsizlik (RD — rating deviation) ekler; Glicko-2 ayrıca volatilite (sigma) parametresiyle oyuncu performansındaki değişkenliği modelleyebilir. Zamanla RD artarak inaktif oyuncuların belirsizliğini gösterir.
Hibrit modeller: Örneğin TrueSkill eşleştirme, Glicko sıralama ve ELO basit canlı skor yayınları kombinasyonu. Amaç, her modelin güçlü yanını kullanıp zayıflığını dengelemektir.
Hangisini ne zaman tercih etmelisiniz? Pratik rehber
- Oyuncu sayısı küçük, maç sıklığı az: Glicko-2 öne çıkar; RD ile belirsizlik yönetimi küçük veriyle daha adil sonuç verir.
- Takım bazlı ya da çok oyunculu oyunlar: TrueSkill tercih edin; takım kombinasyonlarını ve ortak katkıyı çıkarır.
- Sürekli aktif, sık maç yapılan lig: ELO veya düşük K'lı ELO (K=16-24) hızlı, stabil bir deneyim sunar.
- İniş çıkış yapan oyuncular ya da düzensiz katılım: Glicko-2 volatilite (+RD) ile daha iyi çözer.
- Hem eşleştirme hem de halka açık sıralama isteniyorsa: Hibrit: TrueSkill tabanlı eşleştirme + Glicko periyodik sıralama tavsiye edilir.
Parametre tavsiyeleri (küçük ligler için)
- ELO: Yeni oyuncular için K=40 ilk 10 maç, sonra K=20; deneyimli için K=10-16.
- Glicko-2: Başlangıç Rating=1500, RD=350, sigma=0.06 gibi literatürde yaygın başlangıçlar uygundur. Haftalık inaktivite için RD artışı uygulanmalı.
- TrueSkill: Standart mu=25, sigma=25/3 (≈8.33), beta≈4.16, tau≈0.083 başlangıç açısından işe yarar; ancak oyunun varyansına göre beta büyütülmeli (daha rastlantısal oyunlarda büyük beta).
Değerlendirme metrikleri — Hangi sistemi nasıl test edersiniz?
Bir sistemi sahada kabul etmeden önce geçmiş maç verisiyle backtest yapın. Kullanabileceğiniz metrikler:
- Öngörü doğruluğu (predictive accuracy): Sıradaki maçı hangi sistem daha iyi tahmin ediyor?
- Spearman korelasyonu: Sıralama ile gerçek performans arasındaki ilişki.
- Upset rate zamanı: Gerçekten beklenmeyen sonuçlar.
- Konverjans zamanı: Yeni bir oyuncunun gerçek seviye etrafında stabil hale gelmesi kaç maç sürdü?
5 Gerçek Dünya Vaka Çalışması
Vaka 1 — Üniversite Satranç Kulübü (tekli, düzensiz maçlar)
Durum: 40 oyuncu, haftalık oynayan sayısı değişken, sıklık düşük. Başlangıç değerleri çoğunlukla bilinmiyor.
Analiz: ELO, düşük maç sayısıyla yeni oyuncuların yanlış konumlanmasına neden olur. Glicko-2, RD sayesinde yeni oyuncunun belirsizlik yüzünden agresif puan kaybı/ kazanımı yaşamasına engel olur.
Öneri: Glicko-2 (RD ile). Başlangıç RD yüksek, birkaç maç sonra RD düşürülerek güven artışı kontrol edilir.
Vaka 2 — Yerel 5v5 eSpor Ligi (takım maçları, sık)
Durum: Haftada 3-4 maç, takım odaklı, roster değişimleri var.
Analiz: Takım kompozisyonu ve oyuncu katkıları önemli. TrueSkill oyuncu bazlı mu/sigma ile takım sonuçlarından bireysel katkıyı çıkarır; dolayısıyla dengeli eşleşmeler sağlar.
Öneri: TrueSkill tabanlı matchmaking; lig sıralaması için TrueSkill veya haftalık olarak Glicko-2 sayesinde belirsizliği takip edebilirsiniz.
Vaka 3 — Amatör Futsal Lig (sınırlı sezon, çok turnuva)
Durum: Sezon bazlı turnuvalar, maç sayısı sezon boyunca sınırlı.
Analiz: Sezon sonunda adil sıralama isteyen organizatörler, maç başına bilgi yüksek olmadığı için belirsizliği hesaba katmalı. Glicko-2 sezon başı RD artışıyla oyuncuların gerçek seviyesini daha güvenilir gösterir. ELO, sezonun başında güçlü oyuncuları yanlış sıralayabilir.
Öneri: Glicko-2 ve sezon sonunda istatistiksel düzeltmeler; playoff eşleşmeleri için TrueSkill tabanlı simülasyon da eklenebilir.
Vaka 4 — Masaüstü RPG Turnuvası (çok oyunculu, düzensiz sonuçlar)
Durum: 6-8 kişilik free-for-all maçlar, sonuçlar şansa bağlı olabilir.
Analiz: Çok oyunculu sonuçları ELO ile doğru şekilde normalize etmek zordur. TrueSkill free-for-all'ı destekler ve oyuncuların mu/sigma değerleri üzerinden adil sıralama sağlar.
Öneri: TrueSkill; beta parametresini oyunun rastlantı payına göre büyütün. Gerekirse puanlama tabanlı (ör. 1.,2.,3. puanlama) sonuçları TrueSkill'e çeviren bir dönüştürme katmanı ekleyin.
Vaka 5 — Kurumsal Kodlama Yarışması (etiket: kısa sürede çok maç)
Durum: Kısa süreli hackathon tarzı mücadeleler; ekipler sıkça değişiyor, oyuncular bireysel katkı gösteriyor.
Analiz: Ekiplerin sürekli değişmesi, takım bazlı ama oyuncu bazlı etkiyi vurgular. Hibrit yaklaşım: TrueSkill takım performansını ayrıştırırken, Glicko bireysel sıralamayı (haftalık veya turnuva sonu) sabitler.
Öneri: TrueSkill + periyodik Glicko güncellemesi; ekip değişikliklerinde oyuncu sigma'sını hafif artırarak belirsizlik tanıyın.
Uygulama notları ve sık yapılan hatalar
- Yanlış başlangıç: Yeni oyunculara aşırı düşük/ yüksek başlangıç verip sistemi bozmayın; yüksek RD/sigma ile başlatın.
- İnaktiviteyi görmezden gelme: Haftalarca oynamayanlarla ilgili RD/sigma artışı uygulayın.
- Tek modelle her problemi çözmeye çalışma: Eşleştirme ve halka açık sıralama farklı amaçlardır; hibrit yaklaşımlar genelde daha pratik sonuç verir.
Önemli: Küçük liglerde adalet, yalnızca doğru matematik değil; başlangıç stratejisi, oyuncu davranışları ve veri miktarının dengelenmesiyle sağlanır.
Sonuç — Pratik bir karar ağacı
Kısa bir karar ağacı olarak:
- Eğer takım/çok oyunculu bir oyunsa: TrueSkill.
- Eğer oyuncu sayısı az ve maçlar seyrekse: Glicko-2.
- Eğer sık maç varsa ve basitlik öncelikse: ELO (uyarlanmış K ile).
- Eşleştirme ile halka açık sıralamayı ayrıştırın: Hibrit yaklaşımlar en dengeli sonucu verir.
Son söz olarak, küçük liglerde "en iyi" diye tek bir cevap yoktur. Uygulanabilirlik, hesaplama karmaşıklığı, oyuncu davranışı ve veri miktarı birlikte değerlendirilmelidir. Her modelin güçlü ve zayıf yönlerini sahada test etmek — basit A/B denemeleri ve geçmiş veriye dayalı backtest — en doğru seçimi sağlayacaktır.
Bu kılavuz, küçük lig yöneticileri için uygulanabilir parametreler, vaka analizleri ve pratik öneriler sunar. Uygulama sırasında verdiğiniz geri bildirimlere göre parametreleri yeniden ayarlamayı unutmayın.