Giriş: ELO sistemi, spor ve rekabetçi oyunlarda oyuncu gücünü sayısal olarak ifade etmede yaygın bir yöntemdir. Ancak tek başına puan görmek, gerçekte ne anlama geldiğini anlamak için yeterli değildir. Bu rehberde ELO hesaplamalarının temel mantığını, performans puanı (performance rating) çıkarma yöntemlerini, K-faktörünün etkisini ve sonuçları nasıl güvenli şekilde yorumlayacağınızı uygulamalı örneklerle anlatacağım.
ELO'nun Temel Mantığı
ELO sisteminin temelinde iki basit fikir vardır: bir oyuncunun beklenen skoru ve gerçekleşen skoru. ELO, rakiplerin rating farkına göre her oyundan beklenen skorun hesaplanmasına dayanır.
Beklenen skor formülü
Bir oyuncu A (rating RA) ile B (rating RB) karşılaştığında, A'nın beklenen skoru (E) şu şekilde hesaplanır:
E = 1 / (1 + 10^{(RB - RA) / 400})
Bu formül, rating farkı 400 puan olduğunda favorinin yaklaşık %90 kazanma beklediğini verir. 0 farkta beklenen skor 0.5'dir.
K-faktörü ve Rating Değişimi
Bir turnuva ya da maç serisi sonrası rating değişimi genellikle şu formülle bulunur:
ΔR = K × (S - E)
Burada S gerçekleşen toplam skor (ör: 1=galibiyet, 0.5=beraberlik, 0=mağlubiyet), E beklenen toplam skor ve K ise sistemin duyarlılık katsayısıdır.
K-faktörüne pratik bakış
- Yüksek K (ör. 40): Yeni oyuncular veya hızlı değişiklik istenen durumlar için. Puanlar çabuk oynar.
- Orta K (ör. 20): Yaygın, dengeli ayar; amatör ve lig oyuncuları için sık kullanılır.
- Düşük K (ör. 10): Üst düzey oyuncular için; puanlar daha stabil kalır.
Federasyonlar ve platformlar K kurallarını farklı belirleyebilir; bu yüzden kullandığınız sistemin kurallarını bilmek önemlidir.
Pratik Örnek: Beklenen Skor ve Rating Değişimi
Örnekle öğrenmek anlaşılmayı kolaylaştırır. Diyelim A oyuncusunun ratingi 1600 ve karşılaştığı üç rakip sırasıyla 1700, 1500 ve 1600. Beklenen skorları hesaplayalım.
- Rakip 1700: fark = 1700 - 1600 = 100 → 10^{0.25} ≈ 1.778 → E1 ≈ 1 / (1 + 1.778) ≈ 0.36
- Rakip 1500: fark = -100 → 10^{-0.25} ≈ 0.562 → E2 ≈ 1 / (1 + 0.562) ≈ 0.64
- Rakip 1600: fark = 0 → E3 = 0.5
Toplam beklenen skor E = 0.36 + 0.64 + 0.5 = 1.5 (üç oyunda). Gerçekte A oyuncusu 2 puan almış olsun (ör. 1 galibiyet, 2 beraberlik veya 2/3 puan). K = 20 alırsak:
ΔR = 20 × (2 - 1.5) = 20 × 0.5 = 10
Yeni rating ≈ 1610. Bu hesaplama, tek bir turnuva performansının rating üzerindeki kısa vadeli etkisini gösterir.
Performans Puanı (Performance Rating) Nasıl Hesaplanır?
Performans puanı, belirli bir maç serisinde ne kadar iyi oynandığını gösterir; turnuva boyunca rakiplerin ortalama puanına göre nasıl bir seviyede olunduğunu söyler. Kesin tanım: performans puanı Rp, Rp'yi varsaydığınızda beklenen toplam skorun gerçekleşen skora eşit olduğu ratingdir. Matematiksel olarak Rp'i doğrudan hesaplamak genellikle numerik çözüm gerektirir:
Sum_i 1 / (1 + 10^{(Ri - Rp)/400}) = S
Pratikte, hepsi aynı ratinge sahip rakiplere karşı verilen skor için kapalı form bir yaklaşım vardır:
Rp ≈ R_avg + 400 × log10(S / (N - S)) (hepsi aynı seviyede kabul edilirse)
Burada R_avg rakiplerin ortalama ratingi, S elde edilen toplam puan, N maç sayısıdır.
Örnekle performans puanı
Yukarıdaki örnekte rakip ortalaması R_avg = (1700 + 1500 + 1600)/3 = 1600, S = 2, N = 3.
Rp ≈ 1600 + 400 × log10(2 / 1) ≈ 1600 + 400 × 0.30103 ≈ 1600 + 120.4 ≈ 1720
Bu sayı, o üç maçlık seride A oyuncusunun ortalama rakibinden ~120 puan daha iyi bir performans gösterdiğini ifade eder. Ancak bu formül yaklaşım niteliğindedir; rakiplerin ratingleri çok farklıysa sayısal çözüm veya ağırlıklı ortalama kullanmak gerekir.
Sınır Durumlar ve Uyarılar
- S = 0 veya S = N durumunda log formülü sonsuz veya tanımsız olur. Bu durumlarda federasyonların hazırladığı tablolar veya düzenli hesaplama yöntemleri kullanılır.
- Az sayıda maçtan elde edilen performans puanları yüksek rastgelelik içerir. 3-5 maçlık seriler güvenilir değildir; güven aralığı geniştir.
- Kullanılan K-faktörü, rating değişiminin büyüklüğünde doğrudan rol oynar. K küçükse gerçek performanstaki değişiklikler yavaş yansır.
Daha Sağlıklı Yorum İçin İleri Yöntemler
Tek ELO değeri sıkça yanıltıcı olabilir. Aşağıdaki yaklaşımlar daha güvenilir çıkarım yapmanızı sağlar:
- Glicko / Glicko-2: Rating belirsizliğini (RD) ölçer; kısa vadeli performans dalgalanmalarını ayırt etmeye yardımcı olur.
- İstatistiksel Güven Aralıkları: Bernoulli dağılımından türeyen standart sapma ile skorun anlamlılığı hesaplanabilir. N küçükse varyans yüksektir.
- Bayesçi yaklaşımlar: Ön bilgi (prior) ile birlikte güncelleme yapmak aşırı uç sonuçları kontrol eder.
Pratik İpuçları: Skorları Ne Zaman Ciddiye Almalı?
- 3-5 maçta elde edilen ani yükseliş veya düşüşleri aşırı yorumlamayın; örneklem küçüktür.
- Rakip kalitesi ortalaması düşükse yüksek skorlar yanıltıcı olabilir. Her zaman rakip ortalamasına bakın.
- Beraberliklerin değeri küçümsenmemeli: 0.5 puanlar uzun vadede istatistiksel açıdan önemlidir.
- Performans puanı ile rating değişimi farklı kavramlardır: performans tek seferlik etkinliği, rating ise zaman içinde oturan değeri gösterir.
Özet ve Sonuç
Özetle: ELO beklenen skor formülü (1 / (1 + 10^{Δ/400})) ve ΔR = K × (S - E) ilişkisi, skorların yorumlanmasında temel araçlardır. Performans puanı, kısa dönem performansın seviyesini gösterir ve pratikte Rp ≈ R_avg + 400 × log10(S/(N-S)) benzeri yaklaşımlarla tahmin edilebilir. Ancak her zaman örneklem büyüklüğü, rakip dağılımı ve K-faktörü gibi etkenleri göz önünde bulundurmak gerekir.
Son olarak, eğer amacınız oyuncu gelişimini doğru takip etmekse, tek bir turnuva yerine zaman içinde toplanan veriye, belirsizliği gösteren metriklere (Glicko RD gibi) ve karşılıklı analizlere (renk dengesi, açılış çeşitliliği, oyun kalitesi) bakmanızı öneririm.
İyi analiz, yalnızca rakamları değil, rakamların ardındaki koşulları da okumaktır.