Giriş
Oyuncular, takımlar veya algoritmalar söz konusu olduğunda "sıcak seri" (hot-streak) gözlemleri hem popüler hem de tartışmalıdır. Bir oyuncunun ardışık galibiyetleri gerçekten performans artışının göstergesi mi, yoksa istatistiksel olarak beklenebilen rastgele dalgalar mı? Bu yazıda ELO verilerini kullanarak sıcak serileri matematiksel ve pratik açıdan nasıl ayrıştıracağınızı, hangi testleri ve modelleri kullanacağınızı ve kazanma dalgalarını nasıl tahmin edebileceğinizi derinlemesine ele alacağım.
ELO ve Sıcak Seri: Temel Kavramlar
ELO, iki oyuncunun göreli yeteneklerini eşleştirme sonrası güncelleyen basit fakat güçlü bir skorlama sistemidir. Her maçtan sonra ELO farkına göre beklenen skor hesaplanır ve gerçekleşen sonuçla fark varsa ELO güncellenir. Sıcak seri tartışması genellikle iki soruya odaklanır:
- Bir ardışık galibiyet dizisi ELO ile tutarlı mı?
- Bu diziyi şansla mı açıklıyoruz, yoksa gerçek bir performans artışı mı var?
Bu ayrımı yapmak için ELO, sadece ham galibiyet/kayıp bilgisinden öte bir temel sağlar: her karşılaşmanın beklenen skorunu ve dolayısıyla beklenen galibiyet olasılığını içerir. Dolayısıyla örneklem bazlı null modeller kurabiliriz.
Null Model: Rastgelelik Temelli Beklenti
Başlangıç noktası bir null model oluşturmaktır. En basit null model: her maçın galibiyeti, o maça özgü beklenen olasılığa göre bağımsız Bernoulli denemesidir. ELO bazlı beklenen olasılık p_i, iki oyuncunun ELO farkından hesaplanır. Bu modelde sıcak seriler sadece rasgelelikten kaynaklanır.
Bu null modeli kullanarak yapabileceğiniz testler:
- Koşu testi (runs test): Galibiyet ve mağlubiyet serilerinin beklenen uzunluğuyla kıyaslanır.
- Permutation (yer değiştirme) testi: Sonuçları rastgele yeniden karıştırıp en uzun galibiyet serisini yeniden hesaplayarak p-değeri elde edersiniz.
- Beklenen ardışık galibiyet uzunluğu: Bernoulli sürecinde beklenen en uzun koşu approximasyonları kullanılır ve gözlenen değere göre z-score hesaplanır.
Bu testler, gözlenen serinin yalnızca ELO kaynaklı beklenen olasılıklardan beklenebilecek aralıkta olup olmadığını kontrol eder.
Sıcak Seri Metrikleri: Ne Ölçmeliyiz?
Sadece "en uzun galibiyet serisi" ölçütü yanıltıcı olabilir. Alternatif ve tamamlayıcı metrikler:
- Seri ağırlıklı skor: Her ardışık galibiyeti artan ağırlıkla saymak, uzun serilerin etkisini vurgular.
- Serial correlation: Ardışık maç sonuçları arasındaki korelasyon; pozitif korelasyon formasyon gösterir.
- Run-length dağılımı: Tüm koşu uzunluklarının dağılımını gözlemek, tek bir uzun seriye değil genel eğilime bakar.
- Expectation-adjusted streak score: Her galibiyet için 1/p_i - 1 gibi beklenen zorluğa göre düzeltilmiş puanlar toplanır.
ELO ile Şans ve Yetenek Ayrımı: Hibrit Modeller
Null model yeterli değilse, bir sonraki adım yetenek ve kısa vadeli formu ayrı katmanlarda modellemektir. Önerilen yaklaşım:
- Temel yetenek (latent skill): Her oyuncu için sabit bir parametre (ör. sürekli dağılımlı: normal).
- Kısa vadeli form (hotness): Zaman içinde değişen, örneğin AR(1) süreçle modellenen bir ek bileşen.
Model örneği (basitçe ifade):
skill_i(t) = mu_i + f_i(t)
mu_i sabit yetenek, f_i(t) ise zamanla değişen form (ör. f_i(t) = rho * f_i(t-1) + eps_t). Maç olasılığı ise logistic(mu_A + f_A(t) - mu_B - f_B(t)).
Bu yapı, sıcak serilerin f_i(t) bileşenindeki dalgalanma mı yoksa mu_i'deki uzun vadeli değişim mi olduğunu ayırmanızı sağlar. Bayesian yaklaşım burada kullanışlıdır: posterior dağılımlar üzerinden "bu serinin f_i(t) tarafından yaratılma olasılığı" çıkarılabilir.
Pratik Pipeline: Veri -> Test -> Model -> Tahmin
- Veri Hazırlığı
- Maç bazında: tarih, oyuncu A, oyuncu B, sonuç, ELO öncesi A ve B.
- ELO hesaplama adımlarını kaydedin. Beklenen p_i'leri saklayın.
- Keşifsel Analiz
- Koşu uzunlukları, en uzun koşular, seri dağılımı ve maç başına beklenen galibiyet olasılıklarının histogramları.
- Null Model Testleri
- Permutation testi ile p-değerleri; runs testi; seri korelasyonu.
- Modelleme
- Basit logistic regression: outcome ~ expected_prob + recent_form_features.
- Bayesian state-space model: skill + AR(1) form bileşeni.
- Doğrulama
- Zaman serisi çapraz doğrulama: geçmişten geleceğe kaydırmalı test setleri.
- Model kalibrasyonu: predicted probabilities vs. observed frequencies.
Basit Örnek: Permutasyon Testi Adımları
- Gerçek serideki en uzun galibiyet koşusunu L_obs olarak hesaplayın.
- Beklenen p_i'leri kullanın, her maç için Bernoulli denemeleriyle simülasyon üretmeyin; bunun yerine sonuçları beklenen p_i'ler korunarak rasgele yeniden karıştırın. (Yani sonuç sequence'ini shuffle edin.)
- Her tekrarda en uzun koşuyu hesaplayın, N=10000 simülasyon önerilir.
- p-değeri = (simülasyonlarda L_sim >= L_obs) / N.
Bu test, gözlenen uzunluğun takımın/oyuncunun ELO'ya dayalı beklenen olasılığına göre beklenip beklenmediğini doğrudan gösterir.
Tahmin: Sıcak Seriler Nasıl Öngörülür?
Sıcak serilerin öngörüsü iki şeyle ilişkilidir: kısa vadeli formun gözlemlenmesi ve kalıcı yetenekle etkileşim. Tahmin stratejileri:
- Özellik mühendisliği: son k maçın galibiyet oranı, rakiplerin ortalama ELO'su, maç sıklığı, seyahat/konum etkileri.
- Zaman serisi modelleri: f_i(t) bileşeni için ARIMA/AR(1) veya daha sofistike state-space modelleri.
- Bayesyen güncelleme: Her maç sonrası form posteriorunu güncelleyin; belirsizlikleri kullanarak daha güvenilir öngörüler elde edersiniz.
Örnek: Eğer modelinizde f_i(t) için rho ~ 0.7 bulunuyorsa, son maçlardaki pozitif artış gelecek birkaç maçta devam etme eğilimindedir; tersine rho küçükse (ör. 0.1), kısa vadeli dalgalanmalar hızla sönümlenir.
Uygulama Notları ve Tuzaklar
- Bağımsızlık varsayımı: Permutasyon testleri sonuçların gerçekten aynı dağılımdan geldiği varsayımına dayanır. Sistematik ELO hataları varsa yanıltıcı olabilir.
- Veri seçimi: Seçim yanlılığı (ör. sadece popüler oyuncuların verisi) sıcak seri tespitini çarpıtabilir.
- Multiple testing: Çok sayıda oyuncu/ dönem test ediliyorsa düzeltme gerekir (FDR, Bonferroni vb.).
- Model karmaşıklığı: Çok esnek modeller overfitting yapabilir; zaman serisi çapraz doğrulama şarttır.
Özetle: ELO verisi, sıcak serileri şans ve yetenek bileşenlerine ayırmak için güçlü bir temel sunar; ama doğru testler, uygun null modeller ve zaman serisi yaklaşımlarıyla desteklenmelidir.
Sonuç ve Öneriler
Pratik olarak önerilecek akış şöyle:
- ELO'yu ve maç başı beklenen p_i'leri hesaplayın.
- Exploratory analyses ile serilerin özelliklerini çıkarın.
- Null modeller (permutation, runs test) ile ilk ayrımı yapın.
- Eğer seriler null'dan sapan eğilim gösteriyorsa, state-space veya Bayesian modellerle form bileşenini modelleyin.
- Modelinizi zaman serisi doğrulamasıyla test ederek tahmin kabiliyetini ve kalibrasyonunu kontrol edin.
Bu adımlar, sıcak serilerin gerçekten "sıcaklık" (yani kısa vadeli artış) mı yoksa sadece rasgele dalga mı olduğunu anlamanıza yardımcı olacaktır. Matematiksel yaklaşımlar, doğru uygulandığında sezgisel algılardan çok daha güvenilir çıkarımlar üretir.
Kapanış
Hot-Streak analizleri hem akademik hem pratik değere sahip bir alandır. ELO gibi iyi tanımlı bir temel ölçüm kullanarak, uygun istatistiksel testler ve zaman serisi modelleriyle kazanma dalgalarını ayrıştırabilir ve makul tahminler üretebilirsiniz. Analiz süreçlerinizi şeffaf, tekrarlanabilir ve doğrulanabilir tutun; aksi halde "sıcaklık" efsanesine kapılabilirsiniz.