Oyun Teorisi

Alternatif Derecelendirme Sistemleri: ELO'nun Sınırlılıkları ve Çözümler

Rekabet · 9 Şubat 2026 · 5 dk okuma · 105 görüntülenme

Giriş: Derecelendirme sistemleri rekabetin adil, anlaşılır ve ölçülebilir olmasını sağlar. ELO uzun yıllardır satranç gibi ikili rekabetlerde standart kabul edilse de modern oyunlar, çevrimiçi platformlar ve takım tabanlı senaryolar için eksikleri vardır. Bu yazıda ELO'nun temel sınırlılıklarını teknik ve uygulamalı açıdan ele alıyor; Glicko, Glicko-2, TrueSkill, Bradley-Terry ve diğer alternatifler üzerinden pratik çözümler sunuyorum.

ELO’nun Temel Mantığı ve Kısa Özeti

ELO, iki oyuncunun beklenen sonucuna göre puan transferi yapan basit bir mantığa dayanır. Bir oyuncunun kazanç/kalıcı puanı, rakipleriyle olan beklenen karşılaşma sonucundan sapma ile güncellenir. Temel avantajı sadeliğidir: hesaplaması kolay, yorumlanması doğaldır.

ELO'nun artıları

Basitlik ve hızlı hesaplama.
Küçük veri gereksinimi: sadece mevcut rating ve K faktörü.
Uzun süreli kıyaslama için iyi bir temel.

ELO’nun Sınırlılıkları — Neden Yetersiz Kalabilir?

Günümüz uygulamalarında ELO’nun kalan eksikleri genellikle aşağıdaki başlıklarda toplanır. Her bir maddeye somut örnek ve etkileriyle değineceğim.

1. Belirsizlik (Uncertainty) ve Yeni Oyuncu Sorunu

ELO yeni oyuncunun yetkinliğini anında sabit bir K ile güncelleyemez. Sonuç: yeni oyuncular başlangıçta gereğinden fazla risk alır veya yavaş öğrenirler. Örnek: Gerçek yeteneği yüksek bir yeni oyuncu, birkaç maç kazansa bile ELO sistemiyle hâlâ düşük kalabilir.

2. Dinamiklik ve Volatiliteyi Yönetememe

ELO, oyuncunun performans dalgalanmalarını (form düşüşü/yükselişi) modellemek için sınırlı esnekliktedir. Sabit K faktörü, hem uzmanlaşmış oyuncuları hem de aralıklı oynayanları aynı şekilde cezalandırır.

3. Takım ve Çoklu Oyuncu Senaryolarında Uygunsuzluk

ELO iki kişilik maçlar için tasarlanmıştır. Takım maçlarında veya çok oyunculu oyunlarda adil puan dağılımı yapmak zordur. Hangi oyuncuya ne kadar puan verileceği belirsizleşir.

4. Beraberlik ve Skor Dağılımı Problemleri

ELO beraberlikleri basitçe 0.5 sonuçla hesaplar; fakat maçların içeriksel farklarını (ör. kontrol edilen taşlar, hedeflere ulaşma) hesaba katmaz.

5. Inflasyon/Deflasyon ve Sistem Dengesi

Küçük tasarım tercihleri (ör. yeni oyunculara verilen başlangıç puanı, K değeri politikası) zamanla puan havuzunda sapmalara yol açabilir. Bu da federasyon veya platform için adaleti zedeleyebilir.

Alternatifler: Hangi Sistem Hangi Sorunu Çözer?

Aşağıda sık kullanılan alternatifleri, hangi problem(ler)i çözdüklerine dair kısa açıklamalarla veriyorum.

Glicko ve Glicko-2

Glicko, her oyuncuya bir rating ve bir RD (rating deviation) yani belirsizlik değeri atar. Glicko-2 ise ayrıca volatility (oyuncunun yetenek değişkenliği) parametresini içerir.

Çözdüğü problemler: Yeni oyuncu ve belirsizlik yönetimi, volatilitenin hesaba katılması.
Uygulama örneği: Uzun süre oynanmayan oyuncunun RD'si artar; geri döndüğünde sonuçlar RD'ye göre daha büyük etkiler yaratır.

TrueSkill (Microsoft)

TrueSkill, Bayesçi bir modeldir; çok oyunculu ve takım oyunları için tasarlanmıştır. Her oyuncunun yeteneği ortalama ve varyans ile temsil edilir.

Çözdüğü problemler: Takım maçları, çok oyunculu eşleştirme, belirsizlik.
Avantaj: Eşleştirme (matchmaking) için doğrudan kullanılabilir; performans belirsizliği ile adil eşleşmeler kurar.

Bradley-Terry Modeli ve İstatistiksel Yaklaşımlar

Bradley-Terry, oyuncuların kazanma olasılıklarını log-odds üzerinden modeller. Çok sayıda maç ve istatistiksel maksimum likelihood yöntemleriyle birlikte güçlü sonuç verir.

Makine Öğrenmesi Tabanlı Sistemler

Veri yoğun sistemlerde (ör. çok metrikli oyunlar) ML modelleri maç sonrası beklenen sonuçları ve oyuncu performansını tahmin etmek için kullanılabilir. Bu yaklaşımlar ELO’nun basit öngörüsünü aşar ancak daha fazla veri, hesaplama ve bakım gerektirir.

Pratik Çözümler ve Tasarım Önerileri

Bir derecelendirme sistemini seçerken sadece doğruluk değil, uygulama maliyeti, okunabilirlik ve oyuncu beklentileri de önemlidir. Aşağıda somut adımlar var.

Hibrid yaklaşım: ELO'nun sadeliğini Glicko'nun belirsizlik modellemesiyle birleştirin. Örneğin başlangıçta Glicko ile RD yüksek tutup, sonraki dönemde daha stabil ELO benzeri güncellemeye geçiş yapabilirsiniz.
Provisional (deneme) dönemi: Yeni oyuncular için yüksek RD veya farklı K faktörü kullanın. 20-30 maç sonrası normal seviyeye indirin.
Zaman içinde decay (azalma): Aktif olmayan oyuncuların RD'sini artırarak geri döndüklerinde daha doğru tahminler yapılmasını sağlayın.
Takımlar için katkı payı modeli: Takım maçlarında oyunculara katkılarına göre pay verin; oyuncu performansı istatistikleriyle katkıyı nicelleştirin.
Tasarruf/performans optimizasyonu: TrueSkill veya Glicko-2 hesaplamaları daha ağırdır; gerçek zamanlı sistemlerde hesaplamaları batch'e alabilir veya yaklaşık güncellemeler kullanabilirsiniz.

Uygulama Senaryoları — Örnekler

Satranç federasyonu: ELO merkezli ama yeni oyuncular için provisional dönem ve periyodik sıfırlama mekanizmaları uygundur. Glicko-2'ye geçiş federasyon için daha doğru sonuç verir ancak açıklanabilirlik sorunları olabilir.

Online rekabetçi oyun: Takım tabanlı oyunlarda TrueSkill veya Bradley-Terry varyantları daha iyi eşleştirme sağlar. Ayrıca oyuncu davranışına göre (AFK, erken çıkma) ağırlıklandırma gerekir.

"Doğru derecelendirme, sadece kim daha iyi değil; kim daha güvenilir ve hangi koşullarda daha iyi sorusunu da cevaplamalıdır."

Geçiş Stratejisi ve Veri Gereksinimleri

Bir sistemi değiştirmek istiyorsanız:

Geçiş öncesi mevcut veriyi analiz edin: maç sayıları, oyuncu aktivitesi, ortalama maç başına oyuncu sayısı.
Simülasyon yapın: Mevcut veride yeni algoritmayı çalıştırıp dağılım ve geçiş etkilerini test edin.
İletişim planı hazırlayın: Oyuncular için açıklayıcı materyal yayınlayın; puan kayıpları hissi azaltılmalı.

Ölçütler: Hangi Metrikler İzlenmeli?

Başarıyı ölçmek için kullanabileceğiniz metrikler:

Predictive accuracy (beklenen sonucun doğruluğu)
Player retention (yerinde kalma) — olumsuz puan değişimi sonrası ayrılmalar
Match balance (eşleşme dengesizliği oranı)
Inflation/deflation trendleri zaman içinde

Sonuç: Hangi Sistemi Seçmelisiniz?

Tek bir "en iyi" sistem yoktur. Seçim, platformunuzun ihtiyaçlarına bağlıdır:

Basit, iki oyunculu, az veri: ELO yeterli olabilir.
Belirsizlik yönetimi ve yeni oyuncular önemliyse: Glicko/Glicko-2 tercih edin.
Takım ve çoklu oyuncu senaryoları varsa: TrueSkill en uygun çözümlerden biridir.
Çok metrikli, veri zengini ortamlarda: İstatistiksel modeller veya ML tabanlı yaklaşımlar öne çıkar.

Özetle: ELO hala değerli bir başlangıç noktasıdır, ama modern uygulamalar için belirsizlik, volatilite ve çok oyunculu yapıyı hesaba katan sistemler daha doğru ve adildir. Pratikte çoğu başarılı platform hibrid yaklaşımlar, provisional dönemler ve RD/volatility parametreleri kullanarak dengeyi sağlar.

Uygulama notu: Kodu, hesaplama yoğunluğunu ve kullanıcı iletişimini planlayın; geçişleri simüle edin; oyunculara ne bekleyeceklerini şeffaf biçimde anlatın.

Kaynak ve ileri okuma önerileri

Bu yazıda bahsedilen modellerin orijinal makalelerini ve uygulama notlarını okumanızı öneririm: Glicko/Glicko-2 makaleleri, Microsoft TrueSkill dökümanları ve Bradley-Terry istatistiksel literatürü. Ayrıca küçük ölçekli testlerle kendi veri setinize göre parametre optimizasyonu yapın.

Sonuç paragrafı: Derecelendirme sistemi seçimi teknik, kullanıcı deneyimi ve işletme hedeflerinin birleşimidir. ELO'nun sınırlılıklarını bilip uygun alternatifleri ve pratik çözümleri uygulamak, hem daha adil hem de daha güvenilir rekabet ortamı yaratır.

Paylaş

ELO'da Gizli Kaymalar: Küçük Liglerde Yuvarlama, Minimum Puan Değişimi ve 10.000 Maçlık Veriyle Tespit Edilen Sistematik Sapmalar

1 Mar 2026

Çapraz‑Antrenmanın Gücü: Kart, Konsol ve Masa Oyunu Deneyimlerinin Karar Hızı ve Hata Oranına Etkisi — 6 Ay, 80 Oyuncu Analizi

1 Mar 2026

Analiz: Aydınlatma ve Görsel Kontrastın Refleks Sürelerine Etkisi — Kart, Konsol ve Masa Oyunlarında 2000 Maçlık Deney

1 Mar 2026

ELO’nun Temel Mantığı ve Kısa Özeti

ELO'nun artıları

ELO’nun Sınırlılıkları — Neden Yetersiz Kalabilir?

1. Belirsizlik (Uncertainty) ve Yeni Oyuncu Sorunu

2. Dinamiklik ve Volatiliteyi Yönetememe

3. Takım ve Çoklu Oyuncu Senaryolarında Uygunsuzluk

4. Beraberlik ve Skor Dağılımı Problemleri

5. Inflasyon/Deflasyon ve Sistem Dengesi

Alternatifler: Hangi Sistem Hangi Sorunu Çözer?

Glicko ve Glicko-2

TrueSkill (Microsoft)

Bradley-Terry Modeli ve İstatistiksel Yaklaşımlar

Makine Öğrenmesi Tabanlı Sistemler

Pratik Çözümler ve Tasarım Önerileri

Uygulama Senaryoları — Örnekler

Geçiş Stratejisi ve Veri Gereksinimleri

Ölçütler: Hangi Metrikler İzlenmeli?

Sonuç: Hangi Sistemi Seçmelisiniz?

Kaynak ve ileri okuma önerileri

Paylaş

İlgili Yazılar

ELO'da Gizli Kaymalar: Küçük Liglerde Yuvarlama, Minimum Puan Değişimi ve 10.000 Maçlık Veriyle Tespit Edilen Sistematik Sapmalar

Çapraz‑Antrenmanın Gücü: Kart, Konsol ve Masa Oyunu Deneyimlerinin Karar Hızı ve Hata Oranına Etkisi — 6 Ay, 80 Oyuncu Analizi

Analiz: Aydınlatma ve Görsel Kontrastın Refleks Sürelerine Etkisi — Kart, Konsol ve Masa Oyunlarında 2000 Maçlık Deney