Blog / E-Spor / Röportaj Soruları: Lig Veri Bilimcisine Sorulacak 12 Kritik Soru — Hile Tespiti, ELO Kalibrasyonu ve Sponsor‑Dostu Raporlama
Röportaj Soruları: Lig Veri Bilimcisine Sorulacak 12 Kritik Soru — Hile Tespiti, ELO Kalibrasyonu ve Sponsor‑Dostu Raporlama
E-Spor

Röportaj Soruları: Lig Veri Bilimcisine Sorulacak 12 Kritik Soru — Hile Tespiti, ELO Kalibrasyonu ve Sponsor‑Dostu Raporlama

Giriş: Profesyonel liglerde veri bilimi rolü teknik yetenekten fazlasını gerektirir. Hileleri doğru tespit etmek, puanlama sistemlerini güvenilir şekilde kalibre etmek ve sponsorların beklentilerine uygun, ama bilimsel bütünlüğü bozmayan raporlar üretmek; bir lig veri bilimcisinin günlük sorumlulukları arasında yer alır. Bu rehber, mülakatlarda adayların hem teknik hem de operasyonel yeterliklerini ölçmenize yardımcı olacak 12 kritik soruyu, beklenen cevapları ve pratik takip sorularını içerir.

Neden bu sorular?

Bir lig veri bilimcisinden beklenenler üç ana eksende toplanır: hile tespiti, ELO/puanlama kalibrasyonu ve sponsor‑dostu raporlama. Her başlık altında farklı yetkinlikler—istatistiksel düşünme, yazılım mühendisliği becerileri, iletişim ve etik—ön plana çıkar. Aşağıdaki sorular bu yetkinlikleri hedef alır.

Hile Tespiti (Soru 1–4)

1) "Hile tespiti için hangi veri kaynaklarını, hangi ön işleme adımlarını ve hangi metrikleri kullanırsınız?"

Ne aramalısınız: Adayın veri çeşitliliğini (sunucu logları, klent logları, ratelimit, davranışsal telemetri) ve anomali önleme yöntemlerini bilmesi gerekir. Örnek iyi cevap: hareket verilerinde z-skor normalizasyonu, zaman serisi sapma tespiti, session-level outlier detection (isolation forest), ve precision@k ile recall kullanımı.

Takip soruları: Gerçek zamanlı mı batch mi çalıştırırdınız? False positive maliyetini nasıl dengelersiniz?

2) "Bir oyuncunun istatistikleri normların çok dışında; bunu hile olarak rapor etmeden önce hangi istatistiksel testleri ve iş kurallarını uygularsınız?"

Beklenenler: Hipotez testi, çoklu test düzeltmeleri (Benjamini-Hochberg), önceden belirlenmiş iş kuralları (ör: sıra dışı IPS/Latency değişimleri), ve manuel inceleme için prioritizasyon (risk skoru oluşturma).

3) "Örnek bir hile tespit modeli deploy edildi ve yüksek false positive raporu geldi. Hataları nasıl teşhis edersiniz?"

İyi aday: model doğrulama, veri sürümleme kontrolü, eğitim/üretim kayması (data drift) testleri, özellik önemini inceleme, ve A/B tarzı doğrulama (human-in-the-loop) önerir. Ayrıca geri bildirim döngüsü kurma konusunda fikir sunmalı.

4) "Hile tespiti yaparken oyuncu gizliliği ve cezalandırma riskini nasıl yönetirsiniz?"

Burada etik ve operasyonel hassasiyet arayın. Adım adım süreci (gözden geçirme, uyarı, geçici kısıtlama, itiraz mekanizması) ve ölçülebilir SLA’lar önerilmesi olumlu işarettir.

ELO ve Puanlama Kalibrasyonu (Soru 5–8)

5) "ELO/puanlama sisteminde başlangıç değerleri ve K faktörünü nasıl belirlersiniz?"

Aranan: Adayın ELO mantığını bilmesi, K faktörünün oyuncu sayısına/oyun frekansına göre adaptasyonu, ve Bayesian yaklaşımlar ya da Glicko gibi belirsizlik içeren sistemlerden haberdar olması. Örnek: yeni oyuncular için daha yüksek K; deneyimli yüksek seviyede K azaltma.

6) "ELO basit bir modeldir; lig için rating’leri kalibre etmek amacıyla hangi ek istatistikleri kullanır, nasıl doğrularsınız?"

Cevapta performans metrikleri (calibration curve, Brier score), mağlubiyet/galibiyet ardışıklığının etkisi, ve skill‑drift (zamanla değişim) için zaman ağırlıklı güncellemeler beklenir. Ayrıca simülasyon ile ELO dağılımının uzun vadeli davranışı gösterilebilir.

7) "Yeni sezon başında sıralama 'inflation' sorunu varsa nasıl müdahale edersiniz?"

Beklenen çözümler: reset politikaları, Elo cap/decay mekanizmaları, maç eşleştirme kurallarında denge (matchmaking adjustments) ve canlı izleme. Ayrıca etkileri ölçmek için kontrollü roll-out planı sunulmalı.

8) "Puanlama sisteminin oyuncu memnuniyetine etkisini nasıl ölçer ve optimize edersiniz?"

Burada A/B testleri, retention/engagement metrikleri, churn prediktörleri ve oyuncu segmentlerine göre ayrı analizler beklenir. Sponsor tarafını düşünerek, rank dağılımının izlenmesi ve dengeli rekabet sağlanması da önemli.

Sponsor‑Dostu Raporlama ve İletişim (Soru 9–12)

9) "Sponsorlar için hazırlanan raporda teknik doğruluk ile anlaşılabilirlik arasında nasıl bir denge kurarsınız?"

Aranan: çok katmanlı raporlama yaklaşımı (executive summary + teknik ekler), görselleştirme ilkeleri (net KPI’lar, trendler, bağlam) ve sponsor odaklı metriklerin seçimi (viewability, engagement, brand lift). Örnek: bir kampanya etkisi raporunda p‑değerin yanı sıra etkinin büyüklüğünü (effect size) vurgulamak.

10) "Sponsor raporlarında güvenilirliği nasıl gösterirsiniz?"

Beklenen: belirsizlik aralıkları (confidence intervals), metodoloji bölümü, veri kaynakları açıklaması ve reproducibility için veri/analiz sürümlenmesi. Ayrıca KPI’ların nasıl hesaplandığını madde madde yazmak güven verir.

11) "Bir sponsor raporu CEO’ya sunulacak; 5 slaytta hangi başlıkları koyarsınız?"

İyi cevap: 1) Özet + ana bulgu, 2) KPI’lar ve trendler, 3) Kampanya performansı ve segment analizi, 4) Riskler ve veri kalitesi uyarıları, 5) Öneriler ve sonraki adımlar. Her slaytta bir veya iki net grafik olmalı.

12) "Raporlama otomasyonu ve tekrarlanabilirlik için teknik olarak hangi çözümleri tercih edersiniz?"

Aranan araçlar: veri pipeline (ETL/ELT), veri sürümleme (DVC/Delta), model sürümleme (MLflow), düzenli cadence ile cron/airflow görevleri ve dashboard otomasyonu (Looker/PowerBI/Metabase). Ayrıca dokümantasyon ve testler (data contracts) önemsenmeli.

Mülakat İçin Ek Uygulamalar ve Kırmızı Bayraklar

  • Teknik ödev: 24 saatlik take‑home: veri seti + birkaç açık soru (hile senaryo analizi, ELO simülasyonu) uygundur.
  • Canlı kodlama: küçük algoritma problemi (zaman serisi anomali algılama, basit rating güncelleme) ile temel mühendislik yeteneği ölçülür.
  • Kırmızı bayraklar: etik konulara yüzeysel yaklaşım, reproducibility bilincinin olmaması, test/monitoring kavramını bilmemek.

Pratik Örnek — Hile Tespiti Akışı (Kısa Case)

  1. Veri toplama: oyun sunucusu, client log, ödeme kayıtları.
  2. Ön işleme: zaman senkronizasyonu, anormallik filtreleme, feature engineering.
  3. Baselining: normal davranış profillerinin oluşturulması (kümelenme, medyan/mad).
  4. Modelleme: anomali tespiti (isolation forest), supervised model (label varsa), ve ensemble.
  5. Operasyon: risk skoru, manuel inceleme kuyruğu, itiraz süreci.
İyi bir lig veri bilimcisi sadece modeli üretmez; modelin operasyonel etkisini, oyuncu deneyimini ve iş ortağı beklentilerini birlikte yönetir.

Sonuç

Bu 12 soru, lig veri bilimcisinin teknik derinliğini, operasyonel aklı ve iletişim yeteneğini birlikte test eder. Mülakatı yaparken adaya gerçek veri örnekleri sunmak, canlı küçük görevler vermek ve etik/iş süreçleri hakkında somut beklentiler paylaşmak değerlendirmenizi güçlendirir.

Uygulama İpucu: Adayın verdiği cevapları pratik örneklerle doğrulayın: kod snippet, pseudo‑pipeline veya basit bir simülasyon görmeniz güven sağlar. Ayrıca adayın sunduğu çözümlerin üretime alınabilirliğini ve izlenebilirliğini sorgulamayı unutmayın.