Blog / Veri Bilimi / Röportaj Soruları: Lig Veri Bilimcisine Sorulacak 12 Kritik Soru — Hangi Metrikler Yanıltır, Hangileri Karar Verir?
Röportaj Soruları: Lig Veri Bilimcisine Sorulacak 12 Kritik Soru — Hangi Metrikler Yanıltır, Hangileri Karar Verir?
Veri Bilimi

Röportaj Soruları: Lig Veri Bilimcisine Sorulacak 12 Kritik Soru — Hangi Metrikler Yanıltır, Hangileri Karar Verir?

Lig veri bilimi pozisyonları için yapılan röportajlar, teknik yetenek kadar iş mantığını, veriyle karar verme kültürünü ve spor dinamiklerini anlama becerisini de ölçmelidir. Aşağıda hem mülakatı yönetenlere hem de adaylara yol gösterecek, pratik örnekler ve beklenen cevaplara dair ipuçlarıyla zenginleştirilmiş 12 kritik soru yer alıyor.

Giriş: Neden bu sorular önemli?

Liglerde veri bilimi, yalnızca istatistik hesaplamaktan ibaret değil; karar alıcılarla ortak bir dil kurmak, yanıltıcı sinyalleri ayırt etmek ve modellerin saha koşullarında işe yaradığını göstermek gerekir. Bu sorular, adayın teknik doğruluk, iletişim becerisi ve iş odaklı düşünme yeteneğini ölçer.

1. Hangi metrikler yöneticileri yanıltır? Somut bir örnek verin.

Neden sorulur: Adayın metriklerin sınırlarını ve bağlam gerekliliğini anlayıp anlamadığını test eder.

Beklenen cevap: Örnek: "Topa sahip olma yüzdesi tek başına üstün oyunu garanti etmez. Küçük takımlar uzun süre topa sahip olup düşük tehdit yaratarak oyunu kontrol ediyor olabilir. xG (expected goals) tek başına da yanıltıcı olabilir; modelin şut kalitesi, dönemin savunma yoğunluğu gibi bağlamsal faktörleri görmezse yanlış yorumlanır."

Takip sorusu: Bu yanılgıyı nasıl test edersiniz? (ör: korelasyon analizi, kontrol grubu, maç segmentasyonu)

2. Hangi metrikler doğrudan karar verici olabilir? Bir kullanım örneği anlatın.

Neden sorulur: Adayın işle doğrudan ilişkili, güvenilir metrikleri seçme yeteneğini ölçer.

Beklenen cevap: "Oyuncu değerlendirmesinde xGOT (shot on target quality) ve beklenen asist (xA) gibi metrikler, transfer riskini azaltmak için iyi sinyaller verir. Örneğin, bir forvetin xG/90 değeri yüksek ama gol sayısı düşükse, pozisyon alma iyi; sadece bitiricilik sorunu olabilir ve antrenmanla düzeltilebilir."

3. Veride hangi yaygın hatalar kararları bozabilir?

Yanıt unsurları: Etiket hatası, eksik veri, sezon bazlı sürüklenme (seasonality), small-sample bias, survivorship bias, target leakage.

Pratik öneri: Basit bir kontrol listesi: veri kaynağı doğrulaması, örnek boyutu analizi, etiketleme süreçlerinin audit'i, feature importance ile sızıntı kontrolü.

4. Model doğrulamasında hangi metrikleri kullanırsınız? Neden?

Beklenen yaklaşım: Problem sınıflandırma mı, regresyon mu ona göre AUC/precision-recall, MSE/MAE, kalibrasyon eğrileri, Brier skorları. Spor kararlarında kalibrasyon önemlidir; örneğin maç sonucu olasılıkları doğru kalibre edilmeli ki risk yönetimi sağlıklı yapılsın.

5. Overfitting’i nasıl yakalarsınız? Lig verisinde sık görülen tuzaklar nelerdir?

Detaylar: Cross-validation yerine zaman serili doğrulama (time-based split) kullanmak, mevsimsel bağımlılıkları test etmek, feature leakage’dan kaçınmak. Lig verilerinde oyuncu rotasyonları ve sakatlıklar nedeniyle veri dağılımı değişir; bu yüzden model doğrulaması zaman bazlı olmalı.

6. Bir oyuncu veya takım metriği ani yükseldiğinde hangi adımları atarsınız?

İzlenecek süreç: 1) Sinyalin kaynağını kontrol et (oyuncu rolü, maç rakibi, maç koşulları), 2) Veri hatası/etiket hatası araştır, 3) Örneklem genişlet (benzer dönemleri karşılaştır), 4) İstatistiksel test (anlamlılık), 5) Operasyonel öneri (deneme/anket/ağırlaştırılmış izleme).

7. xG gibi model tabanlı metriklerle nasıl iletişim kurarsınız?

Temel nokta: Teknik olmayan karar vericilere modelin kısıtlarını, güven aralıklarını ve hangi koşullarda güvenilir olduğunu anlatabilmek kritiktir. Görselleştirme (kalibrasyon plot, residual dağılım) ve kısa özetler (3 cümle) önerilir.

8. Hangi istatistiksel test veya görselleştirmeler karar vericileri ikna eder?

Örnekler: Bootstrap ile güven aralığı, etki büyüklüğü (Cohen's d), Kaplan-Meier (süre bazlı analizlerde), heatmap/shot map/possession networks. Görselleştirmeler sade ve iş hedefine bağlanmış olmalı.

9. Veri mühendisliği ve ölçüm altyapısına dair hangi soruları sorarsınız?

Adayın sormalı: Veri gecikme süresi (latency), veri doğrulama süreçleri, versiyonlama (data & model), ETL pipeline monitoring, hata metrikleri (missing rate, duplicate rate). Bu sorular operasyonel olgunluğu gösterir.

10. A/B testi veya deney tasarımıyla ilgili nasıl bir yaklaşımınız var?

Uygulama örneği: Taktik değişikliği, oyuncu pozisyonu değişikliği gibi müdahalelerde rastgeleleştirme mümkün değilse, difference-in-differences veya synthetic control yöntemleri kullanılmalı. Güç analizi (power analysis) ile gerekli örnek büyüklüğünü hesapla.

11. Saha tarafı ile veri bilim arasındaki en büyük uyumsuzluk ne olur ve bunu nasıl kapatırsınız?

Tipik uyuşmazlık: Veri bilimciler model sonuçlarını direkt aksiyon gibi sunar; saha ekipleri ise pratik kısıtlar (antrenman süresi, oyuncu ruh hali) nedeniyle farklı bakar. Çözüm: Pilot uygulamalar, kısa süreli KPI'lar, ortak jargon oluşturma ve düzenli feedback döngüleri.

12. Size verilen bir sinyalin üretim ortamına alınmasına karar verirken hangi kriterleri kullanırsınız?

Kriterler: Teknik doğruluk (kalibrasyon, stabilite), iş etkisi (ROI tahmini), operasyonel uygulanabilirlik, izlenebilirlik (monitoring), geri alma planı. Örnek: Yeni bir beklenen pas metriğini yayına almadan önce shadow test, A/B testi ve kullanıcı onayı gerekir.

Pratik Kontrol Listesi: Mülakat İçin Hızlı Değerlendirme

  • Veri kalitesi: Kaynaklar, eksik oran, güncellik.
  • Model doğrulama: Zaman bazlı CV, kalibrasyon, out-of-time test.
  • İş uyumu: KPIs bağlantısı, pilot önerileri.
  • Operasyonel ise: Pipeline, monitoring ve rollback planı.
  • İletişim becerisi: Karmaşık fikirleri sade anlatma yeteneği.

Hangi metrikler gerçekten karar verir, hangilerinden uzak durmalı?

Karar verici metrikler: İşle doğrudan ilişkili, kalibre edilebilen ve stabil sinyaller: xG/xA varyantları, kalibrasyonlu gol/assist olasılıkları, oyuncu yüklenme/yaralanma risk skorları (iyi validasyonlu). Bu metrikler karar süreçlerine doğrudan entegre edilebilir.

Yanıltıcı metrikler: Ham gol sayısı (küçük örneklem), yalnızca topa sahip olma, basit per 90 değerleri sezon bağlamı olmadan, aggregate hız veya mesafe ölçümleri bağlama göre yanlış yorumlanabilir.

Pratik kural: Metriğin karar verici olabilmesi için; ölçülebilir, stabil, iş hedefiyle inanılırca ilişkili ve operasyonel olarak uygulanabilir olması gerekir.

Sonuç: Mülakatı nasıl yapılandırmalısınız?

Röportajı teknik ve vaka tabanlı bölümlere ayırın. İlk kısım veri ve modelleme becerilerini ölçsün; ikinci kısım iş ve uygulama odaklı olsun. Her sorunun ardından 1–2 takip sorusu ekleyin ve adayın verdiği cevapları somut bir örnek üzerinden test edin. Böylece hem teknik yeterlilik hem de saha ile entegrasyon yeteneği anlaşılır.

Kısa öneri: Bir adayın verdiği cevabı değerlendirirken sonuçların tekrarlanabilir, iş etkisini tahmin edebilir ve operasyonel olarak uygulanabilir olup olmadığına bakın. Yanıltıcı metrikleri tanımak kadar, hangi metriklerin doğrudan karar aldıracağını gösterme yeteneği de kritik fark yaratır.