Blog / Veri Bilimi / Röportaj Rehberi: Veri Bilimcisine Sorulacak 12 Keskin Soru — Lig Verinizi Anlamlı İçgörülere Çevirme
Röportaj Rehberi: Veri Bilimcisine Sorulacak 12 Keskin Soru — Lig Verinizi Anlamlı İçgörülere Çevirme
Veri Bilimi

Röportaj Rehberi: Veri Bilimcisine Sorulacak 12 Keskin Soru — Lig Verinizi Anlamlı İçgörülere Çevirme

Lig verisiyle çalışan bir ekip için doğru veri bilimcisini seçmek, sadece teknik becerilere bakmaktan çok daha fazlasıdır. Doğru sorular, adayın problem çözme yaklaşımını, ürün odaklı düşüncesini ve lig bağlamında içgörü üretme yeteneğini ortaya çıkarır. Bu rehber, mülakatlarda sorabileceğiniz 12 keskin soru, her soruya dair neyi ölçtüğü, beklenen iyi cevap örnekleri ve pratik takip sorularını içerir.

Neden özel olarak lig verisine odaklanmalısınız?

Lig verileri (maç sonuçları, oyuncu istatistikleri, kondisyon verileri, seyirci davranışları vb.) hem zaman serisi hem de olgu-temelli karma yapılar barındırır. Bu veri tipleri; eksik veri, bulutlanmış (noisy) sensör ölçümleri ve mevsimsellik gibi zorluklar getirir. Bir veri bilimcisinin bu bağlamı anlaması, model sonuçlarını hem teknik hem de operasyonel açıdan yorumlayabilmesi gerekir.

Röportaj Öncesi Hazırlık

  • İş hedeflerini netleştirin: Hangi kararları destekleyeceksiniz? Transfer mi, maç taktikleri mi, taraftar etkileşimi mi?
  • Örnek veri seti hazırlayın: Adaya küçük bir çalışma ödevi (ör. 1-2 saatlik veri temizleme ve kısa analiz) verin.
  • Teknik ve davranışsal soruları karıştırın: Sadece kod yazdırmak yerine iletişim, etki ve işbirliği yeteneklerini de ölçün.

12 Keskin Soru ve Neyi Ölçer

  1. Lig verinizde en sık karşılaştığınız veri kalite sorunları neler olur? Nasıl tespit eder ve düzeltirsiniz?

    Amacı: Adayın veri keşfi (EDA) ve veri hijyeni yaklaşımını ölçer.

    İyi cevap örneği: Eksik GPS koordinatları, sensör sapmaları, farklı lig dönemlerine ait şema değişiklikleri. Çözümler: zaman serisi interpolasyonu, sensör kalibrasyonu için istatistiksel kontrol, şema versiyonlama ve meta veri kullanımı.

    Takip: Hangi metriklerle veri kalitesini izlersiniz? Data pipeline'da otomatik hangi kontroller olmalı?

  2. Bir oyuncunun performansını ölçmek için hangi metrikleri önerirsiniz ve neden?

    Amacı: Adayın domain bilgisi ve metrik tasarım yeteneği.

    İyi cevap örneği: Temel: goller/asist, xG (expected goals), şut/kaleye isabet oranı. Yardımcı: koşu mesafesi, sprint sayısı, topa sahip olma süreleri. Metrikleri normalize etme (dakika başına, pozisyon bazlı) ve varyansı kontrol etme vurgulanmalı.

    Takip: xG'yi lig bazında nasıl kalibre edersiniz? Pozisyon farklılıklarını nasıl hesaba katarsınız?

  3. Bir transfer kararı için hangi model veya analizleri sunardınız?

    Amacı: Adayın iş odaklı düşünme ve modeli iş sonuçlarına bağlayabilme yeteneği.

    İyi cevap örneği: Öncelikle performans ve sağlık geçmişi analizi, risk skoru (sakatsızlık, düşen form), karşılaştırmalı benzer oyuncu cohort analizi, maliyet-fayda tablosu. Model: survival analysis (sakatlık riski), regression veya tree-based modeller ile beklenen katkı tahmini.

    Takip: Model belirsizliğini nasıl karar vericilere sunarsınız? Sensitivity analysis yapar mısınız?

  4. Mevsimsellik ve lig içi değişimleri modellerken hangi stratejileri kullanırsınız?

    Amacı: Zaman serisi bilgisi ve sezonlar arası transferlerin etkisini anlama.

    İyi cevap örneği: Decomposing time series (trend, seasonality, residual), per-season normalizasyon, oyuncu yaş faktörü, rule-based segmentasyon (playoff vs normal sezon), shift-aware modeller (time-aware cross-validation).

    Takip: Yıllar arası kural değişiklikleri (ör. puan yapısı) nasıl ele alınır?

  5. Modellerin sahada uygulanmasını nasıl sağlarsınız? Ürünleştirme (production) süreciniz nasıldır?

    Amacı: MLOps farkındalığı ve pragmatik yaklaşım.

    İyi cevap örneği: Prototip → A/B test → Canary deployment akışı; model izleme (drift, performans), geri dönülebilirlik, otomatik eğitim boru hattı, iş birimi ile birlikte KPI tanımlama.

    Takip: Sahada model beklenen katkıyı sağlamazsa hangi adımları atarsınız?

  6. Müşteriniz (koç, scout, yönetim) model sonuçlarını anlamakta zorlanıyor. Nasıl iletişim kurarsınız?

    Amacı: İletişim becerileri ve hikâyeleştirme.

    İyi cevap örneği: Öncelikle hedef kitlenin teknik seviyesini ölçme, görselleştirme (öncelik: basit KPI dashboard), karar önerileriyle birlikte belirsizlik aralığını gösterme. Kısa özet + detaylı teknik ek şeklinde sunum.

    Takip: Hangi görselleştirmeler koçlar için en faydalıdır?

  7. Lig verisinde nadir olayları (örn. nadir sakatlık, kırmızı kart) nasıl modelleyip raporlarsınız?

    Amacı: İmbalance ve nadir olaylara yaklaşım.

    İyi cevap örneği: Oversampling, anomaly detection, Bayesian yaklaşımlar, simülasyon tabanlı senaryo analizi. Rapor: beklenen frekans, tetikleyici koşullar ve risk azaltma önerileri.

    Takip: Gerçek hayatta örnek bir müdahale önerisi sunabilir misiniz?

  8. Bir modelin performansı düşmeye başladığında ilk 3 kontrolünüz ne olur?

    Amacı: Problem çözme hızı ve kök neden analizi yeteneği.

    İyi cevap örneği: 1) Veri drift kontrolü, 2) Feature distribution değişiklikleri, 3) Label leakage / etiket problemleri. Ayrıca pipeline hatalarını ve versiyon uyumsuzluklarını kontrol etme.

    Takip: Kontrol listesini örneklendirir misiniz?

  9. Lig performansını artırmak için deney tasarımı (A/B testi) öneriniz nasıl olur?

    Amacı: Deneysel düşünce ve istatistiksel sağlamlık.

    İyi cevap örneği: Deney ünitesi (takım mı maç mı oyuncu mu), örneklem büyüklüğü hesapları, etkili metrik seçimi (ör. gol başına beklenen katkı), tespit gücü (power) analizi, sürecin adımları ve risk yönetimi.

    Takip: Doğal kontrollerin olmadığı durumlarda nasıl kontra-factual oluşturursunuz?

  10. Hangi durumlarda açıklanabilir (interpretable) modelleri black-box modellere tercih edersiniz?

    Amacı: Etik, interpretasyon ve uygulama bağlamı anlayışı.

    İyi cevap örneği: Karar etkisi yüksekse (transfer, saha dizilimi), regülasyon veya iç iletişim ihtiyacı varsa açıklanabilir modeller tercih edilir. Black-box kullanılacaksa SHAP/LIME ile açıklama sağlanmalı.

    Takip: SHAP sonuçlarını nasıl yanlış yorumlanabileceğine dair örnek verebilir misiniz?

  11. Lig verisinde dışsal faktörleri (hava, maç yoğunluğu, seyahat mesafesi) nasıl entegre edersiniz?

    Amacı: Feature engineering ve dış veri entegrasyonu becerisi.

    İyi cevap örneği: Dışsal verileri zaman bazlı birleştirerek lag ve rolling özellikleri oluşturma, etkileşim terimleri (ör. yolculuk mesafesi x hafta içi maç sayısı), eksik veri için proxy değişkenler kullanma.

    Takip: Hava durumunun modeldeki etkisini nasıl test edersiniz?

  12. Size verilen örnek lig verisini 1 saatlik bir ödevle nasıl incelerdiniz? Hangi çıktıları getirirsiniz?

    Amacı: Pratik yaklaşıma ve önceliklendirmeye bakış.

    İyi cevap örneği: 1) Veri kalite özeti (missing, dtypes), 2) Temel istatistikler ve görselleştirmeler (goal distribution, player minutes), 3) 2-3 hipotez (ör. deplasman performansı düşüyor) ve kısa öneriler.

    Takip: Hangi grafikler hızlı içgörü verir?

Mülakatı Değerlendirirken Kullanılabilecek Kriterler

  • Problem anlama: Sorunun iş hedefleriyle nasıl ilişkilendirildiği.
  • Teknik doğruluk: Yöntemler, varsayımlar ve sınırlılıkların farkında olma.
  • Uygulanabilirlik: Modelin sahaya dönüşme olasılığı ve MLOps farkındalığı.
  • İletişim: Karmaşık kavramları sade şekilde aktarabilme.
  • Yaratıcılık: Özgün feature mühendisliği veya deney tasarımı önerileri.
İyi bir veri bilimcisi, sadece modeli düzgün bir şekilde yazan kişi değildir; iş kararını anlayan, belirsizliği yöneten ve sonuçları eyleme dönüştürebilen kişidir.

Kısa Case Study: Transfer Kararı

Örnek: Kulübünüz 24 yaşında bir kanat oyuncusu düşünüyor. Aday veri bilimciden istek: oyuncunun önümüzdeki 2 sezon boyunca takıma katkısını beklenen gol/assist olarak modellemek, sakatlık riskini tahmin etmek ve maliyet-fayda tablosu sunmak.

Adım adım yaklaşım:

  1. Veri toplama: maç/oyuncu seviyesinde performans, sakatlık geçmişi, antrenman verileri, seyahat yoğunluğu.
  2. Feature engineering: dakika başı katkı, pozisyon normalize edilmiş xG, form trendleri, injury-prone feature'ları.
  3. Modelleme: regression ensemble + survival model (sakatlık için).
  4. Değerlendirme: geçmiş transferlerden karşılaştırmalı cohort analizi, belirsizlik aralıkları, senaryolar (iyi/orta/kötü).
  5. Sunum: 1 sayfalık executive summary + teknik ek.

Sonuç: Soruların Arka Planını Kavrayın

Mülakat sırasında her soru bir yetenek setini ölçer: teknik bilgi, domain hakimiyeti, iletişim, uygulama becerisi. Soruların amacını bilmek, adayın verdiği cevabı etkin şekilde değerlendirmeyi sağlar.

Bu rehberi kullanarak lig verisiyle çalışacak veri bilimcileri için daha sistematik, iş odaklı ve sonuç üreten mülakatlar yapabilirsiniz. Her sorunun yanında beklenen cevap yapılarını ve takip sorularını hazır bulundurmak, mülakat kalitesini ve işe alım başarısını doğrudan artırır.

Uygulama önerisi: Adaylara kısa bir ödev verin (örn. 2 saat), ardından bu 12 sorudan 4-5 tanesini derinlemesine sorun. Teknik cevapları iş hedefleriyle ilişkilendirmelerini isteyin; böylece teorik bilgi ile pragmatik uygulama arasındaki dengeyi test etmiş olursunuz.