Giriş: Küçük liglerde rekabet, büyük ligler kadar veri zenginliği sunmaz; ancak doğru yaklaşım ve basit makine öğrenmesi modelleriyle rakip profilleme yapmak mümkündür. Bu yazıda, hangi veri kaynaklarını kullanacağınızı, hangi özellikleri (feature) üretmeniz gerektiğini, küçük veriyle çalışırken hangi modellerin daha uygun olduğunu ve 30 dakikalık pratik bir uygulama adımlarını bulacaksınız.
Neden küçük ligler için ayrı bir rehber?
Küçük liglerin veri kalitesi ve miktarı sınırlıdır. Opta veya benzeri detaylı event verisi genellikle yoktur veya çok pahalıdır. Bu nedenle yöntemlerimiz şu prensiplere dayanır:
- Basitlik: Az veriyle çalışabilen modeller (ör. karar ağaçları, lojistik regresyon).
- Hız: 30 dakika içinde sonuç alabilecek adımlar.
- Hafif veri işleme: Çok karmaşık özellikler yerine, özet istatistikler ve bağlamsal bilgiler.
Hangi veriler kullanılmalı? (Veri kaynakları)
Küçük ligler için erişilebilir ve yüksek fayda/maliyet oranı olan veri kaynakları:
- Resmi lig siteleri ve maç raporları: Sonuçlar, gol dakikaları, kartlar, değişiklikler. Manuel toplanabilir veya basit scraping ile çekilebilir.
- Yerel medya ve taraftar forumları: Takım kadroları, cezalı/sakat bilgileri hızlı bulunabilir.
- Transfermarkt, Soccerway, FBref (bazı veriler ücretsiz): Oyuncu geçmişi, maç istatistikleri, takım sıralamaları.
- Video ve basit event çıkarımı: Eğer maç videoları varsa, hızlı elle etiketleme ile gol, şut, tehlikeli atak gibi olaylar elde edilebilir.
- CSV/Excel ile manuel veri girişi: Küçük liglerde çoğu zaman en pratik yöntem budur; haftalık maç özetlerini tabloya işleyin.
Hangi özellikler (features) en değerli?
Az ve güvenilir özelliklerle işe başlamak önemlidir. Aşağıdaki özellikler küçük liglerde sıkça iyi performans verir:
- Skor ve puan trendleri: Son 5 maçlık puan ortalaması, gol farkı ortalaması.
- Ev/Deplasman etkisi: Evde ve deplasmanda alınan ortalama puanlar.
- Form göstergeleri: Son 3 maçta kazanma oranı, son maçlardaki gol sayısı.
- Kritik oyuncu yokluğu: Sakat veya cezalı kilit oyuncu bilgisi (1/0 ile gösterilebilir).
- Göreli güç: Lig sıralaması farkı, geçen sezon performansı.
- Maç öncesi bağlamsal bilgiler: Hava koşulları (varsa), maçın ertelenme geçmişi, sahadaki zemin türü.
Örnek: "Rakip X için son 5 maçta ortalama gol: 1.2, savunma gol yeme ortalaması: 1.4, kilit oyuncu (forvet) sakat mı: hayır (0)" gibi satırlar oluşturun.
Hangi modeller tercih edilmeli? Avantaj ve dezavantajlar
Küçük veriyle çalışan, kolay yorumlanabilen modeller önceliklidir:
- Lojistik Regresyon – Avantaj: Basit, hızlı, olasılık tahmini verir. Dezavantaj: Doğrusal olmayansa sınırları var.
- Karar Ağaçları – Avantaj: Kolay yorumlanır, kural tabanlı profilleme sağlar. Dezavantaj: Aşırı uyuma eğilimli; budama veya sınırlı derinlik gerek.
- K-En Yakın Komşu (k-NN) – Avantaj: Parametresiz, sezgisel. Dezavantaj: Özellikle çok az özellik olduğunda hassas, boyut laneti sınırlaması azdır ama veri küçükse işe yarar.
- Naive Bayes – Avantaj: Çok az veriyle bile çalışır, hızlıdır. Dezavantaj: Özelliklerin bağımsızlığı varsayımı gerçek dünya için her zaman geçerli değil.
- Basit Ensemble (ör. ortalama tahmin) – Avantaj: Birkaç basit modelin ortalaması genelde stabil sonuç verir. Dezavantaj: Karmaşıklık artar.
30 Dakikada Uygulama Rehberi — Adım Adım
Bu bölüm pratik, zamanlı adımlar sunar. Hedef: Elinizde haftalık maç verisiyle 30 dakika içinde kullanışlı bir rakip profilleme modeli oluşturmak.
0–5. Dakika: Veri Toplama ve Hazırlık (5 dk)
- Elinizdeki maç sonuçları, ev/deplasman, gol sayıları, kartlar ve mevcut sakat bilgilerini tek bir CSV dosyasında toplayın.
- Her maç için bir satır; takımA, takımB, golA, golB, tarih, ev/deplasman, kilit_oyuncu_var (0/1) gibi sütunlar oluşturun.
- Temizleme: Eksik tarih veya sonuç varsa atın; kategorikleri (ev/deplasman) 0/1 yapın.
5–12. Dakika: Özellik Mühendisliği (7 dk)
- Son 5 maç ortalaması: Takım başına son 5 maçın gol ortalaması ve gol yeme ortalaması hesaplayın.
- Form: Son 3 maç kazanç sayısı / 3.
- Sıralama farkı: Ev sahibi sıralama - deplasman sıralama.
- Bunları maç bazlı bir tabloya ekleyin (feature set).
12–20. Dakika: Model Seçimi ve Hızlı Eğitim (8 dk)
- Basit bir model seçin: Lojistik regresyon veya karar ağacı. Küçük lig için karar ağacı (max_depth=3) iyi bir başlangıçtır.
- Veriyi eğitim/test olarak ayırın (ör. zaman serisi ise son 10% test olarak bırakın; rastgele ayırma da kabul edilir).
- Modeli eğitin (sklearn, R veya Excel ile regresyon). Tahmin edilecek hedef: maç sonucu (galibiyet/beraberlik/mağlubiyet) veya gol farkı yönü.
20–27. Dakika: Değerlendirme ve Basit İyileştirme (7 dk)
- Hızlı metrikler: Doğruluk, karışıklık matrisi; gol farkı tahmini yapılıyorsa MAE/accuracy kullanın.
- Feature importance (karar ağacı için) ile hangi özelliklerin etkili olduğunu görün. Gereksiz özellikleri çıkarın.
- Model stabilize değilse basit ensemble (lojistik + karar ağacı) ortalaması deneyin.
27–30. Dakika: Sonuçları Kullanıma Alma (3 dk)
- Model çıktısını CSV veya Google Sheets'e aktarın; maç öncesi rapor oluşturun: rakibin güçlü/zayıf yönleri, beklenen gol farkı, kazanma olasılığı.
- Basit uyarılar ekleyin: "Kil it forvet sakat -> rakip gol ortalaması +0.4" gibi kurallar.
Somut Örnek: Karar Ağacı ile Basit Profil
Örnek özellik seti: [son5_gol, son5_golge, ev_deplasman(1=ev), kilit_sakat(0/1), siralama_farki]. Karar ağacı bu özellikleri kullanarak "rakip hücum gücü yüksek/seviyeli/zayıf" gibi etiketler üretebilir. Bu etiketleri antrenman ekibiyle paylaşarak taktiksel planlamada kullanabilirsiniz.
Pratik İpuçları ve Yaygın Hatalar
- Az veri ile overfitting: Modeli çok derin yapmayın; çapraz doğrulama yerine zaman serisi mantığıyla test bırakmak daha sağlıklıdır.
- Özelliklerin anlamı: Otomatik çok fazla özellik üretmektense, saha mantığıyla (kaç gol atıyor, kim eksik) oluşturun.
- Güncelleme: Her hafta veriyi güncelleyin; küçük ligler dinamik olabilir.
- İletişim: Teknik olmayan koçlarla sonuçları paylaşırken olasılık ve belirsizliği net şekilde ifade edin (örn. %65 kazanma olasılığı).
Sonuç
Küçük liglerde rakip profilleme, pahalı çözümlere ihtiyaç duymadan uygulanabilir. Doğru veri seçimi, basit ama yorumlanabilir modeller ve düzenli güncelleme ile maç bazlı faydalı öngörüler elde edebilirsiniz. 30 dakikalık rehberde verdiğim adımları takip ederek ilk prototipi hızlıca kurabilir, saha kararlarınıza veri destekli argümanlar ekleyebilirsiniz.
Özetle: Az veri, doğru yaklaşım ve alan bilgisi ile makine öğrenmesi küçük liglerde de rekabet avantajı sağlayabilir.