Blog / Topluluk / 48 Saatlik Sunucu Çöküşünün Güncesi: Küçük Ligin Kriz Yönetimi, Gönüllüleri ve Topluluk Onarımı
48 Saatlik Sunucu Çöküşünün Güncesi: Küçük Ligin Kriz Yönetimi, Gönüllüleri ve Topluluk Onarımı
Topluluk

48 Saatlik Sunucu Çöküşünün Güncesi: Küçük Ligin Kriz Yönetimi, Gönüllüleri ve Topluluk Onarımı

Giriş

Bir küçük lig için sunucu, sadece teknik bir altyapı parçası değil; maçların düzenlendiği, sohbetlerin aktığı, zaferlerin kutlandığı ve hayal kırıklıklarının paylaşıldığı ortak yaşam alanıdır. Bu hikâye, 48 saat süren beklenmedik bir sunucu çöküşünü ve sonrasındaki kriz yönetimi, gönüllü koordinasyonu ile topluluk onarım süreçlerini sahici, adım adım anlatır. Amacım sadece yaşananları aktarmak değil; uygulanabilir taktikler, iletişim şablonları ve geleneksel hata analizinin ötesinde topluluk onarma stratejileri sunmak.

Olaya İlk Tepki: Saat 0-4

İlk alarm sabah 03:12'de geldi: maç eşleştirme sistemi yanıt vermiyordu. İlk 10 dakikada yapılanlar basitti ama kritikti: durumu doğrulamak, yedek iletişim kanallarını açmak ve lider gönüllüleri uyandırmak.

  • Doğrulama: Sunucuya ping atıldı, servis logları hızlıca incelendi.
  • İlk iletişim: Discord'da acil durum kanalı aktif edildi; anons yapıldı.
  • Hızlı triage: Hata oyun motorundan mı, ağ katmanından mı yoksa veri tabanından mı kaynaklanıyor belirlendi.

Bu aşamada yapılan en büyük hata, belirsiz ve geciken iletişimdir. Bizim ligde, ilk 30 dakikada net bir duruş sergilenmesi topluluğun paniğe dönüşmesinin önünü aldı.

Saat 4-12: Kriz Yönetiminin Kurgulanması

İlk dört saatte bir kriz panosu oluşturuldu. Panoda görev dağılımı, iletişim planı ve kısa vadeli hedefler yer aldı. Bu panonun iki amacı vardı: (1) teknik çözümün hızlandırılması, (2) topluluğa güven veren sürekli iletişim.

Görev dağılımı (örnek)

  1. Teknik Lider: Sunucu logları, donanım sağlığı, sağlayıcı ile görüşme.
  2. Gönüllü Koordinatörü: Vardiya planı, gönüllü görev atamaları.
  3. İletişim Sorumlusu: Durum güncellemeleri, sık sorulan sorular (SSS) hazırlama.
  4. Topluluk İyileştirme Ekibi: Etkinlik ertelemeleri, telafi planları, pozitif içerik üretimi.

İletişim İlkeleri

  • Şeffaflık ama teknik karmaşadan uzak açıklamalar.
  • Sürekli güncelleme: İlk anons, 1 saat sonra durum raporu, 6 saatte ayrıntılı güncelleme.
  • Sorumluluk üstlenme: Kimse söylemiyorsa bile liderler açık bir ‘biz sorumluyuz’ mesajı vermeli.

Saat 12-24: Gönüllü Gücü ve Teknik Müdahale

Bu zaman diliminde yapılan iki paralel çalışma belirleyiciydi: teknik onarım çalışmaları ve gönüllü organizasyonu.

Teknik hamleler

  • Sağlayıcı ile toplantı: Donanım arızası olasılığı değerlendirildi, yedek sunucu önceliklendirildi.
  • Yedekleme kontrolü: Veri kaybı riski minimaldi çünkü günlük snapshotlar vardı, ancak son 3 saatin maç kayıtları kısmen etkilendi.
  • Geçici çözüm: Sadece maç raporlamayı açacak hafif bir instance ayağa kaldırıldı.

Gönüllü koordinasyonu

Topluluk gönüllülerinin enerjisini doğru yönlendirmek, hem operasyonel hem de duygusal iyileşme için hayatiydi. Burada iki yaklaşımı uyguladık:

  • Vardiya sistemi: 4 saatlik kısa vardiyalar ile 24 saat destek.
  • Sosyal görevler: Maç erteleme duyuruları, oyunculara birebir destek, yeni tarihlerin belirlenmesi.

Saat 24-36: Topluluk Onarma Atılımları

Sunucu kademeli olarak tekrar hizmet vermeye başladı, ancak hasar yalnızca teknik değildi. Oyuncuların güveni sarsılmıştı. Bu yüzden topluluk onarımına odaklandık.

İletişim ve empati

En etkili mesaj, «Anlıyoruz; siz de biz de kaybettik. Bu hatadan ders çıkardık ve telafi edeceğiz» cümlesidir. Kesinlik: ne olduğunu, ne yaptığınızı ve ne zaman normale döneceğini söyleyin.

Tazminat ve telafi stratejileri

  • Hatalı maçlar için yeniden slot açma garantisi.
  • Gönüllülere ve etkilenen oyunculara küçük ödüller: özel roller, turnuva önceliği, simgesel içerikler.
  • Şeffaf geri ödeme politikası gerekiyorsa uygulanmalı; ancak topluluk bağını güçlendirmek çoğu zaman maddi telafiden etkili olur.

Saat 36-48: Postmortem ve Sürdürülebilir İyileştirme

48. saatin sonunda tam bir postmortem oturumu düzenlendi. Bu toplantının amacı suçlu aramak değil, tekrarı önleyecek somut eylem planları çıkarmaktı.

Postmortem şablonu (kısa)

  1. Olayın kronolojisi: Saat-dakika bazlı kayıt.
  2. Nedenler: Birincil ve ikincil nedenlerin ayrımı.
  3. Ne işe yaradı: Hızlı iletişim, gönüllü mobilizasyonu gibi başarılı adımlar.
  4. Ne yanlış gitti: Eksik yedeklemeler, tek nokta başarısızlığı vb.
  5. Öncelikli aksiyonlar: 30/60/90 günlük plan.
  6. Sorumluluk atamaları: Kim ne yapacak ve son tarihleri.

Teknik önlemler

  • Çok bölgeli yedekler: Single-region hosting riski kabul edilemez hale geldi.
  • Otomatik failover testleri: Yılda en az 4 kez test.
  • Snapshot sıklığının artırılması: Kritik veri için saatlik snapshot.

Pratik İletişim Şablonları

Aşağıda farklı durumlar için kısa, net mesaj örnekleri bulunuyor. Bunları kendi topluluğunuza göre kişiselleştirin.

  • İlk anons (kısa): Sunucu erişiminde sorun var. Ekip müdahaledeyse; lütfen sakin olun, 30 dakikada güncelleme paylaşacağız.
  • 1 saat güncellemesi: Sorunun kaynağı tespit edildi. Yedekleme ve geçici çözüm için çalışıyoruz. Tahmini süre: 6 saat.
  • Çözüm sonrası: Servis kademeli olarak geri geliyor. Etkilenen maçlar ve telafi planı yakında açıklanacak.

Gönüllülere Özel Notlar: Motive Etme ve Takdir

Gönüllüler kriz anında en değerli kaynaklardır. Onlara nasıl davranacağınız, topluluk paydasını ya güçlendirir ya da erozyona uğratır.

  • Net görevler verin; belirsizlik motivasyonu öldürür.
  • Küçük kazanımları kutlayın: Her 4 saatte bir teşekkür mesajı, başarı rozetleri.
  • Geri bildirim alın: Gönüllüler süreçte neleri zor buldu, neleri öneriyor?

Sonuç: Bir Kriz, Bir Fırsat

48 saatlik sunucu çöküşü acı vericiydi; ancak doğru adımlarla bir topluluğun sabrı güvene dönüştürüldü. Kritik olan, teknik onarımdan sonra duygusal ve organizasyonel onarıma odaklanmaktı. Bu hikâye yalnızca bir anektot değil; küçük liglerin kriz anında uygulayabileceği pratik bir rehberdir.

Özetle: Erken ve şeffaf iletişim, organize gönüllü gücü, düzenli postmortem ve somut telafi adımları, küçük toplulukların büyük krizlerden güçlenerek çıkmasını sağlar.