Blog / Veri Yönetimi / Röportaj Soruları: Veri Göçü ve Portabilite Uzmanına 12 Keskin Soru — Lig Geçmişini Güvenle Taşımak ve Format Kayıplarını Önlemek
Röportaj Soruları: Veri Göçü ve Portabilite Uzmanına 12 Keskin Soru — Lig Geçmişini Güvenle Taşımak ve Format Kayıplarını Önlemek
Veri Yönetimi

Röportaj Soruları: Veri Göçü ve Portabilite Uzmanına 12 Keskin Soru — Lig Geçmişini Güvenle Taşımak ve Format Kayıplarını Önlemek

Veri göçü ve portabilite, özellikle kullanıcıların oyun veya lig geçmişi gibi değerli kayıtlarını bir sistemden diğerine taşırken hata toleransı, bütünlük ve uyumluluk gerektirir. Bu yazıda bir mülakatçı olarak veri göçü ve portabilite uzmanına sorabileceğiniz 12 keskin soruyu, soruların arkasındaki mantığı, ideal cevap örneklerini, dikkat edilmesi gereken kırmızı bayrakları ve pratik değerlendirme kriterlerini bulacaksınız.

Neden bu sorular önemli?

Lig geçmişi gibi yapılandırılmış ama zaman içinde değişen veriler, format kaybı (lossy conversion), referans kopmaları ve meta veri kayıpları açısından hassastır. Bir uzmanın yalnızca teknik bilgisi değil planlama, test, hukuki uyumluluk ve operasyonel karar alma yetkinliği de değerlendirilmelidir.

Röportaj için 12 Keskin Soru

Aşağıdaki her soru için: amaç, beklenen kısa cevap ve red flag (olumsuz işaret) belirtilmiştir.

  1. Soru 1: Kaynak ve hedef veri modelini nasıl hızlıca karşılaştırır ve kritik uyumsuzlukları nasıl sınıflandırırsınız?

    Amaç: Schema mapping becerisini, önceliklendirme yeteneğini ve pragmatik yaklaşımını görmek.

    Beklenen cevap: Otomatik schema diff araçları + el ile örneklemle doğrulama (ör. anahtarlar, ilişkiler, zorunlu alanlar, veri tipleri). Uyumsuzlukları: yapısal (missing FK), semantik (farklı id anlamları), format (timestamp vs epoch), sınıflandırma: kritik/orta/düşük.

    Kırmızı bayrak: Sadece "tool kullanırım" diyip detay verememek; semantik uyumsuzlukları görmezden gelme.

  2. Soru 2: Lig geçmişi gibi ilişkili verilerde referans bütünlüğünü korumak için hangi stratejileri uygularsınız?

    Amaç: Referans bütünlüğü, foreign key'ler, cascade davranışı ve ID mapping stratejilerini değerlendirmek.

    Beklenen cevap: Önce referansları çözümlemek (mapping tablosu), geçici UUID kullanımı, sıralı migration (parent önce), toplu güncellemelerde transaction/rollback stratejisi. Ayrıca ID çakışması durumunda namespace veya id-prefixing önerisi.

    Kırmızı bayrak: Referansları reddetmek veya tek seferde silip yeniden yazmayı savunmak.

  3. Soru 3: Format dönüşümlerinde veri kaybını (ör. tarih, timezone, Unicode) nasıl önlersiniz?

    Amaç: Dönüşüm nüanslarını, encoding ve tarih/zaman yönetimini anlama.

    Beklenen cevap: Kaynak ve hedef encoding'lerini doğrulama, Unicode normalization, timezone-aware timestamp dönüşümleri (UTC canon), lossless format tercihleri (örn. JSON değil de JSONL + schema doğrulama veya Protobuf/Avro). Test verisiyle round-trip testleri uygulama.

    Kırmızı bayrak: "Sadece formatı değiştireceğim" deyip test planı olmayan yaklaşımlar.

  4. Soru 4: Büyük hacimli veri taşımalarında performans ve süreyi nasıl optimize edersiniz?

    Amaç: Büyüklük, paralelleştirme, throttling, kesinti süresi (downtime) yönetimini değerlendirmek.

    Beklenen cevap: Parçalama (sharding/partition-based), paralel tüketiciler, delta-only migration, sıkıştırma ve bulk API'leri kullanma, network optimizasyonu, cutover penceresi planlama, test edilmiş dry-run'lar.

    Kırmızı bayrak: Ölçeklendirme stratejisi olmadan tek-threaded transfer önerisi.

  5. Soru 5: Taşıma sırasında veri bütünlüğünü nasıl doğrularsınız? Hangi metrik ve teknikleri kullanırsınız?

    Amaç: Doğrulama, reconciliation ve otomatize edilebilir testleri görmek.

    Beklenen cevap: Checksums (MD5/SHA) ile blok bazlı doğrulama, satır sayıları, istatistiksel örnekleme, tam veri eşitliği için hash aggregate'ler, uygulama katmanı testleri, reconciliation raporları ve otomatik alarmlar.

    Kırmızı bayrak: Doğrulamayı "insan gözü"ne bırakma veya sadece satır sayısı kontrolüyle yetinme.

  6. Soru 6: Kademeli (phased) mı yoksa big-bang (kes-intili) mi tercih edersiniz? Kararınızı hangi kriterlere göre verirsiniz?

    Amaç: Risk yönetimi ve cutover stratejisi anlayışı.

    Beklenen cevap: Kritik sistemler için phased/parallel run (shadow mode) önerisi; düşük risk veya küçük datasetlerde big-bang mümkün. Karar kriterleri: veri kritikliği, rollbacks kolaylığı, kullanıcı etkileşimi, SLA gereksinimleri ve test sonuçları.

    Kırmızı bayrak: Her senaryoda tek bir stratejiyi dogmatik şekilde savunmak.

  7. Soru 7: Portabilite gereksinimleri (kullanıcı talebi, GDPR vs) nasıl ele alınır?

    Amaç: Hukuki, etik ve kullanıcı hakları perspektifini ölçmek.

    Beklenen cevap: Veri sahibi onayı, veri minimizasyonu, export formatlarının standartlara uygunluğu (JSON/CSV + schema), kimlik anonimleştirme veya pseudonymization önerileri, veri taşıma için süre ve doğrulama prosedürü.

    Kırmızı bayrak: Uyumluluk süreçlerini teknik ekipten ayrı tutma veya incelememek.

  8. Soru 8: Meta veri (provenance, değişiklik geçmişi) nasıl korunmalı ve taşınmalıdır?

    Amaç: Veri bağlamının korunması ve izlenebilirlik anlayışını görmek.

    Beklenen cevap: Metadata için ayrı katman, timestamped audit logların taşınması, değişiklik geçmişinin (versioning) saklanması veya minimal olarak delta snapshotların korunması. Provenance için lineage modelleri (örn. Apache Atlas) önerisi.

    Kırmızı bayrak: Metadata'yı önemsiz gören yaklaşımlar.

  9. Soru 9: Multimedya ve büyük BLOB'larda (ör. maç videoları, oyuncu avatarları) veriyi nasıl taşırsınız?

    Amaç: Büyük ikili nesnelerin (BLOB) transferi ve depolanmasıyla ilgili pratik çözümleri öğrenmek.

    Beklenen cevap: BLOB'ları veri tabanı yerine obje storage (S3, GCS) üzerinde tutup referansları taşımak; presigned URL'ler, parallel multipart upload, CDN senkronizasyonu, metadata ayrı tutulmalı ve checksum ile doğrulanmalı.

    Kırmızı bayrak: BLOB'ları direkt DB satırına gömme ya da tek seferde transfer önermesi.

  10. Soru 10: Gerçek dünya hatalarını tespit etmek için hangi test senaryolarını kullanırsınız?

    Amaç: Test kapsamı ve hata senaryoları bilgisi.

    Beklenen cevap: Edge-case dataset (nulls, corrupted rows, encoding issues), high-concurrency tests, partial network failure, interrupted transfers, out-of-order events, time-skewed timestamps. Ayrıca canary ve shadow migration testleri.

    Kırmızı bayrak: Sadece happy-path testleri önermesi.

  11. Soru 11: Rollback ve geri dönüş planınızı nasıl tasarlarsınız?

    Amaç: Risk minimizasyonu ve geri dönüş (rollback) stratejisi yetkinliği.

    Beklenen cevap: Incremental checkpoints, reversible scripts, iki yönlü senkronizasyon kullanarak geri dönüş yolu, otomatik veri eşitleme ve idempotent migration adımları. Acil durum runbook'u ve sorumluluk matrisinin varlığı.

    Kırmızı bayrak: Rollback'i "manuel" ve belirsiz bir süreç olarak tanımlaması.

  12. Soru 12: Migrasyon sonrası doğrulama ve kullanıcı kabul testi (UAT) süreçlerini nasıl yönetirsiniz?

    Amaç: Operasyon sonrası süreç ve müşteri odaklılık.

    Beklenen cevap: Otomatik doğrulama raporları, iş-birimi ile ortak UAT senaryoları, geri bildirim döngüsü, SLA ve izleme metrikleri (error rate, latency, missing refs) belirleme ve bir dönemde parallel run ile kabul etme.

    Kırmızı bayrak: UAT'ı sonradan yapılacak bir şey gibi göstermesi.

Mülakatı Pratikleştirme: Teknik Görev (Homework)

Bir adayın yetkinliğini ölçmek için kısa bir ev ödevi verin. Örnek:

  • 50.000 kayıt ve ilgili 10.000 ilişki içeren küçük bir lig geçmişi JSON seti verin.
  • Kaynak: JSON, Hedef: SQL (Postgres). Adaydan mapping şeması, örnek migrasyon scripti (Python/Go), checksum doğrulama ve 3 hatalı senaryo için test planı sunmasını isteyin.

Değerlendirme: Teknik doğruluk, test kapsamı, rollback planı, süre ve otomasyon seviyesi.

Değerlendirme Kriterleri ve Kırmızı Bayraklar

Kriterler:

  • Teknik derinlik: Schema mapping, checksum, encoding bilgisi.
  • Planlama: phased vs big-bang kararları ve cutover planı.
  • Risk yönetimi: rollback, test, monitoring.
  • Uyumluluk: GDPR, portabilite talepleri.

Kırmızı bayraklar kısa listesi:

  • Testsiz veya sadece "satır sayısı" doğrulaması.
  • Metadata/Provenance'ı görmezden gelme.
  • Rollback planı yok veya muğlak.

Sonuç

Veri göçü ve portabilite mülakatlarında teknik sorular kadar adayın risk algısı, test disiplini ve uyumluluk bilgisi de belirleyicidir. Yukarıdaki 12 soru, lig geçmişi gibi hassas ve ilişkisel verilerin güvenle taşınmasını sağlayacak temel yetkinlikleri açığa çıkarır. Adayın verdiği cevapları pratik ödevlerle destekleyin; gerçek veriyle yapılan küçük dry-run'lar mülakat performansını en iyi gösteren unsurdur.

İyi bir veri göçü sadece veriyi taşımak değildir; verinin anlamını, tarihçesini ve güvenilirliğini korumaktır.