Yüksek Performanslı Hesaplama (HPC) Mimari Tasarımı
HPC ve AI altyapısını donanım broşürlerinden değil, gerçek iş yüklerinden başlayarak tasarlayın.
Bu hizmet, belirsiz şekilde tarif edilen gereksinimleri HPC ve AI kümeleri için somut ve test edilebilir bir mimariye dönüştürmeye odaklanır. Mevcut ve beklenen iş yüklerini – CPU ağırlıklı simülasyonlar, GPU yoğun eğitim işleri, ön/son işleme aşamaları ve depolama erişim kalıpları – kısa bir keşif ile analiz ederek başlarız.
Buradan hareketle, gerçek talep profiline uyan düğüm tipleri, CPU/GPU oranı, bellek kapasitesi, NUMA düzeni ve ağ yapısını öneririz. Fat-tree veya dragonfly gibi farklı ağ topolojileri maliyet, ölçeklenebilirlik ve arıza alanları açısından açık trade-off’larla değerlendirilir.
Sonuç, satın alma süreçlerinde veya teknik şartnamelerde doğrudan kullanılabilecek, malzeme listesi seçenekleri, kapasite projeksiyonları ve zaman içinde doğrulanabilir tasarım varsayımları içeren net bir mimari dokümandır.
Vaka çalışması – Dağınık düğümlerden tutarlı bir kümeye geçiş
Orta ölçekli bir araştırma laboratuvarının yıllara yayılmış şekilde satın aldığı 6 farklı nesilden sunucusu vardı ve bunların arkasında tutarlı bir mimari bulunmuyordu. Kullanıcılar öngörülemez performanstan ve paylaşımlı NFS sunucusundaki sık darboğazlardan şikâyetçiydi.
İş yüklerini ve hata modellerini analiz ettikten sonra, etkileşimli, batch ve depolama rollerini ayıran; yeni alımlar için tutarlı bir düğüm tipi tanımlayan ve eski donanımları daha az kritik işler için yeniden konumlandıran birleşik bir mimari önerdik. Yeni tasarım yönetimi basitletti, tedarik süreçlerini kolaylaştırdı ve tekil NFS darboğazını ortadan kaldırarak destek taleplerini %40’tan fazla azalttı.