GPU’lar tehlikede.
Şöyle düşünün, Nvidia‘nın o gösterişli, pahalı ekran kartları—ikinci el bir arabadan daha çok paraya mal olan cinsten—yeni bir saldırı türü tarafından adeta paramparça ediliyor. Peki, kullanılan silah ne? Rowhammer. Rowhammer’ı hatırladınız mı? Bellek hücrelerini sürekli titreştirerek bitlerin ters dönmesine neden olup kaosa yol açan o eski numara? Evet, geri döndü. Hem de profesyonelce.
DRAM Bozunmasının On Yılı
Uzun yıllar boyunca Rowhammer daha çok CPU’ların meselesiydi. Araştırmacılar, belirli DRAM satırlarına sürekli vurarak—yani bitleri 0’dan 1’e veya 1’den 0’a çevirerek—çeşitli küçük çaplı sorunlara yol açabileceğini keşfetmişlerdi. Veri bozulması, belki bir sandbox’tan kaçış gibi. İlginç tabii ama dünyayı yerinden oynatacak cinsten değildi. Bunu geliştirdiler, ince ayar yaptılar, ECC belleğiyle karşı koymaya çalıştılar ve etrafından dolaşmanın yollarını buldular. Hatta ağlar üzerinden çalıştırıp Android telefonları rootladılar, şifreleme anahtarlarını çaldılar. Klasik dijital yaramazlıklar.
Geçen yıl ise üst düzey Nvidia GPU’larda bulunan GDDR belleği hedef aldılar. Sonuçlar… pek etkileyici değildi. Birkaç bit hatası. Sinir ağı çıktısında bir miktar bozulma. Pek savaş ilanı gibi durmuyordu.
Ampere Kuşatma Altında
Ancak Perşembe günü her şey değişti. İki ayrı araştırma ekibi, bağımsız olarak Nvidia’nın Ampere nesli GPU’larına gerçek anlamda yüklenmeye karar verdi. Ve korkunç bir şey buldular. Artık bunlar sadece ufak tefek aksaklıklar değil. Bunlar, saldırganlara CPU belleği üzerinde tam kontrol sağlayan bit çevirmeleri. Ve CPU belleğini kontrol ederseniz, tüm o lanet makineyi kontrol edersiniz. Root erişimi. Tam sistem ele geçirme.
Araştırmacılar, CPU DRAM’de mümkün olanın çok küçük bir kısmı olan sadece sekiz bit çevirmesi gerçekleştirebildiler ve hasar, hedeflenen GPU’da çalışan bir sinir ağının çıktısını bozmakla sınırlı kaldı.
İşte bu kısım ‘alarm zilleri’ çaldırıyor. Önceki GDDR zafiyeti bir fısıltıydı. Bu ise tam teşekküllü bir siren sesi. IOMMU bellek yönetimi devre dışı bırakılmış varsayılan BIOS ayarı, saldırganın en iyi dostu. Dolayısıyla, genellikle güvenlik zaten karmaşık bir mesele olan bulut ortamlarında paylaşılan bu binlerce dolarlık donanımlar, artık devasa, savunmasız hedefler haline gelmiş görünüyor. Sanki zırhlı bir aracın anahtarını kontakta bırakmak gibi.
Neden Şimdi? Neden Nvidia?
Bu yüksek performanslı GPU’ların muazzam maliyeti, onları neredeyse yalnızca veri merkezlerinde ve bulut platformlarında bulunabileceği anlamına geliyor. Bunlar paylaşılan kaynaklar. Bu da, ele geçirilen bir GPU’nun potansiyel olarak o ana makineyi paylaşan birden fazla kullanıcıyı etkileyebileceği demek. Burada mesele tek bir oyuncunun bilgisayarı değil. Bu, birçok yapay zeka ve yüksek performanslı bilgi işlem operasyonunun omurgasıyla ilgili.
Nvidia’nın güvenlik yaklaşımı genellikle… diyelim ki, tepkisel olarak algılanıyor. Her zaman yetişmeye çalışıyorlar. Ama bu farklı hissettiriyor. Bu sadece bir yazılım hatası değil. Bu, potansiyel olarak GDDR belleğin tasarımında veya aşırı stres altında uygulamasında bulunan donanımsal bir zafiyet. Temelde bir kopukluğu vurguluyor: daha güçlü donanımlar inşa ediyoruz, ancak aynı hızda mutlaka daha güvenli donanımlar inşa etmiyoruz. Saf performans arayışı, güvenlik sertleştirilmesindeki özeni sürekli olarak geride bırakıyor gibi görünüyor.
En gelişmiş silikonun bile şaşırtıcı derecede basit fizik kurallarıyla alt edilebileceğinin keskin bir hatırlatıcısı. Ve o fizik bir saldırgana krallığın anahtarlarını teslim ettiğinde, evet, bu bir sorun. Nvidia ve en yeni donanımlarını kullanan herkes için büyük ve pahalı bir sorun. Muhtemelen telaşlı yamalar ve çok sayıda endişeli sistem yöneticisi göreceğiz.
Daha Eski Nvidia GPU’ları Etkileniyor mu?
En yeni saldırılar özellikle Nvidia’nın Ampere neslini hedef alsa da, Rowhammer’ın GDDR belleği üzerindeki temel prensibi, benzer GDDR uygulamalarına sahip eski nesillerin de duyarlı olabileceğini gösteriyor. Nvidia’nın ürün yelpazesi genelindeki zafiyetin boyutunu doğrulamak için daha fazla araştırma yapılması gerekecektir.
GPU’larda Rowhammer İçin Ne Yapılabilir?
GPU’larda Rowhammer için azaltma stratejileri hala geliştiriliyor, ancak genel olarak savunmasız donanım özelliklerinin devre dışı bırakılmasını, daha sıkı bellek erişim kontrollerinin uygulanmasını ve potansiyel olarak standart ECC’den daha güçlü donanım düzeyinde hata algılama ve düzeltme mekanizmalarının kullanılmasını içeriyor. Yazılım yamaları, zafiyeti tetikleyebilecek işlem türlerini sınırlayarak bir miktar koruma sağlayabilir.
Tam Sistem Ele Geçirme Ne Kadar Ciddi?
Tam sistem ele geçirme, bir saldırganın makine üzerinde yönetici ayrıcalıkları (root erişimi) kazandığı anlamına gelir. Kötü amaçlı yazılım yükleyebilir, sistemde depolanan herhangi bir veriyi çalabilir, makineyi kötü niyetli amaçlar için kullanabilir (kripto madenciliği veya botnetler gibi) veya ağdaki diğer sistemlere geçiş yapabilir. Herhangi bir bilgisayar sistemi için en kötü senaryodur.