Gürültünün İçindeki Saklı Gerçek: Yapay Zeka Eğitiminde Diferansiyel Gizlilik

Yapay zeka modelleri, gelişimleri için ihtiyaç duydukları devasa veri setlerini işlerken bazen bireylere ait spesifik detayları “ezberleme” eğilimi gösterirler. Bu durum, saldırganların model çıktılarını analiz ederek eğitim verisindeki mahrem bilgilere ulaştığı Model İnversiyonu saldırılarına kapı aralar. Diferansiyel Gizlilik (DP), bu riski ortadan kaldırmak için verilere kontrollü bir “matematiksel gürültü” (noise) enjekte ederek bireyin verideki varlığını gizleyen ileri düzey bir mahremiyet teknolojisidir.Diferansiyel gizliliğin temelinde, bir bireyin veri setine eklenmesinin veya çıkarılmasının model sonucunu değiştirmemesi yatar. Bu süreçte kullanılan Epsilon ($\epsilon$) değeri, yani “Gizlilik Bütçesi”, sistemin ne kadar gürültülü (gizli) veya ne kadar keskin (doğru) olacağını belirleyen kritik bir ayardır. Düşük Epsilon mahremiyeti zirveye taşırken, yüksek Epsilon modelin doğruluğunu artırır ancak siber saldırılara karşı sis perdesini inceltir.