catch targeted attacks

mathsinn · mathsinn · commit eac78e3f05b8 · 2018-10-01T12:47:54.000+01:00
diff --git a/art/defences/adversarial_trainer.py b/art/defences/adversarial_trainer.py
@@ -64,8 +64,13 @@ def fit(self, x, y, batch_size=128, nb_epochs=20):
         # Precompute adversarial samples for transferred attacks
         self._precomputed_adv_samples = []
         for attack in self.attacks:
+            if 'targeted' in attack.attack_params:
+                if attack.targeted:                       
+                    raise NotImplementedError("Adversarial training with targeted attacks is \
+                                               currently not implemented")
+                                               
             if attack.classifier != self.classifier:
-                self._precomputed_adv_samples.append(attack.generate(x))
+                self._precomputed_adv_samples.append(attack.generate(x, y=y))
             else:
                 self._precomputed_adv_samples.append(None)
 
@@ -84,7 +89,7 @@ def fit(self, x, y, batch_size=128, nb_epochs=20):
 
                 # If source and target models are the same, craft fresh adversarial samples
                 if attack.classifier == self.classifier:
-                    x_batch[adv_ids] = attack.generate(x_batch[adv_ids])
+                    x_batch[adv_ids] = attack.generate(x_batch[adv_ids], y=y_batch[adv_ids])
 
                 # Otherwise, use precomputed adversarial samples
                 else:
@@ -137,8 +142,13 @@ def fit(self, x, y, **kwargs):
 
         # Generate adversarial samples for each attack
         for attack in self.attacks:
+            if 'targeted' in attack.attack_params:
+                if attack.targeted:                       
+                    raise NotImplementedError("Adversarial training with targeted attacks is \
+                                               currently not implemented")
+                                               
             # Predict new labels for the adversarial samples generated
-            x_adv = attack.generate(x)
+            x_adv = attack.generate(x, y=y)
             y_pred = np.argmax(attack.classifier.predict(x_adv), axis=1)
             selected = np.array(labels != y_pred)
 
diff --git a/art/defences/adversarial_trainer_unittest.py b/art/defences/adversarial_trainer_unittest.py
@@ -165,6 +165,24 @@ def test_two_attacks(self):
 
         print('\nAccuracy before adversarial training: %.2f%%' % (acc * 100))
         print('\nAccuracy after adversarial training: %.2f%%' % (acc_new * 100))
+        
+    
+    def test_targeted_attack_error(self):
+        """
+        Test the adversarial trainer using a targeted attack, which will currently result in a
+        NotImplementError.
+
+        :return: None
+        """
+        
+        (x_train, y_train), (x_test, y_test) = self.mnist
+        params = {'nb_epochs': 2, 'batch_size': BATCH_SIZE}
+
+        classifier = self.classifier_k
+        adv = FastGradientMethod(classifier, targeted=True)
+        adv_trainer = AdversarialTrainer(classifier, attacks=adv)
+        self.assertRaises(NotImplementedError, adv_trainer.fit, x_train, y_train, **params)
+
 
 
 class TestStaticAdversarialTrainer(TestBase):
@@ -266,6 +284,21 @@ def test_shared_model_mnist(self):
         print('\nAccuracy before adversarial training: %.2f%%' % (acc * 100))
         print('\nAccuracy after adversarial training: %.2f%%' % (acc_adv_trained * 100))
 
+    def test_targeted_attack_error(self):
+        """
+        Test the adversarial trainer using a targeted attack, which will currently result in a
+        NotImplementError.
+
+        :return: None
+        """
+        
+        (x_train, y_train), (x_test, y_test) = self.mnist
+        params = {'nb_epochs': 2, 'batch_size': BATCH_SIZE}
+
+        classifier = self.classifier_k
+        adv = FastGradientMethod(classifier, targeted=True)
+        adv_trainer = StaticAdversarialTrainer(classifier, attacks=adv)
+        self.assertRaises(NotImplementedError, adv_trainer.fit, x_train, y_train, **params)
 
 if __name__ == '__main__':
     unittest.main()