Question 1

What are adversarial examples?

Accepted Answer

Adversarial examples are inputs deliberately perturbed to cause a machine learning model to make incorrect predictions, often with changes that are subtle or imperceptible to humans.

Question 2

Why is adversarial robustness important in AI governance?

Accepted Answer

Robustness reduces risk from attacks, helping ensure reliable, safe decisions, and supports compliance with governance, safety, and regulatory requirements.

Question 3

How can robustness be improved in neural networks?

Accepted Answer

Common approaches include adversarial training (training with perturbed inputs), robust optimization, and input preprocessing, though there are trade-offs like increased training cost and potential impact on clean accuracy.

Question 4

How is robustness evaluated?

Accepted Answer

Robustness is assessed under defined threat models using adversarial attacks within a perturbation budget, measuring robust accuracy and comparing to clean accuracy across attacks and datasets.

Adversarial robustness basics

Adversarial robustness basics

💡 Key Takeaways

❓ Frequently Asked Questions