Question 1

What is data poisoning in machine learning?

Accepted Answer

Data poisoning is the manipulation of training data to degrade a model's performance or cause it to make specific mistakes, such as mislabeled samples or crafted inputs that mislead learning.

Question 2

What is a backdoor attack in ML, and how does it differ from general data poisoning?

Accepted Answer

A backdoor attack embeds a hidden trigger in training data or the model so inputs containing the trigger elicit a attacker-chosen output, while normal inputs behave correctly. It is a targeted, covert form of poisoning.

Question 3

How is the risk of data poisoning and backdoors evaluated in AI risk assessment?

Accepted Answer

Risk is evaluated by estimating likelihood (e.g., attacker access, data pipeline vulnerabilities) and impact (performance loss, safety, reliability). Methods include threat modeling, data provenance checks, scenario analysis, and risk scoring.

Question 4

What indicators might suggest data poisoning or backdoor risk in a system?

Accepted Answer

Indicators include sudden accuracy declines, unusual labeling patterns, data distribution shifts, abnormal model behavior on certain inputs or triggers, and evidence of compromised data provenance or update processes.

Data poisoning and backdoor risk evaluation

Data poisoning and backdoor risk evaluation

💡 Key Takeaways

❓ Frequently Asked Questions