Question 1

What is bias in training data?

Accepted Answer

Bias in training data refers to prejudiced or unbalanced representations in the data used to train a model, which can cause the model to learn unfair patterns or stereotypes.

Question 2

Why is fairness important in machine learning?

Accepted Answer

Fairness aims to ensure model outcomes are equitable across different groups and do not discriminate based on sensitive attributes like race, gender, or age.

Question 3

How can bias enter training data?

Accepted Answer

Bias can enter through sampling and historical biases, labeling errors, missing or underrepresented groups, and using proxies for protected attributes.

Question 4

What strategies help mitigate bias?

Accepted Answer

Use diverse and representative data, apply fairness metrics, reweight or resample data, debias features, audit models, and involve diverse teams in evaluation.

Bias and fairness in training data+50

Bias and fairness in training data
+50

💡 Key Takeaways

❓ Frequently Asked Questions