Question 1

What is bias in LLMs?

Accepted Answer

Bias in large language models is a systematic prejudice in outputs that favors or disadvantages certain groups, often arising from training data, representations, or evaluation methods.

Question 2

What is fairness evaluation in LLMs?

Accepted Answer

Fairness evaluation checks whether a model's outputs are equitable across different demographic groups, using predefined metrics and tests to detect and measure disparities.

Question 3

What are common fairness metrics used in LLM evaluation?

Accepted Answer

Demographic parity (equal positive rate across groups), Equalized odds (equal false positive and false negative rates), and calibration (predicted likelihoods match actual outcomes).

Question 4

How can bias in LLMs be mitigated?

Accepted Answer

Mitigation includes data balancing and curation, fairness-aware training, prompting strategies, and post-processing or auditing with diverse evaluation datasets.

Bias & Fairness Evaluation in LLMs+50

Bias & Fairness Evaluation in LLMs
+50

💡 Key Takeaways

❓ Frequently Asked Questions