Question 1

What is a decision tree?

Accepted Answer

A simple predictive model that splits data based on feature questions, forming a tree where each internal node tests a feature, branches by outcome, and leaves give a prediction.

Question 2

How does a decision tree decide where to split data?

Accepted Answer

Splits aim to reduce impurity and increase separation of outcomes. Common criteria include Gini impurity and entropy (information gain) for classification, or variance reduction for regression.

Question 3

What is pruning and why is it useful?

Accepted Answer

Pruning removes branches that don’t improve predictive power, reducing overfitting and making the model simpler and more generalizable. Methods include cost-complexity pruning and reduced-error pruning.

Question 4

What is the difference between classification and regression trees?

Accepted Answer

Classification trees predict discrete categories; regression trees predict continuous numeric values. They use similar split rules, but leaves store class labels versus numeric estimates.

Decision Trees

Decision Trees

💡 Key Takeaways

❓ Frequently Asked Questions