Question 1

What is vector normalization and why is it useful?

Accepted Answer

Vector normalization rescales a vector to unit length (L2 norm = 1). It makes comparisons focus on direction rather than magnitude, which helps with similarity measures like cosine similarity.

Question 2

What is cosine similarity and how does normalization relate to it?

Accepted Answer

Cosine similarity measures how aligned two vectors are by their angle. If vectors are normalized to unit length, cosine similarity equals their dot product, ranging from -1 to 1.

Question 3

What are common distance metrics and when should you use them?

Accepted Answer

Common metrics include Euclidean (L2), Manhattan (L1), and cosine distance. Use Euclidean for straight-line proximity in continuous spaces, Manhattan for grid-like layouts or robustness to outliers, and cosine for comparing direction in high-dimensional data.

Question 4

How should you choose a metric for a quiz or machine learning task?

Accepted Answer

Consider data type (continuous, sparse, categorical), whether scale matters, and whether you care about magnitude or just orientation. Normalize features if needed and try a few metrics with validation to see what works best.

Vector Normalization, Similarity Metrics, and Distance Choices

Vector Normalization, Similarity Metrics, and Distance Choices

💡 Key Takeaways

❓ Frequently Asked Questions