Question 1

What are side-channel risks in model inference?

Accepted Answer

Side-channel risks occur when attackers infer sensitive information from indirect signals, such as how long inference takes or patterns in produced tokens, rather than the direct outputs alone.

Question 2

What is a timing attack in this context?

Accepted Answer

A timing attack analyzes the time a model takes to process inputs to deduce hidden details about the inputs, model internals, or data, exploiting data-dependent timing variations.

Question 3

What is token leakage in generative AI?

Accepted Answer

Token leakage is when generated tokens or output patterns reveal private information from prompts, inputs, or training data, potentially exposing sensitive details to an observer.

Question 4

How can these inference-side risks be mitigated?

Accepted Answer

Mitigations include constant-time or data-independent inference, reducing data-dependent branches, adding noise, rate limiting and monitoring, prompt filtering, data minimization, differential privacy, secure enclaves, and strict access controls.

Side-channel risks in model inference (timing, token leakage)

Side-channel risks in model inference (timing, token leakage)

💡 Key Takeaways

❓ Frequently Asked Questions