← Curriculum track ← Learn hub

Quanta GenAI Curriculum · Generative AI · Advanced

GenAI Advanced — 055: simulate degraded retrieval on `Evaluation harness depth` — memo `122857 [55]`

Lesson 055: Evaluation harness depth

Focus

Document interfaces between humans, retrieval, and policy engines. Token Evaluation harness depth:55 keeps neighbouring lessons differentiable.

Key ideas

Thread: Evaluation harness depth · drill v5 · spin 786664.
Habit: pair every model utterance with a trace_id you could paste into Grafana.
Guardrail: write one RACI bullet referencing this lesson tomorrow.

Deep dive notebook

Synthetic drill artefacts

Exec rollup capsule

Subject: Pilot P-55 checkpoint

- Intent accuracy Δ `0.75`
- Escalation Δ `0.041`
- Spend guardrail `$944/day`

Risk note: Throughput saturated

Decision due: CX-Research

Practice

Practice Draft three eval assertions QA must greenlight before launch. — 55 Bump literals mindset by 30.