Skip to Content

2.4 Kontrolní seznam kritérií úspěchu

Kontrolní seznam kritérií úspěchu

Měřte to, co je důležité pro kvalitu skillu

Dobře navržený Skill by měl splňovat tato kritéria, aby byl považován za produkčně připravený.

Klíčová kritéria kvality

Triggers on the right prompts — activates when the user needs it
Produces consistent output — same quality every time
Handles errors gracefully — does not crash on edge cases
Works on the first or second attempt — reliable enough for daily use

Měřitelné metriky

Kvantitativní metriky

Skill se spustí u 90 % relevantních dotazů (testujte s 10-20 variacemi). Dokončí workflow v X voláních nástrojů. 0 neúspěšných API volání na workflow.

Kvalitativní metriky

Uživatelé nemusí Claudovi říkat další kroky. Workflow se dokončí bez uživatelské korekce. Konzistentní výsledky napříč sezeními.

Testovací kontrolní seznam

Tested with at least 10 different prompt variations
Verified output format matches expectations
Tested with missing or incomplete inputs
Measured token consumption compared to manual approach
Confirmed skill does not trigger for unrelated prompts

Brána kvality

Nevydávejte Skill, dokud neprojde 5 po sobě jdoucích úspěšných běhů s různými vstupy. Tato minimální laťka zajišťuje základní spolehlivost.

Shrnutí sekce

Dobré plánování předchází špatným Skills. Čas investovaný do plánování se exponenciálně vyplatí při provádění. Definujte jasná kritéria úspěchu, než začnete stavět.

Jak poznat, že je Skill připraven — kvantitativní a kvalitativní metriky.

Hodnocení
0 0

Momentálně nejsou žádné komentáře.

být první, kdo zanechá komentář.