prompt-testing-evaluation
プロンプトのテスト、評価、反復改善を専門とするスキル。A/Bテスト、評価メトリクス、自動化されたプロンプト品質保証により、本番環境で信頼性の高いプロンプトを実現します。Anchors:• Test-Driven Development: By Example (Kent Beck) / 適用: Red-Green-Refactorサイクル / 目的: 反復的な品質改善• LLM-as-a-Judg
Also installable via skills CLI
npx skills add daishiman/AIWorkflowOrchestrator/docs/99-claude/skills/prompt-testing-evaluation