Governança & Qualidade
O Helm aplica 10 regras de governança que todos os agentes devem seguir. Essas regras garantem consistência, qualidade e segurança em todo o pipeline.
As 10 Regras
1. Limites (Boundaries)
Todo agente tem uma missão definida, entradas, saídas e critérios de sucesso. Agentes operam dentro de sua posição no pipeline e não podem modificar artefatos de outros agentes. Requisições fora do escopo são roteadas pelo orquestrador.
2. Padrão (Bar)
Qualidade é medida contra critérios concretos, binários (passa/falha). Todo agente deve atingir ≥ 90% nos seus critérios de sucesso antes do handoff. Agentes QA (Review, Verify) requerem ≥ 95%. Loops de correção silenciosa: máximo 3 iterações antes de escalar ao usuário.
3. Revezamento (Relay)
Todo agente deve produzir um documento de handoff ao completar. Todo agente deve ler o handoff anterior ao ativar. Sem handoff = sem progresso.
4. Memória (Memory)
Todo estado é persistido para que o trabalho sobreviva reinícios. Estado da sessão fica em .helm/session.yaml, configuração do sistema em helm.yaml, handoffs em .helm/handoffs/. Decisões nunca se perdem entre sessões.
5. Guarda (Guard)
Nenhuma operação destrutiva sem confirmação explícita do usuário. Credenciais e segredos nunca são armazenados em arquivos do sistema. Scanning SAST é obrigatório antes do deploy. Vulnerabilidades críticas/altas bloqueiam o deploy.
6. Voz (Voice)
Agentes se comunicam exclusivamente através de handoffs e estado da sessão. Comunicação direta entre agentes não é permitida. Idiomas suportados: Inglês (en-US) e Português (pt-BR).
7. Modos (Modes)
Três modos controlam o que os agentes podem fazer:
| Modo | Estados do Pipeline | Leitura | Escrita |
|---|---|---|---|
| Planejamento | discover, plan | Projeto inteiro | Apenas .helm/ |
| Construção | build, validate | Projeto inteiro | Projeto inteiro |
| Deploy | deploy | Projeto inteiro | Projeto inteiro + infra |
8. Perfis (Profiles)
Três perfis controlam quanta confirmação é necessária:
| Perfil | Comportamento |
|---|---|
| Explorar | Somente leitura. Agentes analisam e sugerem mas não fazem escritas. |
| Guiado | Padrão. Agentes propõem ações, usuário confirma antes das escritas. |
| Autônomo | Agentes executam sem confirmação quando scores dos gates ≥ 95%. |
Operações destrutivas, deploys em produção e transições retrógradas sempre requerem confirmação independente do perfil.
9. Conduta (Conduct)
Agentes lideram a conversa. Eles sabem sua missão pelo handoff e posição no pipeline. Agentes devem progredir proativamente em direção à conclusão e fazer perguntas específicas quando precisam de input — nunca "o que você quer que eu faça?"
10. Estrela Guia (North Star)
- Pesquisa antes de código — Nunca construir sem entender o problema
- Iterações curtas — Entregar em incrementos pequenos e verificáveis
- Produto acima de processo — Foco em resultados, não em cerimônia
- Sem over-engineering — Construir apenas para requisitos atuais
Limites de Qualidade
| Tipo de Agente | Score Mínimo |
|---|---|
| Agentes padrão | 90% |
| Agentes QA (Review, Verify) | 95% |
Scores dentro de 5 pontos abaixo do limite disparam uma revisão — confirmação humana é necessária mesmo no modo autônomo.
Auto-Validação
Todo agente valida sua própria saída antes do handoff. Critérios são específicos para cada agente (não checklists genéricas) e devem ser binários (passa/falha). Score = critérios atendidos / total de critérios.
Se um agente falha na validação após 3 loops de correção, ele escala para o usuário.