Governança & Qualidade

O Helm aplica 10 regras de governança que todos os agentes devem seguir. Essas regras garantem consistência, qualidade e segurança em todo o pipeline.

As 10 Regras

1. Limites (Boundaries)

Todo agente tem uma missão definida, entradas, saídas e critérios de sucesso. Agentes operam dentro de sua posição no pipeline e não podem modificar artefatos de outros agentes. Requisições fora do escopo são roteadas pelo orquestrador.

2. Padrão (Bar)

Qualidade é medida contra critérios concretos, binários (passa/falha). Todo agente deve atingir ≥ 90% nos seus critérios de sucesso antes do handoff. Agentes QA (Review, Verify) requerem ≥ 95%. Loops de correção silenciosa: máximo 3 iterações antes de escalar ao usuário.

3. Revezamento (Relay)

Todo agente deve produzir um documento de handoff ao completar. Todo agente deve ler o handoff anterior ao ativar. Sem handoff = sem progresso.

4. Memória (Memory)

Todo estado é persistido para que o trabalho sobreviva reinícios. Estado da sessão fica em .helm/session.yaml, configuração do sistema em helm.yaml, handoffs em .helm/handoffs/. Decisões nunca se perdem entre sessões.

5. Guarda (Guard)

Nenhuma operação destrutiva sem confirmação explícita do usuário. Credenciais e segredos nunca são armazenados em arquivos do sistema. Scanning SAST é obrigatório antes do deploy. Vulnerabilidades críticas/altas bloqueiam o deploy.

6. Voz (Voice)

Agentes se comunicam exclusivamente através de handoffs e estado da sessão. Comunicação direta entre agentes não é permitida. Idiomas suportados: Inglês (en-US) e Português (pt-BR).

7. Modos (Modes)

Três modos controlam o que os agentes podem fazer:

ModoEstados do PipelineLeituraEscrita
Planejamentodiscover, planProjeto inteiroApenas .helm/
Construçãobuild, validateProjeto inteiroProjeto inteiro
DeploydeployProjeto inteiroProjeto inteiro + infra

8. Perfis (Profiles)

Três perfis controlam quanta confirmação é necessária:

PerfilComportamento
ExplorarSomente leitura. Agentes analisam e sugerem mas não fazem escritas.
GuiadoPadrão. Agentes propõem ações, usuário confirma antes das escritas.
AutônomoAgentes executam sem confirmação quando scores dos gates ≥ 95%.

Operações destrutivas, deploys em produção e transições retrógradas sempre requerem confirmação independente do perfil.

9. Conduta (Conduct)

Agentes lideram a conversa. Eles sabem sua missão pelo handoff e posição no pipeline. Agentes devem progredir proativamente em direção à conclusão e fazer perguntas específicas quando precisam de input — nunca "o que você quer que eu faça?"

10. Estrela Guia (North Star)

Limites de Qualidade

Tipo de AgenteScore Mínimo
Agentes padrão90%
Agentes QA (Review, Verify)95%

Scores dentro de 5 pontos abaixo do limite disparam uma revisão — confirmação humana é necessária mesmo no modo autônomo.

Auto-Validação

Todo agente valida sua própria saída antes do handoff. Critérios são específicos para cada agente (não checklists genéricas) e devem ser binários (passa/falha). Score = critérios atendidos / total de critérios.

Se um agente falha na validação após 3 loops de correção, ele escala para o usuário.