Pipeline de implantação de inferência
Pacotes disponíveis

Três níveis de maturidade operacional para inferência

Do primeiro serviço de inferência à padronização em toda a organização — cada pacote cobre um estágio distinto com templates, documentação e suporte adequados.

← Voltar ao Início
Nossa abordagem

Como estruturamos o processo de deploy

01. Empacotamento

Converter o modelo treinado em um artefato servível com dependências fixadas e configuração de runtime declarada.

02. Configuração

Ajustar os parâmetros de serving — batching, concorrência, memória — de acordo com os requisitos de latência e throughput.

03. Deploy

Subir o serviço com rollout controlado, health check configurado e critério de rollback definido antes de qualquer tráfego real.

04. Monitoramento

Acompanhar latência, utilização de GPU, taxa de erro e versão ativa — com alertas configurados e visibilidade por endpoint.

Pacote 01

Deployment Starter Toolkit

R$ 610 / licença anual — equipe pequena

Um conjunto de templates, guias e configurações de referência para equipes que estão colocando seu primeiro serviço de inferência em hardware Nvidia. O foco é reduzir o tempo gasto em tentativa e erro na fase inicial de configuração, com materiais que cobrem os cenários mais frequentes de forma direta.

  • Templates de empacotamento para TensorRT e ONNX Runtime
  • Configurações de referência para Triton Inference Server
  • Guia de primeiros passos de monitoramento com métricas essenciais
  • Suporte por e-mail incluso durante a licença
  • Atualizações dos materiais sem custo adicional

Processo de uso

1 Receber acesso ao repositório de materiais
2 Seguir o guia de empacotamento para o seu modelo
3 Aplicar configuração de referência ao seu ambiente
4 Subir o serviço com o checklist de deploy incluso
Solicitar Informações
Deployment Starter Toolkit

Melhor para

Equipes pequenas (1–5 engenheiros) que estão fazendo o primeiro deploy de inferência em GPU e precisam de um ponto de partida estruturado, sem depender de consultoria externa.

Pacote 02

Inference Operations Suite

R$ 2.700 / licença anual — equipe de engenharia

Suite de ferramentas voltada a equipes que já têm modelos rodando em produção e precisam de visibilidade operacional consistente. Inclui dashboards de monitoramento pré-configurados, ferramentas de versionamento de modelos e suporte a rollouts controlados para minimizar risco em atualizações.

  • Dashboards de latência, throughput e uso de GPU por endpoint
  • Versionamento de modelos com histórico de métricas por versão
  • Ferramentas de rollout com critério de promoção e rollback
  • Integração com Prometheus e Grafana documentada
  • Onboarding técnico e suporte incluso

Processo de uso

1 Onboarding técnico com a equipe Mírion
2 Instalar as ferramentas no ambiente de produção
3 Configurar dashboards para os serviços ativos
4 Definir política de rollout e versioning para novos modelos
Solicitar Informações
Inference Operations Suite

Melhor para

Equipes que operam entre 3 e 15 modelos em produção e precisam de visibilidade padronizada sem montar uma solução de observabilidade do zero.

Pacote 03

Platform Deployment Package

R$ 5.350 / licença anual — organização

Pacote abrangente para organizações que precisam padronizar a operação de inferência em múltiplos times e serviços internos. Inclui templates configuráveis por contexto de serviço, integrações com pipelines de CI/CD existentes e suporte prioritário dedicado a equipes de plataforma.

  • Templates configuráveis com parâmetros por perfil de serviço
  • Integração com pipelines de CI/CD (GitHub Actions, GitLab CI)
  • Suporte prioritário com SLA de resposta definido
  • Documentação de padronização para múltiplas equipes internas
  • Licença organizacional — sem limite de equipes internas

Processo de uso

1 Reunião de escopo com equipe de plataforma
2 Mapear perfis de serviço e adaptar templates base
3 Integrar ao pipeline CI/CD e validar com piloto
4 Rollout para demais times com documentação de adoção
Solicitar Informações
Platform Deployment Package

Melhor para

Organizações com múltiplas equipes de produto que usam modelos de inferência e precisam de padrões compartilhados sem que cada time recomece do zero.

Comparativo

Qual pacote se encaixa no seu cenário?

Recurso Starter
R$ 610
Operations
R$ 2.700
Platform
R$ 5.350
Templates de empacotamento
Guias de configuração de serving
Dashboards de monitoramento básico
Versionamento de modelos
Ferramentas de rollout controlado
Templates configuráveis por serviço
Integração com CI/CD
Suporte por e-mail
Suporte prioritário com SLA
Padrões técnicos

O que é comum a todos os pacotes

Sem telemetria remota

Nenhum dado de produção sai da infraestrutura do cliente. Todos os materiais funcionam sem dependência de serviços externos da Mírion.

Validação em ambiente real

Cada template é validado em hardware Nvidia antes de ser incluído nos pacotes. Casos com comportamento inesperado são documentados, não omitidos.

Documentação com raciocínio

Os arquivos incluem comentários que explicam cada escolha de parâmetro, não apenas instruções de uso — facilitando adaptações ao ambiente do cliente.

Atualizações incluídas

Durante o período de licença, atualizações dos templates e guias estão incluídas sem custo extra — alinhadas a mudanças relevantes no ecossistema Nvidia.

Licença com termos claros

Cada pacote vem com licença legível que define o escopo de uso — sem cláusulas que expandam obrigações após a contratação.

Suporte técnico direto

O suporte é respondido pelos engenheiros que criaram os materiais — com contexto suficiente para ajudar em casos que a documentação não cobriu diretamente.

Preços

Licenças anuais com tudo incluso

Starter

R$ 610

por ano — equipe pequena

  • Templates de empacotamento
  • Guias de configuração
  • Monitoramento básico
  • Suporte por e-mail
  • Atualizações incluídas
Solicitar
Popular

Operations

R$ 2.700

por ano — equipe de engenharia

  • Tudo do Starter
  • Dashboards de monitoramento
  • Versionamento de modelos
  • Ferramentas de rollout
  • Onboarding técnico
Solicitar

Platform

R$ 5.350

por ano — organização

  • Tudo do Operations
  • Templates configuráveis
  • Integração com CI/CD
  • Suporte prioritário
  • Licença organizacional
Solicitar

Ainda tem dúvidas sobre qual pacote escolher?

Entre em contato descrevendo brevemente o tamanho da equipe e quantos modelos estão em produção. Respondemos com uma recomendação objetiva.

Fale com Nossa Equipe