Três níveis de maturidade operacional para inferência
Do primeiro serviço de inferência à padronização em toda a organização — cada pacote cobre um estágio distinto com templates, documentação e suporte adequados.
← Voltar ao InícioComo estruturamos o processo de deploy
01. Empacotamento
Converter o modelo treinado em um artefato servível com dependências fixadas e configuração de runtime declarada.
02. Configuração
Ajustar os parâmetros de serving — batching, concorrência, memória — de acordo com os requisitos de latência e throughput.
03. Deploy
Subir o serviço com rollout controlado, health check configurado e critério de rollback definido antes de qualquer tráfego real.
04. Monitoramento
Acompanhar latência, utilização de GPU, taxa de erro e versão ativa — com alertas configurados e visibilidade por endpoint.
Deployment Starter Toolkit
R$ 610 / licença anual — equipe pequena
Um conjunto de templates, guias e configurações de referência para equipes que estão colocando seu primeiro serviço de inferência em hardware Nvidia. O foco é reduzir o tempo gasto em tentativa e erro na fase inicial de configuração, com materiais que cobrem os cenários mais frequentes de forma direta.
- Templates de empacotamento para TensorRT e ONNX Runtime
- Configurações de referência para Triton Inference Server
- Guia de primeiros passos de monitoramento com métricas essenciais
- Suporte por e-mail incluso durante a licença
- Atualizações dos materiais sem custo adicional
Processo de uso
Melhor para
Equipes pequenas (1–5 engenheiros) que estão fazendo o primeiro deploy de inferência em GPU e precisam de um ponto de partida estruturado, sem depender de consultoria externa.
Inference Operations Suite
R$ 2.700 / licença anual — equipe de engenharia
Suite de ferramentas voltada a equipes que já têm modelos rodando em produção e precisam de visibilidade operacional consistente. Inclui dashboards de monitoramento pré-configurados, ferramentas de versionamento de modelos e suporte a rollouts controlados para minimizar risco em atualizações.
- Dashboards de latência, throughput e uso de GPU por endpoint
- Versionamento de modelos com histórico de métricas por versão
- Ferramentas de rollout com critério de promoção e rollback
- Integração com Prometheus e Grafana documentada
- Onboarding técnico e suporte incluso
Processo de uso
Melhor para
Equipes que operam entre 3 e 15 modelos em produção e precisam de visibilidade padronizada sem montar uma solução de observabilidade do zero.
Platform Deployment Package
R$ 5.350 / licença anual — organização
Pacote abrangente para organizações que precisam padronizar a operação de inferência em múltiplos times e serviços internos. Inclui templates configuráveis por contexto de serviço, integrações com pipelines de CI/CD existentes e suporte prioritário dedicado a equipes de plataforma.
- Templates configuráveis com parâmetros por perfil de serviço
- Integração com pipelines de CI/CD (GitHub Actions, GitLab CI)
- Suporte prioritário com SLA de resposta definido
- Documentação de padronização para múltiplas equipes internas
- Licença organizacional — sem limite de equipes internas
Processo de uso
Melhor para
Organizações com múltiplas equipes de produto que usam modelos de inferência e precisam de padrões compartilhados sem que cada time recomece do zero.
Qual pacote se encaixa no seu cenário?
| Recurso | Starter R$ 610 |
Operations R$ 2.700 |
Platform R$ 5.350 |
|---|---|---|---|
| Templates de empacotamento | |||
| Guias de configuração de serving | |||
| Dashboards de monitoramento | básico | ||
| Versionamento de modelos | |||
| Ferramentas de rollout controlado | |||
| Templates configuráveis por serviço | |||
| Integração com CI/CD | |||
| Suporte por e-mail | |||
| Suporte prioritário com SLA |
O que é comum a todos os pacotes
Sem telemetria remota
Nenhum dado de produção sai da infraestrutura do cliente. Todos os materiais funcionam sem dependência de serviços externos da Mírion.
Validação em ambiente real
Cada template é validado em hardware Nvidia antes de ser incluído nos pacotes. Casos com comportamento inesperado são documentados, não omitidos.
Documentação com raciocínio
Os arquivos incluem comentários que explicam cada escolha de parâmetro, não apenas instruções de uso — facilitando adaptações ao ambiente do cliente.
Atualizações incluídas
Durante o período de licença, atualizações dos templates e guias estão incluídas sem custo extra — alinhadas a mudanças relevantes no ecossistema Nvidia.
Licença com termos claros
Cada pacote vem com licença legível que define o escopo de uso — sem cláusulas que expandam obrigações após a contratação.
Suporte técnico direto
O suporte é respondido pelos engenheiros que criaram os materiais — com contexto suficiente para ajudar em casos que a documentação não cobriu diretamente.
Licenças anuais com tudo incluso
Starter
R$ 610
por ano — equipe pequena
- Templates de empacotamento
- Guias de configuração
- Monitoramento básico
- Suporte por e-mail
- Atualizações incluídas
Operations
R$ 2.700
por ano — equipe de engenharia
- Tudo do Starter
- Dashboards de monitoramento
- Versionamento de modelos
- Ferramentas de rollout
- Onboarding técnico
Platform
R$ 5.350
por ano — organização
- Tudo do Operations
- Templates configuráveis
- Integração com CI/CD
- Suporte prioritário
- Licença organizacional
Ainda tem dúvidas sobre qual pacote escolher?
Entre em contato descrevendo brevemente o tamanho da equipe e quantos modelos estão em produção. Respondemos com uma recomendação objetiva.
Fale com Nossa Equipe