Pacotes disponíveis

Três níveis de maturidade operacional para inferência

Do primeiro serviço de inferência à padronização em toda a organização — cada pacote cobre um estágio distinto com templates, documentação e suporte adequados.

← Voltar ao Início

Nossa abordagem

Como estruturamos o processo de deploy

01. Empacotamento

Converter o modelo treinado em um artefato servível com dependências fixadas e configuração de runtime declarada.

→

02. Configuração

Ajustar os parâmetros de serving — batching, concorrência, memória — de acordo com os requisitos de latência e throughput.

→

03. Deploy

Subir o serviço com rollout controlado, health check configurado e critério de rollback definido antes de qualquer tráfego real.

→

04. Monitoramento

Acompanhar latência, utilização de GPU, taxa de erro e versão ativa — com alertas configurados e visibilidade por endpoint.

Pacote 01

Deployment Starter Toolkit

R$ 610 / licença anual — equipe pequena

Um conjunto de templates, guias e configurações de referência para equipes que estão colocando seu primeiro serviço de inferência em hardware Nvidia. O foco é reduzir o tempo gasto em tentativa e erro na fase inicial de configuração, com materiais que cobrem os cenários mais frequentes de forma direta.

Templates de empacotamento para TensorRT e ONNX Runtime
Configurações de referência para Triton Inference Server
Guia de primeiros passos de monitoramento com métricas essenciais
Suporte por e-mail incluso durante a licença
Atualizações dos materiais sem custo adicional

Processo de uso

1 Receber acesso ao repositório de materiais

2 Seguir o guia de empacotamento para o seu modelo

3 Aplicar configuração de referência ao seu ambiente

4 Subir o serviço com o checklist de deploy incluso

Solicitar Informações

Melhor para

Equipes pequenas (1–5 engenheiros) que estão fazendo o primeiro deploy de inferência em GPU e precisam de um ponto de partida estruturado, sem depender de consultoria externa.

Pacote 02

Inference Operations Suite

R$ 2.700 / licença anual — equipe de engenharia

Suite de ferramentas voltada a equipes que já têm modelos rodando em produção e precisam de visibilidade operacional consistente. Inclui dashboards de monitoramento pré-configurados, ferramentas de versionamento de modelos e suporte a rollouts controlados para minimizar risco em atualizações.

Dashboards de latência, throughput e uso de GPU por endpoint
Versionamento de modelos com histórico de métricas por versão
Ferramentas de rollout com critério de promoção e rollback
Integração com Prometheus e Grafana documentada
Onboarding técnico e suporte incluso

Processo de uso

1 Onboarding técnico com a equipe Mírion

2 Instalar as ferramentas no ambiente de produção

3 Configurar dashboards para os serviços ativos

4 Definir política de rollout e versioning para novos modelos

Solicitar Informações

Melhor para

Equipes que operam entre 3 e 15 modelos em produção e precisam de visibilidade padronizada sem montar uma solução de observabilidade do zero.

Pacote 03

Platform Deployment Package

R$ 5.350 / licença anual — organização

Pacote abrangente para organizações que precisam padronizar a operação de inferência em múltiplos times e serviços internos. Inclui templates configuráveis por contexto de serviço, integrações com pipelines de CI/CD existentes e suporte prioritário dedicado a equipes de plataforma.

Templates configuráveis com parâmetros por perfil de serviço
Integração com pipelines de CI/CD (GitHub Actions, GitLab CI)
Suporte prioritário com SLA de resposta definido
Documentação de padronização para múltiplas equipes internas
Licença organizacional — sem limite de equipes internas

Processo de uso

1 Reunião de escopo com equipe de plataforma

2 Mapear perfis de serviço e adaptar templates base

3 Integrar ao pipeline CI/CD e validar com piloto

4 Rollout para demais times com documentação de adoção

Solicitar Informações

Melhor para

Organizações com múltiplas equipes de produto que usam modelos de inferência e precisam de padrões compartilhados sem que cada time recomece do zero.

Comparativo

Qual pacote se encaixa no seu cenário?

Recurso	Starter R$ 610	Operations R$ 2.700	Platform R$ 5.350
Templates de empacotamento
Guias de configuração de serving
Dashboards de monitoramento	básico
Versionamento de modelos
Ferramentas de rollout controlado
Templates configuráveis por serviço
Integração com CI/CD
Suporte por e-mail
Suporte prioritário com SLA

Padrões técnicos

O que é comum a todos os pacotes

Sem telemetria remota

Nenhum dado de produção sai da infraestrutura do cliente. Todos os materiais funcionam sem dependência de serviços externos da Mírion.

Validação em ambiente real

Cada template é validado em hardware Nvidia antes de ser incluído nos pacotes. Casos com comportamento inesperado são documentados, não omitidos.

Documentação com raciocínio

Os arquivos incluem comentários que explicam cada escolha de parâmetro, não apenas instruções de uso — facilitando adaptações ao ambiente do cliente.

Atualizações incluídas

Durante o período de licença, atualizações dos templates e guias estão incluídas sem custo extra — alinhadas a mudanças relevantes no ecossistema Nvidia.

Licença com termos claros

Cada pacote vem com licença legível que define o escopo de uso — sem cláusulas que expandam obrigações após a contratação.

Suporte técnico direto

O suporte é respondido pelos engenheiros que criaram os materiais — com contexto suficiente para ajudar em casos que a documentação não cobriu diretamente.

Preços

Licenças anuais com tudo incluso

Starter

R$ 610

por ano — equipe pequena

Templates de empacotamento
Guias de configuração
Monitoramento básico
Suporte por e-mail
Atualizações incluídas

Solicitar

Popular

Operations

R$ 2.700

por ano — equipe de engenharia

Tudo do Starter
Dashboards de monitoramento
Versionamento de modelos
Ferramentas de rollout
Onboarding técnico

Solicitar

Platform

R$ 5.350

por ano — organização

Tudo do Operations
Templates configuráveis
Integração com CI/CD
Suporte prioritário
Licença organizacional

Solicitar

Ainda tem dúvidas sobre qual pacote escolher?

Entre em contato descrevendo brevemente o tamanho da equipe e quantos modelos estão em produção. Respondemos com uma recomendação objetiva.

Fale com Nossa Equipe