Implante Instantaneamente IA Generativa com NVIDIA NIM

Explore os modelos de IA mais recentes criados pela comunidade com uma API otimizada e acelerada pela NVIDIA e, em seguida, implante em qualquer lugar com os microsserviços de inferência NVIDIA NIM™.

Experimente Agora Assista ao Vídeo

Experimente Agora

Experimente Agora os Principais Modelos Abertos

Veja Mais

Integrações

A IA Acelerada Está Apenas a Uma API de Distância

Comece a trabalhar rapidamente com APIs conhecidas.

Compatibilidade Perfeita com Bibliotecas Populares

Aproveite as APIs NVIDIA dos seus SDKs existentes com apenas três linhas de código.

   import openai
  
   client = openai.OpenAI(
  
   base_url = "https://integrate.api.nvidia.com/v1",
  
   api_key="YOUR_NVIDIA_API_KEY"
  
   )
  
   chat_completion = client.chat.completions.create(
  
   model="mistralai/mixtral-8x7b-instruct-v0.1",
  
   messages=[{"role" : "user" , "content" : "Write me a love song" }],
  
   temperature=0.7
  
   )

Construa com as Ferramentas Que Você Adora

Trabalhe com seus frameworks favoritos de programação LLM, incluindo LangChain e LlamaIndex, e implante facilmente suas aplicações.

Saiba Mais Sobre Como Criar com NVIDIA NIM

Execute em Qualquer Lugar

Acelere sua Implantação de IA com NVIDIA NIM

Parte do NVIDIA AI Enterprise, o NVIDIA NIM é um conjunto de microsserviços fáceis de usar para acelerar a implantação de modelos básicos em qualquer nuvem ou data center e ajuda a manter seus dados seguros.

Accelerate Your AI Deployment With NVIDIA NIM

Saiba Mais Sobre NVIDIA NIM

Veja Como Implantar o NIM em Cinco Minutos

Implante o NIM

Implante o NIM para seu modelo com um único comando. Você também pode executar facilmente o NIM com modelos otimizados.

Execute a Inferência

Coloque o NIM em funcionamento com o mecanismo de tempo de execução ideal com base na sua infraestrutura acelerada pela NVIDIA.

Crie

Os desenvolvedores podem integrar endpoints NIM auto-hospedados em apenas algumas linhas de código.

Deploy

Run

Build

docker run nvcr.io/nim/publisher_name/model_name

 
 curl -X 'POST' \ 
  'http://0.0.0.0:8000/v1/completions' \ 
  -H 'accept: application/json' \ 
  -H 'Content-Type: application/json' \ 
  -d '{ 
  "model" : "model_name", 
  "prompt" : "Once upon a time", 
  "max_tokens" : 64 
 }' 

 
 import openai 
 client = openai.OpenAI( 
  base_url = "YOUR_LOCAL_ENDPOINT_URL", 
  api_key="YOUR_LOCAL_API_KEY" 
 ) 
 chat_completion = client.chat.completions.create( 
  model="model_name", 
  messages=[{"role" : "user" , "content" : "Write me a love song" }], 
  temperature=0.7 
 ) 

Inicie Localmente ou Dimensione com o Kubernetes

Implante perfeitamente microsserviços de IA em contêineres em qualquer infraestrutura acelerada da NVIDIA, desde um único dispositivo até a escala do data center.

Implante com Segurança e Confiança

Conte com tempos de execução de nível de produção, incluindo atualizações de segurança contínuas, e execute suas aplicações de negócios com APIs estáveis apoiadas por suporte de nível empresarial.

Redução de Custos e de Sua Pegada de Carbono

Reduza o custo operacional de execução de modelos em produção com tempos de execução de IA que são continuamente otimizados para baixa latência e alto rendimento na infraestrutura acelerada pela NVIDIA.

Taxa de Transferência

O NVIDIA NIM fornece taxa de transferência e latência otimizadas prontas para uso para maximizar a geração de tokens, oferecer suporte a usuários simultâneos em horários de pico e melhorar a capacidade de resposta.

Configuração: Llama 3-70b-instruct, comprimento do token de entrada: 7.000, comprimento do token de saída: 1.000. Solicitações de clientes simultâneas: 100, em 4 x H100 SXM NVLink. NIM OFF: FP16, TTFT: ~120s, ITL: ~180ms; NIM ON: FP8, TTFT: ~4,5s, ITL: ~70ms.

Veja os NVIDIA NIMs em Ação

Fale com os Dados da Sua Cadeia de Suprimentos Usando NIM

Turbine a Entrega de Software com RAG Orientado a Eventos

Agentes da Área de Saúde de IA Generativa em Tempo Real e Sempre Disponíveis

Humanos Digitais Transformam Indústrias

Microsserviços de IA Generativa para Triagem Virtual

Comece Agora

Comece a Prototipar Gratuitamente

Comece com APIs sem servidor fáceis de usar e gerenciadas pela NVIDIA.

Acesse a infraestrutura de IA totalmente acelerada.
Garanta que seus dados não sejam usados para treinamento de modelos.
Comece gratuitamente com 1.000 créditos de inferência.

Faça o Download e Implante

Execute o NVIDIA NIM para dimensionar modelos de IA otimizados na nuvem ou no data center de sua escolha.

Garanta que os dados nunca saiam do seu enclave seguro.
Transição perfeita de endpoints de nuvem para APIs auto-hospedadas sem alterações de código.
Use uma licença NVIDIA AI Enterprise para produção ou comece gratuitamente com o Programa de Desenvolvedores da NVIDIA.

Construa Agora

Casos de Uso

Impulsione Sua Inovação

Veja como as APIs da NVIDIA oferecem suporte a casos de uso do setor e impulsione seu desenvolvimento de IA com exemplos selecionados.

Humanos Digitais

Dê vida aos personagens do game ou crie avatares virtuais interativos para aprimorar o atendimento ao cliente, capacitando sua aplicação para se conectar mais profundamente com os usuários.

Saiba Mais

Geração de Conteúdo

Gere conteúdo altamente relevante, personalizado e preciso, baseado na experiência de domínio e na propriedade intelectual de sua empresa.

Saiba Mais

Geração Biomolecular

Os modelos generativos biomoleculares e o poder computacional das GPUs exploram eficientemente o espaço químico, gerando rapidamente diversos conjuntos de pequenas moléculas adaptadas a alvos ou propriedades específicas de medicamentos.

Saiba Mais

Ecossistema

Leve Sua IA Empresarial Mais Longe e Mais Rápido

Desenvolva suas aplicações de IA com modelos, kits de ferramentas, bancos de dados vetoriais,
frameworks e infraestrutura com nossos principais parceiros.

Recursos

Desbloqueie, Melhore e Aprimore

NVIDIA LaunchPad

Desbloqueie a IA com um Laboratório Prático

Experimente soluções de IA de ponta a ponta por meio de laboratórios práticos guiados para frameworks de desenvolvimento, chatbots baseados em geração aumentada por recuperação (RAG), otimizações de rota e muito mais.

Ir para LaunchPad

Programa de Desenvolvedores NVIDIA

Acelere Suas Aplicações de IA

Obtenha acesso gratuito ao NIM para desenvolvimento, pesquisa e teste de aplicações, além de recursos de aprendizado técnico por meio do Programa de Desenvolvedor NVIDIA.

Comece a Criar

AI Workbench

Comece Pequeno. Execute Grande.

O NVIDIA AI Workbench oferece aos desenvolvedores a flexibilidade de executar modelos habilitados para API em contêineres locais ou remotos com GPU, permitindo workflows de projetos interativos, desde a experimentação até a prototipagem e a prova de conceito.

Saiba Mais Sobre o AI Workbench

Notícias

Explore o NVIDIA NIM nas Notícias

Confira os últimos comunicados à imprensa da NVIDIA para ver como NIM e IA generativa estão impactando indústrias, parceiros, clientes e muito mais.

Veja Mais

Documentação

Explore a documentação técnica para começar a prototipar e criar suas aplicações corporativas de IA com APIs NVIDIA ou dimensione em sua própria infraestrutura com o NVIDIA NIM.

Documentos da API da NVIDIA Documentos NVIDIA NIM