Nothing Special   »   [go: up one dir, main page]

This site requires Javascript in order to view all its content. Please enable Javascript in order to access all the functionality of this web site. Here are the instructions how to enable JavaScript in your web browser.

Implante Instantaneamente IA Generativa com NVIDIA NIM

Explore os modelos de IA mais recentes criados pela comunidade com uma API otimizada e acelerada pela NVIDIA e, em seguida, implante em qualquer lugar com os microsserviços de inferência NVIDIA NIM™.

Experimente Agora os Principais Modelos Abertos


Integrações

A IA Acelerada Está Apenas a Uma API de Distância

Comece a trabalhar rapidamente com APIs conhecidas.

Compatibilidade Perfeita com Bibliotecas Populares

Aproveite as APIs NVIDIA dos seus SDKs existentes com apenas três linhas de código.

import openai
client = openai.OpenAI(
base_url = "https://integrate.api.nvidia.com/v1",
api_key="YOUR_NVIDIA_API_KEY"
)
chat_completion = client.chat.completions.create(
model="mistralai/mixtral-8x7b-instruct-v0.1",
messages=[{"role" : "user" , "content" : "Write me a love song" }],
temperature=0.7
)

Construa com as Ferramentas Que Você Adora

Trabalhe com seus frameworks favoritos de programação LLM, incluindo LangChain e LlamaIndex, e implante facilmente suas aplicações.


Execute em Qualquer Lugar

Acelere sua Implantação de IA com NVIDIA NIM

Parte do NVIDIA AI Enterprise, o NVIDIA NIM é um conjunto de microsserviços fáceis de usar para acelerar a implantação de modelos básicos em qualquer nuvem ou data center e ajuda a manter seus dados seguros.

Accelerate Your AI Deployment With NVIDIA NIM

Implante o NIM

Implante o NIM para seu modelo com um único comando. Você também pode executar facilmente o NIM com modelos otimizados.

Execute a Inferência

Coloque o NIM em funcionamento com o mecanismo de tempo de execução ideal com base na sua infraestrutura acelerada pela NVIDIA.

Crie

Os desenvolvedores podem integrar endpoints NIM auto-hospedados em apenas algumas linhas de código.

Deploy
Run
Build
docker run nvcr.io/nim/publisher_name/model_name
curl -X 'POST' \ 'http://0.0.0.0:8000/v1/completions' \ -H 'accept: application/json' \ -H 'Content-Type: application/json' \ -d '{ "model" : "model_name", "prompt" : "Once upon a time", "max_tokens" : 64 }'
import openai client = openai.OpenAI( base_url = "YOUR_LOCAL_ENDPOINT_URL", api_key="YOUR_LOCAL_API_KEY" ) chat_completion = client.chat.completions.create( model="model_name", messages=[{"role" : "user" , "content" : "Write me a love song" }], temperature=0.7 )

Inicie Localmente ou Dimensione com o Kubernetes

Implante perfeitamente microsserviços de IA em contêineres em qualquer infraestrutura acelerada da NVIDIA, desde um único dispositivo até a escala do data center.

Implante com Segurança e Confiança

Conte com tempos de execução de nível de produção, incluindo atualizações de segurança contínuas, e execute suas aplicações de negócios com APIs estáveis apoiadas por suporte de nível empresarial.

Redução de Custos e de Sua Pegada de Carbono

Reduza o custo operacional de execução de modelos em produção com tempos de execução de IA que são continuamente otimizados para baixa latência e alto rendimento na infraestrutura acelerada pela NVIDIA.

Taxa de Transferência

O NVIDIA NIM fornece taxa de transferência e latência otimizadas prontas para uso para maximizar a geração de tokens, oferecer suporte a usuários simultâneos em horários de pico e melhorar a capacidade de resposta.


Configuração: Llama 3-70b-instruct, comprimento do token de entrada: 7.000, comprimento do token de saída: 1.000. Solicitações de clientes simultâneas: 100, em 4 x H100 SXM NVLink. NIM OFF: FP16, TTFT: ~120s, ITL: ~180ms; NIM ON: FP8, TTFT: ~4,5s, ITL: ~70ms.

Veja os NVIDIA NIMs em Ação

Comece Agora

Comece a Prototipar Gratuitamente

Comece com APIs sem servidor fáceis de usar e gerenciadas pela NVIDIA.

  • Acesse a infraestrutura de IA totalmente acelerada.
  • Garanta que seus dados não sejam usados ​​para treinamento de modelos.
  • Comece gratuitamente com 1.000 créditos de inferência.

Faça o Download e Implante

Execute o NVIDIA NIM para dimensionar modelos de IA otimizados na nuvem ou no data center de sua escolha.

  • Garanta que os dados nunca saiam do seu enclave seguro.
  • Transição perfeita de endpoints de nuvem para APIs auto-hospedadas sem alterações de código.
  • Use uma licença NVIDIA AI Enterprise para produção ou comece gratuitamente com o Programa de Desenvolvedores da NVIDIA.

Casos de Uso

Impulsione Sua Inovação

Veja como as APIs da NVIDIA oferecem suporte a casos de uso do setor e impulsione seu desenvolvimento de IA com exemplos selecionados.

Humanos Digitais

Dê vida aos personagens do game ou crie avatares virtuais interativos para aprimorar o atendimento ao cliente, capacitando sua aplicação para se conectar mais profundamente com os usuários.

Geração de Conteúdo

Gere conteúdo altamente relevante, personalizado e preciso, baseado na experiência de domínio e na propriedade intelectual de sua empresa.

Geração Biomolecular

Os modelos generativos biomoleculares e o poder computacional das GPUs exploram eficientemente o espaço químico, gerando rapidamente diversos conjuntos de pequenas moléculas adaptadas a alvos ou propriedades específicas de medicamentos.

Ecossistema

Leve Sua IA Empresarial Mais Longe e Mais Rápido

Desenvolva suas aplicações de IA com modelos, kits de ferramentas, bancos de dados vetoriais,
frameworks e infraestrutura com nossos principais parceiros.

Recursos

Desbloqueie, Melhore e Aprimore

NVIDIA LaunchPad

Desbloqueie a IA com um Laboratório Prático

Experimente soluções de IA de ponta a ponta por meio de laboratórios práticos guiados para frameworks de desenvolvimento, chatbots baseados em geração aumentada por recuperação (RAG), otimizações de rota e muito mais.

Programa de Desenvolvedores NVIDIA

Acelere Suas Aplicações de IA

Obtenha acesso gratuito ao NIM para desenvolvimento, pesquisa e teste de aplicações, além de recursos de aprendizado técnico por meio do Programa de Desenvolvedor NVIDIA.

AI Workbench

Comece Pequeno. Execute Grande.

O NVIDIA AI Workbench oferece aos desenvolvedores a flexibilidade de executar modelos habilitados para API em contêineres locais ou remotos com GPU, permitindo workflows de projetos interativos, desde a experimentação até a prototipagem e a prova de conceito.

Notícias

Explore o NVIDIA NIM nas Notícias

Confira os últimos comunicados à imprensa da NVIDIA para ver como NIM e IA generativa estão impactando indústrias, parceiros, clientes e muito mais.

Documentação

Explore a documentação técnica para começar a prototipar e criar suas aplicações corporativas de IA com APIs NVIDIA ou dimensione em sua própria infraestrutura com o NVIDIA NIM.