IA generativa

Documentação e recursos para criar e implementar aplicativos de IA generativa com ferramentas e produtos do Google Cloud .

  • Acesse o Gemini 2.0 Flash Thinking
  • Uso mensal sem custo financeiro dos produtos mais procurados, incluindo APIs de IA e BigQuery
  • Sem cobranças automáticas, sem compromisso

Aproveite mais de 20 produtos sem nenhum custo financeiro

Acesse mais de 20 produtos sem custos financeiros voltados a casos de uso comuns, incluindo APIs de IA, VMs, data warehouses e muito mais.

Saiba como criar apps de IA generativa

Acesse modelos grandes de IA generativa do Google para testá-los, ajustá-los e implantá-los para uso em aplicativos com tecnologia de IA.
Saiba como enviar solicitações para a API Gemini pela plataforma de IA/ML do Google Cloud, a Vertex AI.
Aproveite o poder do GKE como uma plataforma de IA/ML personalizável com treinamento e disponibilização de alto desempenho e custo-benefício, além de opções de infraestrutura flexíveis e escalonamento líder do setor.
Identifique se a IA generativa, a IA tradicional ou uma combinação de ambas podem se adequar ao seu caso de uso de negócios.
Saiba como enfrentar os desafios de cada fase do desenvolvimento de um aplicativo de IA generativa.
Conheça exemplos de código selecionados para casos de uso conhecidos e implante exemplos de apps de IA generativa que são seguros, eficientes, resilientes, de alto desempenho e econômicos.
Saiba mais sobre termos específicos associados à IA generativa.

Ferramentas de IA generativa

Lista de ferramentas de IA generativa, incluindo Vertex AI Studio, Colab Enterprise/Notebooks e Workbench listados no Console do Cloud, e SDKs/APIs listados como um item separado.

Fluxo de desenvolvimento de IA generativa

Diagrama do fluxo de desenvolvimento de IA generativa com seis etapas: seleção de modelo (incluindo o Model Garden), engenharia de comandos (incluindo a galeria de comandos, o Vertex AI Studio, a comparação e a otimização de comandos), ajuste (incluindo treinamento e ajuste), otimização (incluindo destilação), implantação (incluindo o Model Registry, a previsão on-line e em lote) e monitoramento. As etapas de seleção, engenharia, ajuste e otimização de modelos fazem parte de um subciclo de loop chamado "Avaliação".

Hospedagem e análise de modelos

OGoogle Cloud oferece um conjunto de modelos de fundação de última geração pela Vertex AI, incluindo o Gemini. Também é possível implantar um modelo de terceiros no Model Garden da Vertex AI ou na auto-hospedagem no GKE ou no Compute Engine.

Descubra, teste, personalize e implante modelos e recursos do Google de uma biblioteca de modelos de ML.
Descubra, teste, personalize e implante modelos e recursos de OSS selecionados de uma biblioteca de modelos de ML.
Saiba como implantar modelos de geração de texto do HuggingFace na Vertex AI ou no Google Kubernetes Engine (GKE).
Anexe GPUs a instâncias de VM para acelerar cargas de trabalho de IA generativa no Compute Engine.

Design e engenharia de comandos

O design de comandos é o processo de criação de pares de comandos e respostas para dar mais contexto e instruções aos modelos de linguagem. Depois de criar comandos, alimente-os ao modelo como um conjunto de dados de comandos para pré-treinamento. Quando um modelo disponibiliza previsões, ele responde com as instruções integradas.

Crie, teste e personalize os comandos enviados aos modelos de linguagem grandes (LLM) Gemini e PaLM 2 do Google.
Aprenda sobre o fluxo de trabalho de engenharia de comandos e as estratégias comuns que podem ser usadas para afetar as respostas do modelo.
Confira exemplos de comandos e respostas para casos de uso específicos.

Embasamento e RAG

O embasamento conecta modelos de IA a fontes de dados para melhorar a precisão das respostas e reduzir as alucinações. A RAG, uma técnica de embasamento comum, procura informações relevantes e as adiciona ao prompt do modelo, garantindo que a saída seja baseada em fatos e informações atualizadas.

É possível embasar modelos da Vertex AI com a Pesquisa Google ou com seus próprios dados armazenados na Vertex AI para Pesquisa.
Use o Embasamento com a Pesquisa Google para conectar o modelo ao conhecimento atualizado disponível na Internet.
Use o AlloyDB para gerar e armazenar embeddings de vetores e, em seguida, indexe e consulte os embeddings usando a extensão pgvector.
Armazene embeddings de vetor no Postgres SQL e, em seguida, indexe e consulte os embeddings usando a extensão pgvector.
Use o LangChain para extrair dados do BigQuery e enriquecer e embasar as respostas do modelo.
Crie embeddings de vetor com base nos dados do Firestore e, em seguida, indexe e consulte os embeddings.
Use o LangChain para extrair dados do Memorystore e enriquecer e embasar as respostas do modelo.

Agentes e chamada de função

Os agentes facilitam o design e a integração de uma interface do usuário de conversação ao app para dispositivos móveis, enquanto a chamada de função amplia os recursos de um modelo.

Aproveite os modelos de fundação, a experiência em pesquisa e as tecnologias de IA de conversação do Google para criar apps de IA generativa de nível empresarial.
Adicione a chamada de função ao modelo para ativar ações como fazer uma reserva com base nas informações extraídas da agenda.

Personalização e treinamento de modelos

Tarefas especializadas, como treinar um modelo de linguagem com terminologia específica, podem exigir mais treinamento do que é possível somente com o design do comando ou embasamento. Nesse cenário, é possível usar o ajuste de modelos para melhorar o desempenho ou treinar seu próprio modelo.

Avalie o desempenho dos modelos de fundação e dos modelos ajustados de IA generativa na Vertex AI.
Os modelos de fundação de uso geral podem se beneficiar do ajuste para melhorar o desempenho em tarefas específicas.
TPUs são ASICs desenvolvidos especialmente pelo Google para acelerar as cargas de trabalho de machine learning, como o treinamento de um LLM.

Comece a criar

O LangChain é um framework de código aberto para apps de IA generativa que permite criar contexto nos prompts e agir com base na resposta do modelo.
Conheça exemplos de código selecionados para casos de uso conhecidos e implante exemplos de apps de IA generativa que são seguros, eficientes, resilientes, de alto desempenho e econômicos.