IA générative
Documentation et ressources pour créer et implémenter des applications d'IA générative avec les outils et produits Google Cloud .
Démarrez votre démonstration de faisabilité avec 300 $ de crédits inclus
- Accès à Gemini 2.0 Flash Thinking
- Utilisation mensuelle gratuite de produits populaires, y compris les API d'IA et BigQuery
- Aucuns frais automatiques, aucun engagement
Continuez à explorer Google Cloud avec plus de 20 produits toujours disponibles sans frais
Accédez à plus de 20 produits gratuits pour des cas d'utilisation courants, y compris des API d'IA, des VM, des entrepôts de données, et plus encore.
Découvrez comment créer des applications d'IA générative.
IA générative sur Vertex AI
Guide de démarrage rapide Gemini
Orchestration IA/ML sur GKE
Quand utiliser l'IA générative ?
Développer une application d'IA générative
Exemples de code et exemples d'applications
Glossaire de l'IA générative
Outils d'IA générative
Processus de développement de l'IA générative
Exploration et hébergement de modèles
Google Cloud fournit un ensemble de modèles de fondation de pointe via Vertex AI, y compris Gemini. Vous pouvez également déployer un modèle tiers vers Vertex AI Model Garden ou l'auto-hébergement sur GKE ou Compute Engine.
Modèles Google sur Vertex AI (Gemini, Imagen)
Autres modèles dans Vertex AI Model Garden
Modèles de génération de texte via HuggingFace
GPU sur Compute Engine
Conception et ingénierie des requêtes
La conception de requêtes consiste à créer des paires de requêtes et de réponses pour fournir aux modèles de langage davantage de contexte et d'instructions. Une fois que vous avez créé des requêtes, vous les transmettez au modèle en tant qu'ensemble de données de requêtes pour le pré-entraînement. Lorsqu'un modèle diffuse des prédictions, il répond en intégrant vos instructions.
Vertex AI Studio
Présentation des stratégies de requête
Galerie de requêtes
Ancrage et RAG
L'ancrage connecte les modèles d'IA à des sources de données pour améliorer la précision des réponses et réduire les hallucinations. La RAG (RAG, Retrieval-Augmented Generation) est une technique d'ancrage courante qui recherche des informations pertinentes et les ajoute à la requête du modèle. Elle permet de s'assurer que le résultat est basé sur des faits et des informations à jour.
Ancrage Vertex AI
Ancrer avec la recherche Google
Embeddings vectoriels dans AlloyDB
Cloud SQL et pgvector
Intégrer des données BigQuery à votre application LangChain
Embeddings vectoriels dans Firestore
Intégrations vectorielles dans Memorystore (Redis)
Agents et appels de fonction
Les agents permettent de concevoir et d'intégrer facilement une interface utilisateur de conversation dans votre application mobile, tandis que l'appel de fonction étend les capacités d'un modèle.
Vertex AI Search
Appel de fonction Vertex AI
Personnalisation et entraînement des modèles
Les tâches spécialisées, telles que l'entraînement d'un modèle de langage sur une terminologie spécifique, peuvent nécessiter plus d'entraînement qu'une conception de requête ou un ancrage seul. Dans ce cas, vous pouvez utiliser le réglage de modèle pour améliorer les performances ou entraîner votre propre modèle.