Débloquer la puissance de la fonctionnalité d'exécution de code de l'API Gemini

Libérez la puissance de la fonctionnalité d'exécution de code de l'API Gemini. Découvrez comment elle permet aux développeurs de construire des applications avec un raisonnement basé sur le code, de résoudre des équations et de traiter du texte. Explorez des exemples illustrant les capacités de cette fonctionnalité innovante, de la génération de nombres premiers au web scraping et à la création de modèles d'apprentissage automatique. Découvrez les différences entre l'exécution de code et l'appel de fonction, et apprenez à tirer parti de cet outil révolutionnaire dans vos flux de travail.

24 mars 2025

Débloquez la puissance du raisonnement basé sur le code avec la nouvelle fonctionnalité d'exécution de code de l'API Gemini. Intégrez parfaitement cette capacité dans vos applications, leur permettant de générer, d'exécuter et d'apprendre à partir du code - résolvant ainsi des problèmes complexes avec facilité. Découvrez comment cette fonctionnalité innovante peut transformer vos workflows de développement et débloquer de nouvelles possibilités.

Puissante capacité : exécution de code sur l'API Gemini
Comprendre l'exécution de code par rapport à l'appel de fonction
Explorer les exemples d'exécution de code
Générer des graphiques et exécuter des modèles d'apprentissage automatique
Tarification et limitations de l'exécution de code de l'API Gemini

Puissante capacité : exécution de code sur l'API Gemini

L'API Gemini de Google offre une fonctionnalité unique appelée "exécution de code" qui permet au modèle de générer et d'exécuter du code Python, et d'apprendre de manière itérative à partir des résultats jusqu'à ce qu'il arrive à la sortie finale. Cette puissante capacité permet aux développeurs de créer des applications qui tirent parti du raisonnement basé sur le code, comme la résolution d'équations ou le traitement de texte.

Les principaux avantages de l'exécution de code par rapport à l'appel de fonction normale sont :

Simplicité : Le modèle de langage décide s'il doit écrire du code pour effectuer une certaine opération, et il peut exécuter le code dans le backend de l'API. C'est beaucoup plus simple à utiliser que de mettre en place un environnement de développement et d'effectuer plusieurs appels d'API.
Flexibilité : Avec l'exécution de code, le modèle peut itérer sur le code et affiner la sortie, alors que l'appel de fonction se limite à une seule requête d'API.
Isolation : L'exécution de code se produit dans un environnement complètement isolé, ce qui signifie que les développeurs n'ont pas à se soucier de l'infrastructure sous-jacente.

Comprendre l'exécution de code par rapport à l'appel de fonction

Les principales différences entre l'exécution de code et l'appel de fonction normale dans le contexte des modèles de langage de grande taille (LLM) comme Gemini sont :

Exécution de code :
- Le LLM peut générer et exécuter du code directement dans le backend de l'API.
- Le modèle décide s'il doit écrire du code pour effectuer une certaine opération et peut exécuter le code.
- C'est une seule requête d'API, et l'exécution du code se fait dans le backend, permettant au modèle d'itérer sur la solution.
- Actuellement limité à Python et à des bibliothèques spécifiques comme NumPy et SciPy.
- Comporte des limitations telles que pas d'E/S de fichiers, pas de sortie non textuelle et une limite de temps d'exécution de 30 secondes.
Appel de fonction :
- Permet l'interaction avec de véritables API ou outils en utilisant des fonctions externes.
- Nécessite de fournir une liste d'outils auxquels le modèle peut accéder et de configurer l'environnement de développement.
- Peut nécessiter plusieurs appels d'API pour accomplir une tâche.
- Offre plus de flexibilité en termes de langage, de framework et de fonctionnalité.
- Nécessite une configuration et une gestion plus importantes de l'environnement externe.

Explorer les exemples d'exécution de code

L'API Gemini de Google offre une fonctionnalité puissante appelée "exécution de code" qui permet aux développeurs de générer et d'exécuter du code Python dans l'API. Cette capacité permet de construire des applications qui tirent parti du raisonnement basé sur le code, comme la résolution d'équations ou le traitement de texte.

Explorons quelques exemples de la manière dont cette fonctionnalité peut être utilisée :

Mathématiques simples

L'API Gemini peut générer et exécuter du code pour effectuer des opérations mathématiques de base, comme calculer la somme des 200 premiers nombres premiers.

# Générer et exécuter du code pour calculer la somme
result = """
import math

primes = []
num = 2
while len(primes) < 200:
    is_prime = True
    for i in range(2, int(math.sqrt(num)) + 1):
        if num % i == 0:
            is_prime = False
            break
    if is_prime:
        primes.append(num)
    num += 1

total_sum = sum(primes)
print(f"La somme des 200 premiers nombres premiers est : {total_sum}")
"""

La sortie montre la somme calculée des 200 premiers nombres premiers.

Manipulation de chaînes de caractères

L'API Gemini peut également générer et exécuter du code pour effectuer diverses tâches de manipulation de chaînes de caractères, comme convertir une chaîne en majuscules, compter le nombre de caractères "o" et inverser la chaîne.

# Générer et exécuter du code pour la manipulation de chaînes de caractères
result = """
text = "hello world, welcome to Gemini API"

# Convertir en majuscules
upper_text = text.upper()
print(f"Texte en majuscules : {upper_text}")

# Compter le nombre de caractères 'o'
o_count = text.count('o')
print(f"Nombre de caractères 'o' : {o_count}")

# Inverser la chaîne
reversed_text = text[::-1]
print(f"Texte inversé : {reversed_text}")
"""

La sortie montre les résultats des tâches de manipulation de chaînes de caractères.

Générer des graphiques et exécuter des modèles d'apprentissage automatique

L'API Gemini offre un niveau gratuit pour que les développeurs puissent explorer la fonctionnalité d'exécution de code. Cependant, il existe quelques limitations à garder à l'esprit :

Limites de requête : Le niveau gratuit a des limites sur le nombre de requêtes que vous pouvez effectuer par minute. Cela permet d'éviter les abus et d'assurer une utilisation équitable de l'API.
Temps d'exécution : La fonctionnalité d'exécution de code a un temps d'exécution maximum de 30 secondes. Tout code qui prend plus de temps que cela sera interrompu.
Bibliothèques prises en charge : L'environnement d'exécution de code a accès à un ensemble limité de bibliothèques, principalement NumPy et SciPy. Les bibliothèques plus complexes ou les packages personnalisés ne sont pas pris en charge.
Pas d'E/S de fichiers ou de sortie non textuelle : La fonctionnalité d'exécution de code ne prend pas en charge les opérations d'E/S de fichiers ou la génération de sorties non textuelles comme les fichiers multimédias. Cela signifie que vous ne pouvez pas l'utiliser pour des tâches nécessitant ces capacités.
Impact potentiel sur d'autres fonctionnalités : L'activation de l'exécution de code peut parfois avoir un impact négatif sur les performances ou la qualité d'autres sorties du modèle, comme la génération d'histoires ou d'essais. C'est quelque chose à garder à l'esprit lors de l'utilisation de cette fonctionnalité.

FAQ

Quelle est la différence entre l'exécution de code et l'appel de fonction normal ?

Quelles sont les limites de la fonctionnalité d'exécution de code ?

Quels sont les exemples de tâches que la fonctionnalité d'exécution de code peut gérer ?

Créez Votre Petite Amie IA

Construisez votre compagne idéale avec notre Constructeur de Petite Amie IA