Sbloccare il potere della funzione di esecuzione del codice dell'API di Gemini

Libera il potere della funzione di esecuzione del codice dell'API di Gemini. Scopri come permette agli sviluppatori di costruire applicazioni con ragionamento basato sul codice, risolvere equazioni ed elaborare testi. Esplora esempi che mostrano le capacità di questa innovativa funzione, dalla generazione di numeri primi al web scraping e alla creazione di modelli di apprendimento automatico. Acquisisci informazioni sulle differenze tra l'esecuzione del codice e la chiamata di funzioni, e impara a sfruttare questo strumento rivoluzionario nei tuoi flussi di lavoro.

21 febbraio 2025

party-gif

Sblocca il potere del ragionamento basato sul codice con la nuova funzionalità di esecuzione del codice dell'API Gemini. Integra perfettamente questa capacità nelle tue applicazioni, consentendo loro di generare, eseguire e imparare dal codice - risolvendo problemi complessi con facilità. Scopri come questa innovativa funzionalità può trasformare i tuoi flussi di lavoro di sviluppo e sbloccare nuove possibilità.

Potente Capacità: Esecuzione di Codice sull'API Gemini

L'API Gemini di Google offre una funzionalità unica chiamata "esecuzione di codice" che consente al modello di generare ed eseguire codice Python, e di imparare in modo iterativo dai risultati fino a raggiungere l'output finale. Questa potente capacità consente agli sviluppatori di costruire applicazioni che traggono vantaggio dal ragionamento basato sul codice, come la risoluzione di equazioni o l'elaborazione del testo.

I principali vantaggi dell'esecuzione di codice rispetto alla normale chiamata di funzione sono:

  1. Semplicità: Il modello di linguaggio decide se è necessario scrivere codice per eseguire una determinata operazione e può eseguire il codice nel backend dell'API. Questo è molto più semplice da utilizzare rispetto alla configurazione di un ambiente di sviluppo e all'effettuazione di più chiamate API.

  2. Flessibilità: Con l'esecuzione di codice, il modello può iterare sul codice e raffinare l'output, mentre la chiamata di funzione è limitata a una singola richiesta API.

  3. Isolamento: L'esecuzione del codice avviene in un ambiente completamente isolato, il che significa che gli sviluppatori non devono preoccuparsi dell'infrastruttura sottostante.

Comprendere l'Esecuzione di Codice vs. la Chiamata di Funzioni

Le principali differenze tra l'esecuzione di codice e la normale chiamata di funzione nel contesto dei modelli di linguaggio di grandi dimensioni (LLM) come Gemini sono:

  1. Esecuzione di codice:

    • L'LLM può generare ed eseguire codice direttamente all'interno del backend dell'API.
    • Il modello decide se è necessario scrivere codice per eseguire una determinata operazione e può eseguire il codice.
    • È una singola richiesta API e l'esecuzione del codice avviene nel backend, consentendo al modello di iterare sulla soluzione.
    • Attualmente limitato a Python e a librerie specifiche come NumPy e SciPy.
    • Ha limitazioni come nessuna I/O di file, nessun output non testuale e un limite di tempo di esecuzione di 30 secondi.
  2. Chiamata di funzione:

    • Consente l'interazione con API o strumenti del mondo reale utilizzando funzioni esterne.
    • Richiede la fornitura di un elenco di strumenti a cui il modello può accedere e la configurazione dell'ambiente di sviluppo.
    • Potrebbe essere necessario effettuare più chiamate API per completare un'attività.
    • Offre più flessibilità in termini di linguaggio, framework e funzionalità.
    • Richiede una maggiore configurazione e gestione dell'ambiente esterno.

Esplorare gli Esempi di Esecuzione di Codice

L'API Gemini di Google offre una funzionalità potente chiamata "esecuzione di codice" che consente agli sviluppatori di generare ed eseguire codice Python all'interno dell'API. Questa capacità consente di costruire applicazioni che traggono vantaggio dal ragionamento basato sul codice, come la risoluzione di equazioni o l'elaborazione del testo.

Esploriamo alcuni esempi di come questa funzionalità può essere utilizzata:

Matematica semplice

L'API Gemini può generare ed eseguire codice per eseguire operazioni matematiche di base, come calcolare la somma dei primi 200 numeri primi.

# Genera ed esegui il codice per calcolare la somma
result = """
import math

primes = []
num = 2
while len(primes) < 200:
    is_prime = True
    for i in range(2, int(math.sqrt(num)) + 1):
        if num % i == 0:
            is_prime = False
            break
    if is_prime:
        primes.append(num)
    num += 1

total_sum = sum(primes)
print(f"The sum of the first 200 prime numbers is: {total_sum}")
"""

L'output mostra la somma calcolata dei primi 200 numeri primi.

Manipolazione di stringhe

L'API Gemini può anche generare ed eseguire codice per eseguire vari compiti di manipolazione delle stringhe, come convertire una stringa in maiuscolo, contare il numero di caratteri "o" e invertire la stringa.

# Genera ed esegui il codice per la manipolazione delle stringhe
result = """
text = "hello world, welcome to Gemini API"

# Converti in maiuscolo
upper_text = text.upper()
print(f"Uppercase text: {upper_text}")

# Conta il numero di caratteri 'o'
o_count = text.count('o')
print(f"Number of 'o' characters: {o_count}")

# Inverti la stringa
reversed_text = text[::-1]
print(f"Reversed text: {reversed_text}")
"""

L'output mostra i risultati delle attività di manipolazione delle stringhe.

Analisi dei dati

L'API Gemini può generare ed eseguire codice per eseguire attività di analisi dei dati di base, come generare numeri casuali, calcolare statistiche (media, mediana, moda) e creare un istogramma.

Generare Grafici e Eseguire Modelli ML

L'API Gemini offre un livello gratuito per gli sviluppatori per esplorare la funzionalità di esecuzione del codice. Tuttavia, ci sono alcuni limiti da tenere a mente:

  • Limiti delle richieste: Il livello gratuito ha limiti sul numero di richieste che è possibile effettuare al minuto. Questo per evitare abusi e garantire un uso equo dell'API.

  • Tempo di esecuzione: La funzionalità di esecuzione del codice ha un tempo massimo di esecuzione di 30 secondi. Qualsiasi codice che richiede più tempo di questo andrà in timeout.

  • Librerie supportate: L'ambiente di esecuzione del codice ha accesso a un set limitato di librerie, principalmente NumPy e SciPy. Librerie più complesse o pacchetti personalizzati non sono supportati.

  • Nessuna I/O di file o output non testuale: La funzionalità di esecuzione del codice non supporta le operazioni di I/O dei file o la generazione di output non testuali come file multimediali. Ciò significa che non è possibile utilizzarla per attività che richiedono queste capacità.

  • Potenziale impatto sulle altre funzionalità: L'abilitazione dell'esecuzione del codice può a volte avere un impatto negativo sulle prestazioni o sulla qualità di altri output del modello, come la generazione di storie o saggi. Questo è un aspetto da tenere presente quando si utilizza la funzionalità.

FAQ