L'API Prompt

Pubblicata: 20 maggio 2025

Spiegazione Web Estensioni Stato di Chrome Intenzione
GitHub Sperimentale In EPP Chrome Beta Chrome 137 beta Visualizza Intento di partecipare all'esperimento

Con l'API Prompt, puoi inviare richieste in linguaggio naturale a Gemini Nano nel browser.

L'API Prompt è disponibile per le estensioni di Chrome. Gli sviluppatori web possono utilizzare l'API esplorativa in Chrome Canary partecipando al Programma Early Preview. Questa API sarà disponibile a breve in una prova di origine.

Esistono molti modi per utilizzare l'API Prompt. In un sito web o un'applicazione web, puoi creare:

  • Ricerca basata sull'IA: consente di rispondere a domande in base ai contenuti di una pagina web.
  • Feed di notizie personalizzati: crea un feed che classifichi dinamicamente gli articoli con categorie e consenta agli utenti di filtrare i contenuti in base a queste.

In Estensioni di Chrome puoi creare:

  • Eventi nel calendario. Sviluppare un'estensione di Chrome che estrae automaticamente i dettagli degli eventi dalle pagine web, in modo che gli utenti possano creare voci di calendario in pochi passaggi.
  • Estrazione dei contatti. Crea un'estensione che estrae le informazioni di contatto dai siti web, consentendo agli utenti di contattare più facilmente un'attività o di aggiungere dettagli al proprio elenco di contatti.

Queste sono solo alcune possibilità, ma non vediamo l'ora di scoprire cosa realizzerai.

Utilizzare l'API Prompt

Nell'ambito dello spazio dei nomi LanguageModel sono disponibili due funzioni principali:

  • availability() per verificare le funzionalità del modello e se è disponibile.
  • create() per avviare una sessione del modello linguistico.

Download modello

L'API Prompt utilizza il modello Gemini Nano in Chrome. Sebbene l'API sia integrata in Chrome, il modello viene scaricato separatamente la prima volta che un'estensione utilizza l'API.

Per determinare se il modello è pronto per l'uso, chiama la funzione asincrona LanguageModel.availability(). Dovresti ricevere una delle seguenti risposte:

  • "unavailable" indica che il browser non supporta le opzioni richieste o non supporta affatto la richiesta di un modello linguistico.
  • "downloadable" indica che il browser supporta le opzioni richieste, ma dovrà scaricare qualcosa (ad esempio il modello linguistico stesso o una messa a punto) prima di poter creare una sessione utilizzando queste opzioni.
  • "downloading" indica che il browser supporta le opzioni richieste, ma deve completare un'operazione di download in corso prima di poter creare una sessione utilizzando queste opzioni.
  • "available" indica che il browser supporta le opzioni richieste senza richiedere nuovi download.

Se la risposta a availability() è 'downloadable', ascolta l'avanzamento del download e informa l'utente, nel caso in cui il download richieda tempo.

const session = await LanguageModel.create({
  monitor(m) {
    m.addEventListener("downloadprogress", (e) => {
      console.log(`Downloaded ${e.loaded} of ${e.total} bytes.`);
    });
  },
});

Funzionalità multimodali

L'API Prompt supporta gli input audio e di immagini da Chrome 138 Canary per sperimentazioni locali. L'API restituisce un output di testo.

Con queste funzionalità, puoi:

  • Consenti agli utenti di trascrivere i messaggi audio inviati in un'applicazione di chat.
  • Descrivi un'immagine caricata sul tuo sito web per utilizzarla in una didascalia o in un testo alternativo.

Il tuo feedback ci aiuta a definire il futuro di questa API e i miglioramenti di Gemini Nano. Potrebbero anche essere create API di attività dedicate (ad esempio API per la trascrizione audio o la descrizione delle immagini), in modo da soddisfare le tue esigenze e quelle dei tuoi utenti.

Partecipare e condividere feedback

Il tuo contributo può influire direttamente sulla modalità di creazione e implementazione delle versioni future di questa API e di tutte le API di IA integrate.