Pubblicata: 20 maggio 2025
Spiegazione | Web | Estensioni | Stato di Chrome | Intenzione |
---|---|---|---|---|
GitHub | Visualizza | Intento di partecipare all'esperimento |
Con l'API Prompt, puoi inviare richieste in linguaggio naturale a Gemini Nano nel browser.
L'API Prompt è disponibile per le estensioni di Chrome. Gli sviluppatori web possono utilizzare l'API esplorativa in Chrome Canary partecipando al Programma Early Preview. Questa API sarà disponibile a breve in una prova di origine.
Esistono molti modi per utilizzare l'API Prompt. In un sito web o un'applicazione web, puoi creare:
- Ricerca basata sull'IA: consente di rispondere a domande in base ai contenuti di una pagina web.
- Feed di notizie personalizzati: crea un feed che classifichi dinamicamente gli articoli con categorie e consenta agli utenti di filtrare i contenuti in base a queste.
In Estensioni di Chrome puoi creare:
- Eventi nel calendario. Sviluppare un'estensione di Chrome che estrae automaticamente i dettagli degli eventi dalle pagine web, in modo che gli utenti possano creare voci di calendario in pochi passaggi.
- Estrazione dei contatti. Crea un'estensione che estrae le informazioni di contatto dai siti web, consentendo agli utenti di contattare più facilmente un'attività o di aggiungere dettagli al proprio elenco di contatti.
Queste sono solo alcune possibilità, ma non vediamo l'ora di scoprire cosa realizzerai.
Utilizzare l'API Prompt
Nell'ambito dello spazio dei nomi LanguageModel
sono disponibili due funzioni principali:
availability()
per verificare le funzionalità del modello e se è disponibile.create()
per avviare una sessione del modello linguistico.
Download modello
L'API Prompt utilizza il modello Gemini Nano in Chrome. Sebbene l'API sia integrata in Chrome, il modello viene scaricato separatamente la prima volta che un'estensione utilizza l'API.
Per determinare se il modello è pronto per l'uso, chiama la funzione asincrona
LanguageModel.availability()
. Dovresti ricevere una delle seguenti risposte:
"unavailable"
indica che il browser non supporta le opzioni richieste o non supporta affatto la richiesta di un modello linguistico."downloadable"
indica che il browser supporta le opzioni richieste, ma dovrà scaricare qualcosa (ad esempio il modello linguistico stesso o una messa a punto) prima di poter creare una sessione utilizzando queste opzioni."downloading"
indica che il browser supporta le opzioni richieste, ma deve completare un'operazione di download in corso prima di poter creare una sessione utilizzando queste opzioni."available"
indica che il browser supporta le opzioni richieste senza richiedere nuovi download.
Se la risposta a availability()
è 'downloadable'
, ascolta l'avanzamento del download e informa l'utente, nel caso in cui il download richieda tempo.
const session = await LanguageModel.create({
monitor(m) {
m.addEventListener("downloadprogress", (e) => {
console.log(`Downloaded ${e.loaded} of ${e.total} bytes.`);
});
},
});
Funzionalità multimodali
L'API Prompt supporta gli input audio e di immagini da Chrome 138 Canary per sperimentazioni locali. L'API restituisce un output di testo.
Con queste funzionalità, puoi:
- Consenti agli utenti di trascrivere i messaggi audio inviati in un'applicazione di chat.
- Descrivi un'immagine caricata sul tuo sito web per utilizzarla in una didascalia o in un testo alternativo.
Il tuo feedback ci aiuta a definire il futuro di questa API e i miglioramenti di Gemini Nano. Potrebbero anche essere create API di attività dedicate (ad esempio API per la trascrizione audio o la descrizione delle immagini), in modo da soddisfare le tue esigenze e quelle dei tuoi utenti.
Partecipare e condividere feedback
Il tuo contributo può influire direttamente sulla modalità di creazione e implementazione delle versioni future di questa API e di tutte le API di IA integrate.
- Partecipa al programma di anteprima anticipata.
- Per inviare feedback sull'implementazione di Chrome, invia una segnalazione di bug o una richiesta di funzionalità.
- Condividi il tuo feedback sulla forma dell'API commentando un problema esistente o aprendone uno nuovo nel repository GitHub dell'API Prompt.
- Partecipa al progetto relativo agli standard entrando a far parte del gruppo della community Web Incubator.