Ho provato a codificare Vibe per lo stesso progetto utilizzando diversi modelli Gemini. I risultati furono drammatici

codifica delle vibrazioni È molto divertente quando conosci l’essenza generale del processo. È facile come parlare con qualcuno chatbot di intelligenza artificiale e convincerlo a codificare un’app per te, ma ci vuole tempo e pazienza per risolvere i problemi. Ne ho creati alcuni progetti di codifica delle vibrazionima ci sono sempre nuovi modi per testare quanto possono essere buoni questi risultati, soprattutto se si considera il modello che si sta utilizzando.

Con così tanti modelli di intelligenza artificiale con cui lavorare, possono produrre risultati notevolmente diversi, soprattutto se non hai in mente un piano solido. Volevo vedere come si comportano i modelli più leggeri rispetto ai modelli “pensanti”, come dicono Google e OpenAI. I nomi di questi modelli più leggeri variano: l’interfaccia Gemini di Google lo chiama Fast (anche se il modello in realtà si chiama Gemini 2.5 Flash), mentre OpenAI lo chiama Instant.

Ho deciso di fare un esperimento utilizzando due modelli per creare lo stesso progetto. Innanzitutto, ho realizzato un progetto dall’inizio alla fine utilizzando Gemini 3 Pro di Google e volevo replicarlo con uno dei suoi modelli più leggeri, cercando di fare la stessa conversazione. A quel tempo, il modello leggero più recente era il Gemini 2.5 Flash. I risultati dicevano: tecnicamente entrambi hanno creato lo stesso risultato, ma il viaggio per arrivarci è stato molto diverso tra i due.

Mi mancava l’ispirazione per questo esperimento, quindi l’ho trasferito su Gemini. Gli ho chiesto di trovare progetti di codifica interessanti che avrei potuto eseguire e ho scelto il progetto chiamato “Trophy Showcase”. Invece dei premi, ho chiesto a Gemini di visualizzare un elenco di film horror e di fornire maggiori informazioni su di essi quando si fa clic su uno dei poster. Oltre a questi requisiti, ho dato il controllo creativo a entrambi i modelli Gemini.

Modelli di intelligenza artificiale veloci e pensanti: qual è la differenza?

Se Google ci offre la possibilità di scegliere tra i modelli Flash e Pro, dovrebbero differire notevolmente, giusto? Sì e no. Entrambi sono modelli linguistici importanti ma funzionano in modo diverso. Per gli utenti occasionali, “veloce” e “pensiero” descrivono abbastanza bene le differenze tra i due: velocità contro profondità.

UN. modello di ragionamento È un LLM ottimizzato per suddividere problemi complessi in passaggi più piccoli prima di creare l’output finale. Questo viene fatto eseguendo una catena interna di pensiero, percorso di ragionamento. Sia Gemini 2.5 Flash che Gemini 3 Pro sono modelli ragionanti, ma Gemini 2.5 Flash approccio ibrido: Fa un’offerta atto di equilibrio tra velocità e giudizio.

Gemini 3 Pro è un modello di ragionamento più potente ed è ottimizzato per approfondire la ricerca delle risposte. Di conseguenza, è più lento rispetto ai modelli più efficienti come 2.5 Flash. Da allora Google ha rilasciato Gemelli 3 Il FlashUn modello base più potente che sostituisce 2.5 Flash. Il Gemini 3 Pro rimane, per la maggior parte delle persone, il modello di ragionamento più potente disponibile su Gemini.

Il modello Gemini 3 Pro ha svolto la maggior parte del lavoro

Il progetto finale prodotto dal Gemini 3 Pro non era perfetto, ma era migliore della mia idea originale e circa un miglio avanti rispetto al progetto prodotto dal Gemini 2.5 Flash.

Google Gemini/Screenshot: Blake Stimac/CNET

Utilizzando Gemini 3 Pro, sono stato in grado di creare una pagina di destinazione che mostrava i film nel mio elenco, completi di immagini di poster, e facendo clic su un titolo si apriva una pagina con informazioni aggiuntive insieme a un collegamento per visualizzare il trailer su YouTube. Non è stato un progetto complesso, ma ho riscontrato molti problemi ed errori lungo il percorso.

Inizialmente volevo che i trailer fossero incorporati nella pagina, ma continuava a segnalare errori che Gemini non poteva correggere, quindi alla fine è stata ridimensionata, fornendo solo un’immagine collegata per guardare il trailer su YouTube. È stato bello, ma un’esperienza meno fluida di quanto avrei voluto. Tuttavia, ho apprezzato il modo in cui dettagliava i problemi specifici che Gemini 3 Pro aveva con questa funzionalità, portandomi a prendere la decisione di eliminarla.

Un altro problema che Gemini 3 Pro ha provato a risolvere più volte è stato quello descritto come un problema di stratificazione. Facendo clic su un poster veniva visualizzato un popup con i dettagli del film e un piccolo pulsante per uscire da quella visualizzazione, ma non ha mai funzionato. Ho chiesto a Gemini di risolverlo quattro volte e non è stato possibile risolvere il problema fino all’ultima richiesta. Gemini ha spiegato in termini generali cosa stava facendo con il codice, ma non è mai entrato nei dettagli, anche se immagino che avrebbe fornito dettagli se glielo avessi chiesto.

Il progetto originale era un modo per mostrare una raccolta di film e saperne di più su di essi. A parte questo, non ho pensato a nulla sullo stile o sui modi per rendere interessante l’app web e Gemini 3 Pro mi ha aiutato in quell’area. Quando ho chiesto come avrei potuto migliorare l’app, sia in termini di design che di funzionalità, ha suggerito di aggiungere un effetto ruota 3D e un’opzione di randomizzazione ai film.

Questo progetto ha richiesto circa 20 iterazioni. Il prodotto finale era buono quanto avrebbe potuto essere ed era un progetto divertente, ma c’erano problemi che Gemini nella maggior parte dei casi non riusciva a risolvere. Il prodotto finale ha superato le mie aspettative, quindi sono rimasto soddisfatto. Ma con tutti i problemi che incontrai, cominciai a chiedermi come il veloce modello Gemini avrebbe realizzato lo stesso progetto.

La codifica delle vibrazioni è più manuale con Gemini 2.5 Flash

Non sorprende che l’utilizzo del modello “veloce” sia stato più veloce rispetto al Gemini 3 Pro, ma spesso quel modello suggeriva approcci più manuali per risolvere il progetto. L’intelligenza artificiale ha funzionato velocemente ma ha creato per me un lavoro maggiore e più lento.

Ad esempio, volevo che l’app web mostrasse sia la locandina che la sinossi di ogni film nell’elenco, ma non avevo mai pensato a come creare queste informazioni. Gemini 3 Pro mi ha suggerito di iscrivermi senza chiedere espressamente Database dei film e ottieni una chiave API per recuperare automaticamente questi dettagli; dove Gemini 2.5 Flash mi ha detto essenzialmente di “importare” le immagini e partire da lì. Apparentemente il modo in cui ho ottenuto queste immagini dipendeva da me.

Il Gemini 2.5 Flash a volte sembra quasi pigro rispetto al Gemini 3 Pro. Ci sono alcune cose che il modello Gemini Pro farà senza che gli venga chiesto, ma Flash necessita di una guida più specifica. A volte mi sentivo come se stessi dirigendo un bambino che ascoltava le istruzioni ma evitava deliberatamente i compiti.

In molti casi, quando ho chiesto a Gemini 2.5 Flash di apportare una modifica, lo ha fatto e ha fornito il codice aggiornato, ma solo per la sezione specifica modificata. Quindi mi avrebbe incaricato di sostituire il vecchio codice con il nuovo codice. Sostituire una sezione di codice con un’altra probabilmente non è un grosso problema se sai cosa stai cercando, ma questa è codifica jitter e se non sai dove posizionare il codice può fermare alcune persone nel loro percorso, anche se è un compito davvero facile. Potrebbe rovinare l’atmosfera.

Inoltre, Gemini 2.5 Flash mi ha offerto la possibilità di “importare” immagini di locandine di film e dettagli aggiuntivi. Quindi, mentre spingevo i limiti dei parametri di sperimentazione per utilizzare solo gli stessi prompt in entrambi i progetti (che nella migliore delle ipotesi erano vaghi), ho deciso di chiedergli cosa ne pensasse dell’idea di aggiungere la chiave API per il database dei film a Gemini 2.5 Flash. Ha accolto con favore l’idea e mi ha detto dove aggiungere la chiave. Invece, ho chiesto al modello di aggiungere la chiave che avevo fornito. Ha aggiunto la chiave, ma quando ho eseguito l’app Web in realtà non estraeva le immagini dei poster dai film che avevo elencato, quindi ho dovuto chiedergli di risolverlo ancora una volta. Il modello ha affrontato i suoi limiti, dicendo: “Trovare l’ID TMDB completo per ogni film nell’elenco originale richiede molto tempo, ma popolerò l’array con il maggior numero possibile di ID confermati per garantire che la raccolta sia accurata rispetto all’elenco desiderato”.

Se avesse fatto qualcosa che aveva detto che avrebbe fatto, non me ne sarei accorto. Rispetto alla gamma estremamente diversa di film popolati, qualsiasi abbinamento nell’elenco che ho fornito sembrava una coincidenza. Tuttavia, anche se il 99% delle locandine dei film compilate erano imprecise, ciò teoricamente eliminava la necessità di aggiungere manualmente le immagini. In confronto, il Gemini 3 Pro ha popolato tutti i poster dei film giusti in una volta sola.

In che modo i modelli veloci e pensanti differivano durante la codifica di Vibe?

Quando ho chiesto a Gemini di apportare modifiche al suo modello di pensiero, ha apportato modifiche e riscritto l’intero codice al volo, così ho potuto copiare e incollare l’intero codice dove volevo senza sapere dove era stato aggiornato.

Gemini 2.5 Flash era diverso. Ad un certo punto, dopo qualche modifica, mi ha dato il codice e mi ha detto di sostituirlo con quello che c’era. Sperando di evitare questo, gli ho chiesto di riscrivere l’intero codice in modo da non dover cambiare nulla. La sua risposta: “Questa è una domanda molto importante”. È un po’ stridente rispetto al Gemini 3 Pro, anche se in quel momento sembrava che volessi molto di più.

progetti

Gemini 2.5 Flash era un progetto in qualche modo fattibile, ma era pieno di bug anche dopo aver provato a risolverli.

Google Gemini/Screenshot: Blake Stimac/CNET

Alla fine dei miei test, nessuno dei due modelli era perfetto, ma il Gemini 3 Pro era molto più semplice da utilizzare. Mentre in un altro progetto entrambi i modelli potrebbero produrre risultati molto simili, il raggiungimento dell’obiettivo finale probabilmente seguirà due percorsi diversi.

Quando lavori con Gemini 2.5 Flash, devi essere specifico su ciò che vuoi che faccia ed essere pronto a modificarlo quando sono necessarie scorciatoie. Rilevare che il modello sta prendendo una scorciatoia che potrebbe influenzare il progetto richiederà pratica ed esperienza, compreso il lavoro con altri modelli di intelligenza artificiale. Se questo è l’unico modello su cui stai lavorando, devi prestare più attenzione a questo modello in generale.

Gemini 3 Pro è davvero all’altezza del suo nome. Non solo ha svolto il lavoro pesante per questo progetto, ma ha anche offerto suggerimenti utili che lo hanno elevato rispetto all’idea di base con cui ho iniziato.

Link alla fonte: www.cnet.com

Ho provato a codificare Vibe per lo stesso progetto utilizzando diversi modelli Gemini. I risultati furono drammatici

DiPatrizia Caruso

Modelli di intelligenza artificiale veloci e pensanti: qual è la differenza?

Il modello Gemini 3 Pro ha svolto la maggior parte del lavoro

La codifica delle vibrazioni è più manuale con Gemini 2.5 Flash

In che modo i modelli veloci e pensanti differivano durante la codifica di Vibe?

progetti

Di Patrizia Caruso

Articoli correlati

Google Play aggiunge prove di gioco gratuite e un hub PC dedicato per i giocatori

8Suggerimenti, risposte e aiuto sui filoni NYT di oggi per il 12 marzo #739

È tempo delle temute pulizie di primavera. L’intelligenza artificiale mi ha aiutato a portare a termine il lavoro