Se sai scrivere o parlare, probabilmente lo sai codice di vibrazione. È davvero così facile. Basta comunicare la tua idea agli altri. chatbot di intelligenza artificiale Fai la tua scelta con il linguaggio naturale e funzionerà. Non tutti i progetti risultano gioielli o perfettamente funzionanti, ma lo sforzo richiesto per creare un’applicazione web semplicemente chattando è minimo.
Ho giocato un po’ con la codifica di Vibe, creando progetti casuali qua e là. L’ho provato principalmente per una prova di concetto o semplicemente a scopo di test di chatbot, ma raramente ho tentato di fare qualcosa di significativo o funzionale al punto da vedermi usarlo quotidianamente. Ho quindi iniziato a cercare un dispositivo e-reader e sono rimasto deluso nel vedere quanto fossero incredibilmente “stupidi” la maggior parte di essi, in particolare i Kindle. Ne parleremo più avanti.
Indipendentemente dalla motivazione (ma soprattutto a dispetto di Amazon), mi ha spinto a provare a codificare una soluzione alla vibrazione, ma con una svolta. Volevo vedere se potevo programmare un’applicazione di lettura elettronica funzionale che avesse tutte le funzionalità che desideravo. Sapevo che anche se fossi riuscito a far funzionare questa cosa, probabilmente non l’avrei usata tutti i giorni, ma volevo aggiungere un po’ di stile.
La domanda è diventata quale chatbot AI utilizzare. Non mi sono preoccupato di provare a scegliere. Ho usato Gemini, Claude e ChatGPT per creare ciò che volevo e poi vedere se uno produceva risultati migliori.
Richiesta
È difficile confrontare i chatbot, soprattutto quando si cerca di emulare la stessa conversazione o un progetto di codifica delle vibrazioni. Mi creda, ho provato. Volevo assicurarmi che tutti gli strumenti che ho testato utilizzassero lo stesso prompt, ma prima volevo perfezionare quel prompt per ottenere i migliori risultati, quindi ho sviluppato una strategia che mi avrebbe portato a questo risultato.
Prima di tutto, ho costruito l’intero progetto al livello più elementare con Gemini. Una volta che mi è piaciuto dove si trovava il progetto (una prova di concetto funzionale e di successo), gli ho chiesto di creare un prompt in modo da poterlo aggiungere a qualsiasi altro chatbot. Gemini ha creato il prompt, l’ho salvato come file e l’ho caricato su Claude. Ho ripetuto questo processo e ho lasciato che Claude catturasse e sistemasse cose a cui non avevo pensato mentre costruivo il progetto e Gemini. Fatto ciò, gli ho chiesto di generare un altro prompt in modo da poterlo aggiungere a ChatGPT.
L’idea era che tutti e tre i chatbot avrebbero avuto qualche input sulla creazione effettiva del progetto e quindi sul suggerimento finale. Una volta creato il prompt, l’ho caricato su tutti e tre i chatbot in una chat separata per vedere quanto si comportavano in modo coerente.
Progetto: Lettore di volumi
Questo progetto è nato dalla mia frustrazione nei confronti dei dispositivi Kindle di Amazon. Chiunque ami leggere e ascoltare i propri libri può farlo con l’evidenziazione in tempo reale nell’app iOS o Android, ma dopo tutto questo tempo – quasi 20 anni – non puoi farlo su Kindle. In effetti, non c’è voluto molto tempo prima che gli utenti acquisissero la capacità di evidenziare il testo in tempo reale con la riproduzione del lettore associato, che è molto vicino alla funzionalità dell’app. Al momento, puoi solo leggere o ascoltare audiolibri sul Kindle, non entrambi, il che è ridicolo, così come lo è l’idea che Amazon possieda tutti i miei libri. Comincio a pensare che potrei riuscire a codificare una soluzione in vibrazione. Lo chiamo il lettore della pelle.
Volevo creare un’app Web immersiva per e-reader che leggesse i tuoi libri ad alta voce (con l’evidenziazione del testo in tempo reale, ovviamente), indipendentemente dal fatto che il testo fosse incollato o che fosse caricato il tuo file PDF o EPUB. Oltre a leggere il testo ad alta voce, l’app Web creerà musica di sottofondo in un sottoinsieme di categorie in base al contenuto del testo (neutro, horror gotico, fantascienza, natura, fantasy, subacqueo, western, mistero) e creerà ulteriori effetti audio e visivi quando determinate parole chiave vengono pronunciate in tempo reale. L’intero progetto è stato creato in un singolo file HTML in modo che potesse essere eseguito in un browser Web senza dipendenze aggiuntive.
Costruire con i chatbot: primo round
Gemelli
Gemini ha realizzato tutte le funzionalità che desideravo da Tomb Reader con relativa facilità.
Gemini mi ha permesso di capire fino a che punto avrei potuto estendere le funzionalità di questa app Web e gran parte delle sue funzionalità provengono dal chatbot di Google. Inizialmente mi ha aiutato a risolvere alcuni problemi minori che impedivano il caricamento dei suoni TTS. Invece, è stata creata una schermata di avvio che forzava il caricamento dei suoni dopo aver fatto clic sulla schermata “aperta” dell’app. Senza questo tipo di conoscenza il progetto non avrebbe potuto essere realizzato.
Lentamente ma inesorabilmente, la funzionalità del progetto ha iniziato ad aumentare. Poiché gli effetti sonori dal vivo di alcune parole possono distrarre, mi sono assicurato di aggiungere l’opzione per disattivare questi effetti sonori e la musica di sottofondo. Una volta che l’app ha funzionato, ho chiesto a Gemini di creare un messaggio che avrei potuto condividere con altri chatbot in modo da poterlo creare altrove, se lo avessi voluto, e così è stato.
claude
Il progetto di Claude mi ha dato il maggior successo in alcune aree e più problemi in altre, ma è il mio preferito tra i tre progetti di prova.
In questo progetto, Claude ha apportato notevoli miglioramenti alla funzione di base delle parole trigger. Claude ha ampliato il suo vocabolario e ha aumentato la visualizzazione quando una parola chiave veniva pronunciata ad alta voce. Tuttavia, Claude ha fatto una chiamata che non avevo chiesto, ma che in realtà aveva un senso.
Inizialmente pensavo che il progetto non funzionasse perché quando sono andato a testarne la funzionalità, pensavo che solo la prima parola di attivazione avrebbe avuto l’effetto desiderato in una sequenza di circa 10. Claude ha impiegato un po’ di tempo per spiegare finalmente che aveva deciso di consentire l’attivazione degli effetti audio e visivi solo una volta per frase per evitare di “spammare” l’utente. Ciò aveva perfettamente senso, ma il progetto era più una prova di concetto che un lettore funzionale e Gemini e ChatGPT generavano effetti sonori per ciascuna parola chiave, che era la funzionalità prevista.
Detto questo, non ci sono istruzioni specifiche nel prompt su quante volte riprodurre gli effetti audio e visivi. Anche se non era quello che volevo, ho apprezzato il fatto che quando si effettuava una chiamata del genere si prendesse in considerazione l’esperienza complessiva dell’utente. Una volta codificati tutti questi miglioramenti, Claude ha aggiornato il prompt e l’ho portato su ChatGPT.
ChatGPT
ChatGPT occasionalmente non è riuscito a creare funzionalità aggiuntive quando gliel’ho richiesto, ma è comunque riuscito a ricreare perfettamente il progetto quando gli ho presentato la richiesta finale.
Una volta creato il prompt aggiornato con Claude, non c’era molto che potessi fare una volta caricato su ChatGPT. Fortunatamente, il chatbot di OpenAI ha creato il progetto con facilità, nonostante sia il più lento nel generare il codice. L’unica funzione che ho chiesto a ChatGPT di aggiungere al progetto – creare un dispositivo di scorrimento del volume personalizzato per la musica di sottofondo in modo che potesse essere disattivato completamente quando si desiderava solo un’esperienza di lettura elettronica dedicata – ha costantemente fallito. Alla fine sono tornato da Claude per richiedere questa funzionalità e ricreare il prompt.
Round 2: ricreare lo stesso progetto
Sebbene inizialmente abbiano utilizzato Gemini 3 Pro e le versioni gratuite di ChatGPT e Claude per creare il progetto, tutti e tre hanno realizzato il progetto senza problemi. Ho passato la maggior parte del mio tempo a sviluppare il progetto con Claude e lui era responsabile della creazione della versione finale. È stato incredibilmente sorprendente durante il caricamento di questo messaggio in una nuova chat apprendere che il progetto non si caricava dopo la prima pagina di “lancio”. Anche se non ci sono stati problemi con le iterazioni precedenti, ci sono volute 11 (sì, davvero) ricostruzioni complete aggiuntive per capire cosa stava succedendo.
La ricostruzione del progetto sia con Gemini che con ChatGPT ha funzionato perfettamente. Tutte le funzioni, di base e avanzate, hanno funzionato come dovrebbero, incluso il caricamento di file, l’evidenziazione dei test, l’output di sintesi vocale e gli effetti audio e visivi quando le parole trigger venivano pronunciate ad alta voce. Tornando ai modelli, ho notato poche differenze in termini di funzionalità o prestazioni quando ho dato lo stesso suggerimento a ciascun chatbot.
Incoerenze di Chatbot
È sempre stato facile far testare il file con Claude. Non solo offriva un’anteprima del progetto in modo da non dover mai scaricare il file HTML, ma era anche disponibile per il download diretto se lo volevi (cosa che ho fatto principalmente per testare). Questa opzione era disponibile solo a volte con ChatGPT, altre volte potevo semplicemente copiare l’HTML e salvarlo da solo.
Anche se in Gemelli hai avuto errori minimi e riserve generali, ti è sempre stato richiesto di prendere la strada lunga e di farlo in quel modo. A parte questo, era strano e un po’ fastidioso che ChatGPT a volte mi permettesse di scaricare il file direttamente come HTML.
Vincitore: Dipende
Poiché tutti i chatbot hanno i loro pro e i loro contro, è difficile definire un vincitore per questo tipo di test. In un certo senso vincono tutti. Ognuno di loro prima o poi è riuscito a creare una versione funzionale del progetto, ma ciò ha spesso richiesto sforzi ripetuti.
Alla fine, il vincitore è l’utente. Ciò dimostra che, indipendentemente dal modello utilizzato, un solido set di istruzioni può portarti molto lontano. Non sono riuscito a distinguere alcuna differenza in termini di prestazioni o funzionalità tra l’app Gemini 3 Pro e le versioni gratuite di ChatGPT o Claude.
Questo in realtà va direttamente contro ciò che ho scoperto durante una conversazione simile sia con il modello Gemini Pro che con quello gratuito. Anche se questo è un altro giorno, un altro progetto e un altro modello, ciò dimostra che un solido suggerimento può portarti incredibilmente lontano nel mondo della codifica dither.
Link alla fonte: www.cnet.com