Gavin McNamara ha abbandonato la tastiera e passa tutto il giorno a parlare invece di scrivere.
Parla per ore al computer e al telefono, invia e-mail, scrive presentazioni, pubblica post su LinkedIn e persino codifica attraverso conversazioni utilizzando l’app di dettatura AI della startup di San Francisco Wispr Flow.
L’intelligenza artificiale distilla, formatta e adatta la sua navigazione in una versione coerente. La velocità media di McNamara è di 125 parole al minuto, ovvero il doppio della velocità media di battitura.
“A questo punto, tutto ciò che può essere fatto scrivendo, lo faccio parlando”, ha detto il 32enne fondatore dell’agenzia di software Why Not Us. “Sto solo parlando.”
Attraverso 77 domande, negli ultimi cinque mesi ha dettato quasi 300.000 parole, l’equivalente di scrivere tre romanzi.
I giganti e le startup tecnologiche californiane sono in prima linea nell’uso dell’intelligenza artificiale e dei grandi modelli linguistici su cui fanno affidamento per convincere le persone a interagire con la tecnologia usando la voce invece delle dita.
“L’intelligenza artificiale e l’MBA hanno cambiato la dinamica”, ha affermato CJ Bice, creatore con sede a San Diego dell’app gratuita di dettatura vocale Handy. “Usare la voce è molto più veloce che digitare.”
È emerso un mix di sviluppatori e startup indipendenti, tra cui Handy, Wispr Flow, Willow di San Fransico e altri, per offrire un’interazione vocale precisa con l’intelligenza artificiale.
I più grandi nomi della tecnologia stanno anche creando nuovi modi per consentire alle persone di collaborare con l’intelligenza artificiale. Gli ultimi occhiali intelligenti Meta sono basati sul suono. OpenAI e Meta hanno progettato personaggi di chat vocale distinti per i loro bot. Anche Alexa di Amazon e Siri di Apple stanno subendo aggiornamenti dell’intelligenza artificiale, che le aziende si aspettano faranno sì che tutti parlino molto di più con la loro tecnologia.
Questi approcci gratuiti e a pagamento all’uso del parlato con i computer hanno attratto milioni di utenti, tra cui programmatori, assistenti esecutivi, avvocati, creatori di contenuti e medici. Alcuni ottimisti ritengono che la tastiera potrebbe diventare obsoleta.
“Sono lieto di annunciare che abbiamo rimosso le console dai premi televisivi più prestigiosi del mondo”, ha affermato il fondatore di Willow Alan Gou in un post sul sito. LinkedInNotando che il team degli Emmy Awards ha utilizzato la dettatura vocale di Willow per inviare messaggi Slack e svuotare la casella di posta più velocemente in preparazione dei premi 2026.
Nel corso degli anni, le grandi aziende tecnologiche hanno fatto proprio questo adattabile Molti dei loro prodotti sono dotati di funzionalità audio-first, per comodità. Oggi abbandona la voce come funzionalità di accessibilità per il tuo strumento di produttività.
Alla fine del 2022 è stato creato ChatGPT Ho iniziato a rinunciare all’accesso illimitato A un modello di riconoscimento vocale automatico chiamato Whisper, addestrato su 680.000 ore di dati multilingue. OpenAI ha condiviso la sua esatta tecnologia di trascrizione audio, che un tempo era un segreto tecnico gelosamente custodito. Chiunque può ora scaricare e riprodurre gratuitamente la trascrizione AI di alta qualità Sul loro portatile.
La nuova ondata di app di dettatura basate sull’intelligenza artificiale utilizza Whisper come base e si basa su di esso per offrire dettatura dal vivo. Sebbene esistano alternative gratuite, un abbonamento a pagamento costa tra $ 8 e $ 12 al mese.
La dettatura basata sull’intelligenza artificiale sta ora prendendo piede tra i programmatori e gli utenti di tutti i giorni e sta facendo sì che le persone parlino con i loro laptop. Che si tratti di scrivere e-mail, inviare messaggi SMS, progettare un sito Web o assegnare compiti di intelligenza artificiale, i primi ad adottare affermano che la dettatura consente loro di lavorare più velocemente, pensare in modo più chiaro ed essere più produttivi.
“Le persone che hanno adottato pesantemente la voce non torneranno indietro”, ha affermato Naveen Naidu, amministratore delegato dell’app di dettatura audio Monologue con sede a New York. “Quando parli 20 ore a settimana al tuo laptop, digitare diventa un attrito.” “L’obiettivo a cui penso sia diretto: la voce diventa lo strato di autorizzazione. Dici le tue intenzioni e le cose accadono.”
Le nuove app di dettatura basate sull’intelligenza artificiale sfruttano le app di Apple Chip avanzati Su iPhone e Mac per attivare la dettatura privata sul dispositivo.
Geoffrey Huntley, uno sviluppatore di software freelance, è passato quasi completamente all’uso della voce al lavoro a giugno.
Spesso avvia i progetti aprendo un comando vocale e chiedendo all’IA di intervistarlo sulle sue preoccupazioni e sui requisiti del progetto prima di creare qualsiasi codice.
“Le parlo come se stessi suonando in un gruppo jazz, indietro, avanti, indietro, avanti”, ha detto Huntley. Questa danza vocale aiuta a ottimizzare le specifiche e poi l’intelligenza artificiale prende il sopravvento. E costruisce software.
Oltre alla programmazione, Huntley utilizza l’audio per “lasciarlo trascrivere” quando cattura idee per post o messaggi di blog, utilizzando app come Supersussurro Oppure Whisper Flow per ottenere un “primo dump” di idee prima di passare alla tastiera per l’editing finale.
Un numero crescente di sviluppatori di software nella Silicon Valley dettano istruzioni di programmazione per ore invece di scriverle. Una combinazione di agenti IA in rapido progresso in grado di programmare oregrazie all’input vocale che cattura le idee più velocemente della digitazione, ha aumentato la loro produttività.
McNamara, che si autodefinisce “programmatore di liveness”, ha creato più di 25 applicazioni web in pochi mesi, una velocità di sviluppo che sarebbe stata impossibile senza le istruzioni vocali.
“Non penso che (scrivere), in alcun modo, sarà così efficiente o efficace per arrivare a destinazione così velocemente come ho fatto mentre parlavo”, ha detto McNamara.
Ha utilizzato una conversazione tortuosa e alcune ore per far costruire l’intelligenza artificiale Germogliano i regaliun registro dei regali per i bambini e una domanda di Valutare eventuali elementi dalle foto.
L’intelligenza artificiale può certamente commettere errori e il suo lavoro dovrebbe essere controllato.
Allo stesso tempo, l’adozione diffusa ha portato nuovi inconvenienti, con persino gli utenti più esperti che si sentono a disagio nel parlare sui loro laptop. Gli uffici aperti e affollati non sono progettati per consentire a molte persone di parlare contemporaneamente ai propri computer.
“Mi piace il suono, ma non in ufficio”, ha detto uno. utente SU
McNamara usa le cuffie così la gente crede che sia impegnato in una chiamata.
“È come il mio social hack”, ha detto.
Sebbene sia troppo presto per dire se e quando la tastiera Qwerty seguirà l’obsolescenza dei registratori e dei fax, il passo verso la voce sta accelerando, ha affermato Dylan Fox, fondatore di Assembly AI con sede a San Francisco, che fornisce modelli vocali per le aziende.
“Siamo sicuramente all’inizio di quello che pensiamo sia un aumento da 10 a 100 volte della domanda di applicazioni e interfacce vocali e AI”, ha affermato.
Per il programmatore McNamara, parlare di più con i chatbot lo ha reso un amico migliore.
Era pessimo nel rispondere ai messaggi. Adesso torna subito dagli amici.
“Rispondo molto velocemente, quindi mi chiedono: ‘Chi è questo ragazzo?'”, ha detto.
Link alla fonte: www.latimes.com










