di LUCA CONSIGLIO
Open AI presenta Sora un modello text-to -video (ancora in beta) che è in grado di generare video della durata massima di un minuto mantenendo la qualità visiva e l’aderenza alle richieste dell’utente.
Oggi, questo programma sta diventando disponibile per alcuni team per valutare i danni e rischi. Si sta anche concedendo l’accesso a un certo numero di artisti visivi, designer e registi per ottenere feedback su come far progredire il modello in modo che sia più utile per i professionisti creativi (quindi anche al di fuori di Open AI).
Sora è in grado di generare scene complesse con più personaggi, tipi di movimento specifici e dettagli accurati del soggetto e dello sfondo. Il modello comprende non solo ciò che l’utente ha chiesto nel prompt, ma anche il modo in cui tali cose esistono nel mondo fisico, ha una profonda comprensione del linguaggio, che gli consente di interpretare accuratamente i suggerimenti e generare caratteri avvincenti che esprimono emozioni oltre ad un ottimo stile visivo.
Come ogni nuovo progetto non è esente da difetti: potrebbe avere difficoltà a simulare accuratamente la fisica di una scena e non comprendere casi specifici di causa ed effetto e un esempio è una persona potrebbe dare un morso a un biscotto, ma in seguito il biscotto potrebbe non avere un segno di morso oppure non comprendere bene un prompt e girare una scena leggermente diversa da come descritta.
Si sta adottando un sistema di sicurezza come ad esempio il classificatore di testo che controllerà e rifiuterà le richieste di input di testo che violano le politiche di utilizzo, come quelle che richiedono violenza estrema, contenuti sessuali, immagini che incitano all’odio, somiglianza con celebrità o ip di altri. Hanno anche sviluppato solidi classificatori di immagini che vengono utilizzati per esaminare i fotogrammi di ogni video generato per garantire che rispetti le norme di utilizzo, prima che venga mostrato all’utente.
Verranno coinvolti responsabili politici, gli educatori e gli artisti di tutto il mondo per comprendere le loro preoccupazioni e identificare casi d’uso positivi per questa nuova tecnologia. Nonostante ciò non si saprà comunque come verrà usato il prodotto in modo vantaggioso o in modo abusivo per questo si sta cercando di migliorarlo il più possibile.
Come ogni cosa positiva tuttavia ce n’è una molto negativa: si teme per il posto di lavoro, tante persone non lavoreranno più, gli studi non serviranno a molto visto che si dovrà studiare solo tecnologia e pochi altri argomenti senza contare pure il pessimo stato di salute del settore video-ludico con quasi 10.000 licenziamenti nel 2023 e il settore dei videogiochi iniziato nel 2024 nello stesso modo.
Comment here