Ko GPT-4 Vision sreča ElevenLabs, dobimo umetnega Davida Attenborougha

Slo-Tech
Avtor Matej Huš   
nedelja, 19. november 2023 ob 20:11
Tehnologija obstaja že nekaj časa, a šele ko združimo njene različne pojavne oblike, postane zares jasno, česa je sposobna. Charlie Holtz je na X-u pokazal, kako je združil GPT-4 Vision, ki ustvari besedilni opis vizualnih podob, in tehnologija za kloniranje glasu ElevenLabs. Spisal je skripto, ki vsakih pet sekund zajame posnetek z njegove kamere, ga prek API posreduje GPT-4 Vision, nato pa besed...

Opozorilo: Po 297. členu Kazenskega zakonika je posameznik kazensko odgovoren za javno spodbujanje sovraštva, nasilja ali nestrpnosti.


Vpišite prikazane znake


 

Google Translate

English Croatian French German Italian Spanish Serbian Slovenian Hungarian