Nvidia esitteli maanantaina uuden tekoälymallin musiikin ja äänen tuottamiseen, joka pystyy muokkaamaan ääniä ja luomaan uudenlaisia ääniä – teknologia on suunnattu musiikin, elokuvien ja videopelien tuottajille.
Nvidia, maailman suurin tekoälyjärjestelmien luomiseen käytettävien sirujen ja ohjelmistojen toimittaja, kertoi ettei sillä ole välittömiä suunnitelmia julkaista teknologiaa julkisesti. Teknologiaa kutsutaan nimellä Fugatto, joka on lyhenne sanoista Foundational Generative Audio Transformer Opus 1.
Santa Clarassa, Kaliforniassa sijaitsevan Nvidian versio tuottaa äänitehosteita ja musiikkia tekstikuvauksen perusteella, mukaan lukien uudenlaisia ääniä, kuten trumpetin soittamista koiran haukunnan tapaan.
Mikä tekee siitä erilaisen muihin tekoälyteknologioihin verrattuna, on sen kyky ottaa vastaan ja muokata olemassa olevaa ääntä, esimerkiksi muuttamalla pianolla soitettu melodia ihmisäänellä lauletuksi, tai muuttamalla puhutun sanan äänityksen aksenttia ja mielialaa.
Nvidian uusi malli on koulutettu avoimen lähdekoodin datalla, ja yhtiö kertoi vielä pohtivansa, julkaiseeko ja miten se julkaisee sen julkisesti.
Generatiivisten tekoälymallien kehittäjät eivät ole vielä määrittäneet, miten estää teknologian väärinkäyttö, kuten käyttäjän luoma disinformaatio tai tekijänoikeuksien rikkominen tekijänoikeudella suojattujen hahmojen luomisen kautta.