Teknologiajätti OpenAI on ottanut merkittävän askeleen kohti entistä luonnollisempia ja inhimillisempää tuntuisia tekoälyvuorovaikutuksia. Yhtiö on aloittanut ChatGPT:n Advanced Voice Mode -ominaisuuden rajoitetun julkaisun, joka tuo käyttäjille mahdollisuuden kokea hyperrealistisia äänivasteita.
Alkuvaiheessa ominaisuus on saatavilla vain osalle ChatGPT Plus -tilaajista, mutta OpenAI aikoo laajentaa sen käyttöä kaikkiin Plus-käyttäjiin syksyllä 2024.
ChatGPT:n äänimaailman kehitys on ollut täynnä käänteitä. Aiemmin esitelty ääni herätti huomattavaa huomiota ja kritiikkiä, sillä se muistutti hämmästyttävästi näyttelijä Scarlett Johanssonin ääntä. Tämä johti oikeudellisiin kysymyksiin ja lopulta äänen poistamiseen.
Uusi, OpenAI:n mukaan parannetuista turvallisuustoimista varustettu ääni hyödyntää GPT-4o-mallia, joka mahdollistaa monimuotoisen käsittelyn. Tämä tarkoittaa, että malli voi käsitellä sekä ääntä että tekstiä samanaikaisesti, mikä johtaa nopeampiin ja sujuvampiin vuorovaikutuksiin. Lisäksi malli pystyy havaitsemaan puhujan tunteita, kuten surun, innostuksen tai jopa laulun.
OpenAI on kuitenkin varovainen uuden teknologian käyttöönotossa. Ominaisuus julkaistaan vaiheittain, jotta yhtiö pystyy seuraamaan tarkasti sen käyttöä ja vaikutuksia. Lisäksi äänivaihtoehdot on rajoitettu neljään esiasetettuun ääneen, jotka on luotu yhteistyössä ammattilaisten kanssa. Tämä on yksi OpenAI:n toimenpiteistä välttääkseen syväväärennösten ja tekijänoikeusriitojen aiheuttamia ongelmia.
Tekoälyn kehitys on herättänyt myös huolta yksityisyydestä ja eettisistä kysymyksistä. OpenAI:n pyrkimys läpinäkyvyyteen ja turvallisuuteen on tärkeä askel luottamuksen rakentamisessa käyttäjien kanssa. Kuinka tämä uusi äänimaailma vaikuttaa tulevaisuuden vuorovaikutukseen, onkin mielenkiintoinen seurata.