OpenAI on julkaissut merkittävän päivityksen GPT-4-Turbo AI-malliinsa, joka ylpeilee ”huomattavasti parannetuilla” kyvyillä vastausten luomiseen ja analysointiin.
Kyseinen paranneltu versio, joka sisältää AI-näkötekniikan visuaalisen, auditiivisen ja tekstimuotoisen sisällön ymmärtämiseen, on tällä hetkellä saatavilla vain kehittäjille. Kuitenkin OpenAI vakuuttaa, että nämä ominaisuudet tulevat pian integroitumaan ChatGPT:hen, tehden ne laajemman yleisön saataville.
Tämä merkitsee merkittävää kehitystä, sillä se on ensimmäinen kerta, kun GPT-4-Turbo visiotekniikalla tarjotaan ulkopuolisille kehittäjille. Mahdollisuudet ovat valtavat, luoden innovatiivisia sovelluksia muotiin, koodaukseen ja jopa pelaamiseen.
Päivitys laajentaa myös mallin tietojen katkaisupäivämäärää joulukuuhun 2023, heijastaen viimeisintä tietoa, jota se on koulutettu käyttämään. Aikaisemmin tämä katkaisupäivämäärä oli huhtikuussa 2023.
Mikä tarkalleen ottaen on GPT-4-Turbo?
GPT-4-Turbon ensisijainen tarkoitus liittyy kehittäjien työnkulun virtaviivaistamiseen heidän vuorovaikutuksessaan OpenAI:n mallin kanssa API:n kautta. Tämä päivitys poistaa tarpeen erillisille malleille teksti- ja kuvankäsittelyyn, mikä johtaa tehokkaampaan sovellusten luomiseen.
OpenAI kuvittelee lisäkehitystä ja näiden visioanalyysiominaisuuksien integrointia kuluttajille suunnattuihin sovelluksiin, kuten ChatGPT:hen. Tämä parantaa merkittävästi ChatGPT:n kykyä ymmärtää ja vastata visuaaliseen ja videoaineistoon.
Samoin Google on alkanut toteuttaa tätä lähestymistapaa Gemini Pro 1.5 -mallissaan, mutta tällä hetkellä pääsy on rajoitettu vain kehittäjille.
Yksi huomionarvoinen esimerkki GPT-4-Turbon reaalimaailman sovelluksesta on Cognition Labsin viraalinen koodaus-AI, Devin. Devinillä on huomattava kyky luoda monimutkaisia sovelluksia käyttäjän antamien vihjeiden perusteella.
GPT-4-Turbon potentiaali
Vaikka GPT-4 on kohdannut haasteita verrattuna uudempiin malleihin, kuten Claude 3 Opus ja Googlen Gemini, nämä päivitykset pyrkivät kurottamaan kuilua umpeen. GPT-5:n julkaisuun saakka parannukset tarjoavat kehittäjille ja yrityskäyttäjille arvokkaita uusia toiminnallisuuksia.
Päivitys säilyttää 128 000 merkin kontekstirajapinnan, mikä vastaa suunnilleen 300-sivuisen kirjan määrää ja riittää useimpiin käyttötapauksiin. Huomattavaa on, että OpenAI on aikaisemmin keskittynyt ääni- ja tekstimuotojen lisäksi myös videoiden analysointiin ja ymmärtämiseen ChatGPT:ssä. Tämä päivitys laajentaa videoiden ymmärtämiskyvyn mahdollisuuksia laajemmalle käyttäjäkunnalle.
Tulevaisuudessa ChatGPT:n käyttäjät saattavat pystyä lataamaan lyhyitä videoleikkeitä ja saamaan AI:n luomia tiivistelmiä tai avainhetkien erotteluja. Tämä merkitsee merkittävää edistysaskelta tekoälyn maailmassa, ja GPT-4-Turbon odotettu saapuminen ChatGPT:hen avaa jännittäviä mahdollisuuksia.
Lähde: tom's guide