OpenAI julkistaa uuden tekoälytyökalun syvätutkimukseen Kommentit pois päältä artikkelissa OpenAI julkistaa uuden tekoälytyökalun syvätutkimukseen

OpenAI on julkistanut uuden -”agentin”, joka on suunniteltu auttamaan ihmisiä tekemään syvällistä ja monimutkaista tutkimusta -alustalla. Uusi ominaisuus on nimetty osuvasti nimellä ”deep research” (syvätutkimus).

Yhtiön sunnuntaina julkaisemassa blogikirjoituksessa kerrottiin, että tämä uusi ominaisuus on suunniteltu ”ihmisille, jotka tekevät intensiivistä tietotyötä rahoituksen, tieteen, politiikan ja tekniikan aloilla ja tarvitsevat perusteellista, tarkkaa ja luotettavaa tutkimusta.” Yrityksen mukaan työkalusta voi olla hyötyä myös kuluttajille, jotka tekevät huolellista tutkimusta vaativia hankintoja, kuten autoja, kodinkoneita tai huonekaluja.

ChatGPT deep research on tarkoitettu tilanteisiin, joissa käyttäjä ei halua vain nopeaa vastausta tai yhteenvetoa, vaan tarvitsee perusteellista tiedon analysointia useista verkkosivustoista ja muista lähteistä.

Saatavuus ja rajoitukset

OpenAI tuo ominaisuuden välittömästi ChatGPT Pro -käyttäjien saataville 100 kuukausittaisella kyselyllä. Plus- ja Team-käyttäjät saavat ominaisuuden käyttöönsä seuraavaksi, minkä jälkeen se tulee Enterprise-asiakkaiden saataville. Plus-version julkaisu on suunniteltu noin kuukauden päähän, ja maksaville käyttäjille asetettujen kyselyrajoitusten luvataan olevan ”merkittävästi korkeampia” lähitulevaisuudessa.

Palvelu ei ole vielä saatavilla Isossa-Britanniassa, Sveitsissä eikä Euroopan talousalueella.

Toiminnallisuus ja kehityssuunnitelmat

Deep research -toiminto on tällä hetkellä käytettävissä vain verkkoselaimen kautta, ja mobiili- sekä työpöytäsovellusintegraatiot ovat tulossa myöhemmin tässä kuussa. Käyttäjät voivat liittää kyselyihinsä tiedostoja ja taulukoita. Vastauksen saaminen voi kestää 5-30 minuuttia.

Tällä hetkellä tulokset ovat vain tekstimuodossa, mutta OpenAI suunnittelee lisäävänsä pian upotettuja kuvia, datavisualisointeja ja muita analyyttisia tuotoksia. Suunnitelmissa on myös mahdollisuus yhdistää ”erikoistuneempia tietolähteitä”, mukaan lukien tilauspohjaiset ja sisäiset resurssit.

Tarkkuus ja rajoitukset

OpenAI myöntää, että ChatGPT deep research -työkalulla on rajoituksensa. Se voi tehdä virheitä ja vääriä päätelmiä, ja sillä voi olla vaikeuksia erottaa luotettavaa tietoa huhuista. Työkalu ei myöskään aina ilmaise epävarmuuttaan asioista ja voi tehdä muotoiluvirheitä raporteissa ja lähdeviitteissä.

Parantaakseen tarkkuutta OpenAI käyttää erityisversiota uudesta o3-”päättely”-tekoälymallista, joka on koulutettu vahvistusoppimisen avulla. Malli saavutti 26,6 prosentin tarkkuuden Humanity's Last Exam -arvioinnissa, mikä on huomattavasti parempi tulos kuin kilpailijoilla, kuten Gemini Thinking (6,2 %) ja Grok-2 (3,8 %).

Mielenkiintoista on, että Google julkisti vastaavanlaisen tekoälyominaisuuden samalla nimellä alle kaksi kuukautta sitten.

Maailman ensimmäinen täysin itsenäinen tekoälyagentti esiteltiin Kiinassa Kommentit pois päältä artikkelissa Maailman ensimmäinen täysin itsenäinen tekoälyagentti esiteltiin Kiinassa

Kiinalaiset ohjelmistoinsinöörit ovat kehittäneet tekoälyagentin, jota he kutsuvat ”maailman ensimmäiseksi” täysin itsenäiseksi tekoälyksi. -niminen tekoälyagentti pystyy suorittamaan monimutkaisia tehtäviä itsenäisesti ilman ihmisen ohjausta.

Toisin kuin tekoälybotit kuten , Googlen Gemini tai Grok, jotka tarvitsevat ihmisen syötettä toimiakseen, Manus voi tehdä päätöksiä ja suorittaa tehtäviä itsenäisesti. Tekoälyagentti ei siis välttämättä odota ohjeita tehdäkseen jotain.

Jos käyttäjä esimerkiksi pyytää ”Etsi minulle asunto”, Manus voi tehdä tutkimusta, arvioida useita tekijöitä (kuten rikollisuustilastoja, säätä ja markkinatrendejä) ja tarjota räätälöityjä suosituksia.

Yhden tekoälymallin sijaan Manus toimii kuin johtaja, joka hallinnoi useita erikoistuneita aliagentteja. Tämän ansiosta se voi käsitellä monimutkaisia, monivaiheisia työnkulkuja saumattomasti.

Lisäksi tekoälyagentti voi työskennellä asynkronisesti eli suorittaa tehtäviä taustalla ja ilmoittaa käyttäjille vain, kun tulokset ovat valmiita, ilman jatkuvaa ihmisen valvontaa.

Tämä on merkittävä kehitysaskel, sillä useimmat tekoälyt ovat tähän asti olleet vahvasti riippuvaisia ihmisten aloittamista tehtävistä. Manus edustaa siirtymistä kohti täysin itsenäistä ä, mikä herättää sekä innostavia mahdollisuuksia että vakavia huolia työpaikkojen katoamisesta ja vastuukysymyksistä.

Mielenkiintoista on, että Manus ilmestyy vain hieman yli vuosi DeepSeekin julkaisun jälkeen vuonna 2023. DeepSeekiä pidetään laajalti Kiinan tekoälyn ”Sputnik-hetkenä”.

Joidenkin mielestä Manuksen ilmaantuminen haastaa käsityksen, että Yhdysvallat olisi kiistaton johtaja kehittyneessä tekoälykehityksessä. Se viittaa siihen, että Kiina on saavuttanut ja mahdollisesti ohittanut kilpailijansa kehittämällä aidosti itsenäisiä tekoälyagentteja.

Manus ei ole tiimille pelkkä älyllinen saavutus, vaan sillä voi olla kriittisiä todellisen maailman sovelluksia, mukaan lukien rekrytointi. Tässä roolissa Manus voi itsenäisesti analysoida ansioluetteloja, ristiinviitata työmarkkinatrendejä ja tuottaa optimaalisia palkkauspäätöksiä, täydellisine analyyseineen ja raportteineen.

Toinen mielenkiintoinen sovellus voisi olla ohjelmistokehitys, jossa Manuksen kaltaiset agentit voivat nopeasti rakentaa ammattimaisen verkkosivuston alusta alkaen. Agentti voi myös kerätä tarvittavat tiedot sosiaalisesta mediasta, ottaa verkkosivuston käyttöön ja ratkaista itsenäisesti teknisiä ylläpito-ongelmia.

Toisin kuin muut tunnetut tekoälyt, Manus voisi edustaa todellista uhkaa ihmistyöntekijöille, koska se pystyy korvaamaan heidät eikä vain tehostamaan heidän työtehoaan. Tämä herättää ongelmallisia eettisiä ja sääntelykysymyksiä sen käytöstä.

Mahdollisen massiivisen työttömyyden lisäksi herää kysymys, kuka olisi vastuussa, jos tekoäly tekee itsenäisesti kalliin virheen. Sääntelyviranomaiset ympäri maailmaa eivät ole tällä hetkellä valmiita käsittelemään täysin itsenäisiä tekoälyagentteja.

Piilaakson johtavat teknologiayritykset ovat perinteisesti olettaneet, että ne hallitsevat tekoälyä asteittaisten parannusten avulla. Manus täysin itsenäisenä järjestelmänä muuttaa pelikenttää ja herättää pelkoja siitä, että Kiina saattaa saavuttaa merkittävän edun tekoälyyn perustuvilla toimialoilla.

.

OpenAI julkaisee GPT-4.5-kielimallin – suorituskyky ja kustannukset herättävät kysymyksiä Kommentit pois päältä artikkelissa OpenAI julkaisee GPT-4.5-kielimallin – suorituskyky ja kustannukset herättävät kysymyksiä

OpenAI ilmoitti torstaina julkaisevansa GPT-4.5-kielimallin, joka tunnettiin aiemmin koodinimellä Orion. GPT-4.5 on yhtiön tähän mennessä suurin malli, jonka kouluttamisessa on käytetty enemmän laskentatehoa ja dataa kuin missään aiemmissa julkaisuissa.

Pro -palvelun tilaajat, jotka maksavat 200 dollaria kuukaudessa, saavat pääsyn GPT-4.5-malliin ChatGPT:ssä torstaina alkaen osana tutkimusesittelyä. Myös OpenAI:n API:n maksullisten tasojen kehittäjät voivat käyttää GPT-4.5:ttä tästä päivästä alkaen. Muut ChatGPT:n käyttäjät, kuten ChatGPT Plus- ja ChatGPT Team -tilaajat, saavat mallin käyttöönsä ensi viikolla.

Alkuperäisessä julkaisussaan OpenAI totesi, ettei se pidä GPT-4.5:ttä ”huippuluokan tekoälymallina”, mutta yhtiö poisti tämän maininnan valkopaperista tunteja julkaisun jälkeen.

Parannuksia ja rajoituksia

GPT-4.5:n suurempi koko on tuonut sille OpenAI:n mukaan ”syvempää tietoa maailmasta” ja ”korkeampaa tunneälyä”. Kuitenkin merkkejä viittaa siihen, että tiedon ja laskentatehon lisäämisestä saatavat hyödyt alkavat tasaantua. Monissa tekoälyn vertailutesteissä GPT-4.5 jää kiinalaisen DeepSeekin, Anthropicin ja jopa OpenAI:n omien ”päättelymallien” taakse.

OpenAI korostaa, että GPT-4.5 ei ole tarkoitettu korvaamaan GPT-4o:ta, joka on yhtiön pääasiallinen malli API:ssa ja ChatGPT:ssä. Vaikka GPT-4.5 tukee toimintoja kuten tiedostojen ja kuvien lataamista sekä ChatGPT:n canvas-työkalua, siltä puuttuu tällä hetkellä tuki esimerkiksi ChatGPT:n realistiselle kaksisuuntaiselle äänitilalle.

Korkeat kustannukset

GPT-4.5 on myös erittäin kallis käyttää, kuten OpenAI myöntää – niin kallis, että yhtiö kertoo arvioivansa, jatkaako se mallin tarjoamista API:ssaan pitkällä aikavälillä. API:n käyttäjiltä OpenAI veloittaa 75 dollaria jokaisesta miljoonasta input-tokenista (noin 750 000 sanaa) ja 150 dollaria jokaisesta miljoonasta output-tokenista. Vertailun vuoksi GPT-4o maksaa vain 2,50 dollaria miljoonalta input-tokenilta ja 10 dollaria miljoonalta output-tokenilta.

Tekoälyn koulutuksen tulevaisuus

OpenAI väittää, että GPT-4.5 on ”ohjaamattoman oppimisen eturintamalla”. Mallin rajoitukset kuitenkin näyttävät vahvistavan asiantuntijoiden arviot siitä, että koulutuksen ”skaalauslait” eivät enää päde samalla tavalla kuin aiemmin.

OpenAI:n perustaja ja entinen tieteellinen johtaja Ilya Sutskever totesi joulukuussa, että ”olemme saavuttaneet datakoulutuksen huipun” ja että ”esikoulutus sellaisena kuin sen tunnemme tulee ehdottomasti päättymään”.

Tekoälyala on vastannut näihin haasteisiin omaksumalla päättelymallit, jotka suoriutuvat tehtävistä hitaammin mutta johdonmukaisemmin kuin perinteiset mallit. OpenAI suunnittelee lopulta yhdistävänsä GPT-sarjan mallit ”o”-päättelysarjaan, alkaen GPT-5:stä myöhemmin tänä vuonna.