Тешко е да се игнорира заканата што вештачката интелигенција ја претставува за нашите работни места. Безброј работни места веќе се укинати со напредокот на технологијата, а некои од највлијателните личности во индустријата признаа дека само одредени работни места ќе бидат безбедни од револуцијата.
Неодамна некои поранешни инсајдери во вештачката интелигенција дури предупредија дека луѓето треба да ја прифатат вештачка интелигенција или да умрат, а извршниот директор на Tesla, Илон Маск, истакна дека содржината генерирана од вештачка интелигенција се произведува со брзина што сега го надминува човечкиот напис.
Сега, се чини дека е само прашање на време кога технологијата ќе го надмине човечкото знаење. За неколку месеци, вештачката интелигенција би можела да биде подготвена да постигне совршен резултат на една од најсложените проценки на знаење некогаш создадени, предупредуваат експертите.
Последниот испит на човештвото (HLE) е создаден од истражувачи во Scale и Центарот за безбедност на вештачката интелигенција, непрофитна организација. Целта на тестот е да се открие колку се интелигентни системите за вештачка интелигенција и дали постои значаен јаз во знаењето и расудувањето на технологијата.
Испитот се состои од 2.500 внимателно одбрани прашања, кои опфаќаат приближно сто теми: од ракетна наука и митологија до физиологија и напредна математика.
Секое прашање бара барем разбирање на ниво на докторат за правилно одговарање, а постигнувањето резултат близу 100 проценти ефикасно би ја заработило титулата „универзален експерт“.
Пред две години, ChatGPT на OpenAI постигна само 3 проценти на испитот. Системите на Google и Anthropic се покажаа малку подобро, а истражувачите ги посочија резултатите како доказ дека сè уште постои „значаен јаз“ помеѓу големите јазични модели и водечките светски академици.
На последниот тест Gemini на Google постигна 45,9% на испитот, што е огромен скок од 18,8 проценти што ги забележа во рок од неколку месеци од првиот обид. Anthropic, пак, постигна резултат од 34,2 проценти на HLE, уште едно подобрување од првиот обид на испитот.
„Сакавме да создадеме овој затворен академски репер, поставен на границата на експертите, што само неколку луѓе на Земјата навистина можат да го решат. Во текот на изминатите неколку години видовме луд напредок на овие јазични модели. Импресивно е, креаторите на модели навистина направија одлична работа во подобрувањето на овие модели на расудување.“ рече Калвин Жанг, раководител на истражувањето во Scale, компанијата за вештачка интелигенција зад HLE
Кејт Олшевска, менаџер за производи во Google DeepMind, додаде: „Ако навистина ни беше грижа за ова како единствено нешто во животот, мислам дека би можеле да стигнеме до тоа доста брзо.“
Ако во иднина вештачката интелигенција постигне 100-процентен резултат на HLE, следниот чекор би вклучувал тестирање на технологијата на прашања на кои ниту еден човек во моментов не го знае одговорот.
Но, токму таму се движат програмерите, според Олшевска. Жанг тврди дека човечкиот допир секогаш ќе биде потребен, особено во областите што зависат од донесување одлуки, проценка и креативност.
(Unilad Tech)






























