Истражување: Асистентите за вештачка интелигенција прават огромни грешки во oдговорите

- Advertisement -

Водечките асистенти за вештачка интелигенција погрешно ја претставуваат содржината на вестите во речиси половина од нивните одговори, покажа истражување објавено во среда од страна на Европската радиодифузна унија (EBU) и BBC. Меѓународна студија анализирала три илјади одговори на вести поставени на најпопуларните асистенти за вештачка интелигенција – софтверски апликации кои користат вештачка интелигенција за да го разберат природниот јазик и да извршуваат задачи за корисникот.

Асистентите за вештачка интелигенција на 14 јазици биле оценети според критериумите за точност, цитирање на извори и способност за разликување на мислење од факт, вклучувајќи ги ChatGPT, Copilot, Gemini и Perplexity. Вкупно, 45 проценти од анализираните одговори на вештачката интелигенција содржеле барем една сериозна грешка, додека 81 процент имале некаков вид проблем, покажа истражувањето.

- Advertisement -

Ројтерс ги контактираше компаниите вклучени во анкетата за да побара нивен коментар за резултатите од анкетата. Gemini, асистентот за вештачка интелигенција на Google, претходно изјави на својата веб-страница дека ги поздравува повратните информации од корисниците за да може платформата да продолжи да се подобрува и да станува покорисна.

OpenAI и Microsoft претходно изјавија дека таканаречените „халуцинации“, ситуации во кои моделот на вештачка интелигенција генерира неточни или погрешни информации поради, на пример, недостаток на податоци, се проблем на кој активно работат на елиминирање. Perplexity на својата страница вели дека еден од неговите режими, наречен „Длабоко истражување“, има стапка на точност од 93,9 проценти за фактите.

- Advertisement -

Gemini на Google има најмногу проблеми со изворите

Една третина од одговорите на асистентите за вештачка интелигенција покажаа сериозни грешки во атрибуцијата, како што се недостаток на извори, погрешно или неточно атрибуирање, според анкетата. Дури 72 проценти од одговорите од Gemini, асистентот за вештачка интелигенција на Google, имаа значителни проблеми со изворите, во споредба со помалку од 25 проценти за сите други асистенти.
Проблеми со точноста беа пронајдени во 20 проценти од сите анализирани одговори, вклучително и случаи на застарени информации. Примерите наведени во истражувањето вклучуваат ситуација каде Gemini погрешно ги цитираше промените во законот за електронски цигари за еднократна употреба и случај каде ChatGPT продолжи да наведува дека тој е сегашниот папа неколку месеци по смртта на папата Франциск.

Во истражувањето учествуваа 22 јавни медиумски служби од 18 земји, вклучувајќи ги Франција, Германија, Шпанија, Украина, Велика Британија и САД. Бидејќи асистентите на вештачката интелигенција сè повеќе ги заменуваат традиционалните интернет пребарувачи во пристапот до вести, јавната доверба може сериозно да биде поткопана, предупреди ЕБУ.

- Advertisement -

Кога луѓето повеќе не знаат во што можат да веруваат, тие завршуваат без да веруваат во ништо, а тоа може да го обесхрабри учеството во демократските процеси“, рече директорот за медиуми на ЕБУ, Жан Филип Де Тендер.

Вештачката интелигенција станува нов извор на вести, особено за помладите луѓе. Според Извештајот за дигитални вести на Институтот Ројтерс за 2025 година, околу седум проценти од сите корисници на интернет кои ги следат вестите и дури 15 проценти од оние под 25 години користат асистенти на вештачката интелигенција за да ги информираат за актуелните настани. Новиот извештај е повик до компаниите за вештачка интелигенција да бидат поодговорни и да го подобрат начинот на кој нивните асистенти одговараат на прашања поврзани со вестите.

(Index.hr)
Фото – Medium

Сподели!
- Advertisement -