Истражување: Асистентите за вештачка интелигенција прават огромни грешки во oдговорите

октомври 26, 2025

- Advertisement -

Водечките асистенти за вештачка интелигенција погрешно ја претставуваат содржината на вестите во речиси половина од нивните одговори, покажа истражување објавено во среда од страна на Европската радиодифузна унија (EBU) и BBC. Меѓународна студија анализирала три илјади одговори на вести поставени на најпопуларните асистенти за вештачка интелигенција – софтверски апликации кои користат вештачка интелигенција за да го разберат природниот јазик и да извршуваат задачи за корисникот.

Асистентите за вештачка интелигенција на 14 јазици биле оценети според критериумите за точност, цитирање на извори и способност за разликување на мислење од факт, вклучувајќи ги ChatGPT, Copilot, Gemini и Perplexity. Вкупно, 45 проценти од анализираните одговори на вештачката интелигенција содржеле барем една сериозна грешка, додека 81 процент имале некаков вид проблем, покажа истражувањето.

- Advertisement -

Ројтерс ги контактираше компаниите вклучени во анкетата за да побара нивен коментар за резултатите од анкетата. Gemini, асистентот за вештачка интелигенција на Google, претходно изјави на својата веб-страница дека ги поздравува повратните информации од корисниците за да може платформата да продолжи да се подобрува и да станува покорисна.

OpenAI и Microsoft претходно изјавија дека таканаречените „халуцинации“, ситуации во кои моделот на вештачка интелигенција генерира неточни или погрешни информации поради, на пример, недостаток на податоци, се проблем на кој активно работат на елиминирање. Perplexity на својата страница вели дека еден од неговите режими, наречен „Длабоко истражување“, има стапка на точност од 93,9 проценти за фактите.

- Advertisement -

Gemini на Google има најмногу проблеми со изворите

Една третина од одговорите на асистентите за вештачка интелигенција покажаа сериозни грешки во атрибуцијата, како што се недостаток на извори, погрешно или неточно атрибуирање, според анкетата. Дури 72 проценти од одговорите од Gemini, асистентот за вештачка интелигенција на Google, имаа значителни проблеми со изворите, во споредба со помалку од 25 проценти за сите други асистенти.
Проблеми со точноста беа пронајдени во 20 проценти од сите анализирани одговори, вклучително и случаи на застарени информации. Примерите наведени во истражувањето вклучуваат ситуација каде Gemini погрешно ги цитираше промените во законот за електронски цигари за еднократна употреба и случај каде ChatGPT продолжи да наведува дека тој е сегашниот папа неколку месеци по смртта на папата Франциск.

Во истражувањето учествуваа 22 јавни медиумски служби од 18 земји, вклучувајќи ги Франција, Германија, Шпанија, Украина, Велика Британија и САД. Бидејќи асистентите на вештачката интелигенција сè повеќе ги заменуваат традиционалните интернет пребарувачи во пристапот до вести, јавната доверба може сериозно да биде поткопана, предупреди ЕБУ.

- Advertisement -

„Кога луѓето повеќе не знаат во што можат да веруваат, тие завршуваат без да веруваат во ништо, а тоа може да го обесхрабри учеството во демократските процеси“, рече директорот за медиуми на ЕБУ, Жан Филип Де Тендер.

Вештачката интелигенција станува нов извор на вести, особено за помладите луѓе. Според Извештајот за дигитални вести на Институтот Ројтерс за 2025 година, околу седум проценти од сите корисници на интернет кои ги следат вестите и дури 15 проценти од оние под 25 години користат асистенти на вештачката интелигенција за да ги информираат за актуелните настани. Новиот извештај е повик до компаниите за вештачка интелигенција да бидат поодговорни и да го подобрат начинот на кој нивните асистенти одговараат на прашања поврзани со вестите.

(Index.hr)
Фото – Medium

Сподели!

- Advertisement -

Благојче Најдовски произведува трутово млеко – македонски иновативен пчелин продукт за здравје и сила!

Флуид Проект со иновативни енергетски решенија на Енерго Технома 2025: технологија што ја обликува одржливата иднина

Освој до 70% стипендија на Challenge day во Avenga Academy

Како бизнис дијагностиката го насочува иновативниот пат на компаниите? Примерот на Завар и ПОИНТПРО

Повик до стартапи за тестирање на рециклиран филамент за 3Д принтање

ШК Алкалоид по третпат до европската вицешампионска титула!

Благојче Најдовски произведува трутово млеко – македонски иновативен пчелин продукт за здравје и сила!

Градови во пластика: вистинската приказна зад “само едно шише”

ПроКредит Банка и ЕБОР одржаа настан посветен на генерациската транзиција во бизнисот – стратешки момент за секоја семејна компанија

Порше објави загуба од речиси една милијарда евра

Кина и САД започнаа нови трговски преговори

Белгија размислува за ограничување на потрошувачката на струја на центрите за податоци