Интервју со Томе Ефтимов од Струмица, научник број еден за вештачка интелигенција во Словенија!

- Advertisement -

Томе Ефтимов e научник од Македонија кој во моментов работи на Институтот „Јожеф Стефан“ во Љубљана и е на врвот на листата на најдобро рангираните научници во областа на вештачката интелигенција во оваа земја. Ефтимов дипломирал на Факултетот за електротехника и информациски технологии, магистрирал на ФИНКИ, докторирал на Институт „Јожеф Стефан“, а постдокторски студии комплетирал на престижниот Стенфорд универзитет во САД. Во 2020 година се враќа во Љубљана на истиот Институт каде денес работи интензивно со свој истражувачки тим.

Томе во 2018 година бев прогласен за млад научник на годината во Македонија. Тој беше учесник на неодамна завршениот Самит на Македонија 2025 во Скопје, каде и го направивме овој инспиративен разговор за Иновативност.

- Advertisement -

Новинар – Верица Јорданова

Томе, твојата специјалност е вештачката интелигенција, тема којашто овој период е особено актуелна?

- Advertisement -

Точно, мојата специјалност е вештачката интелигенција. Отсекогаш многу сум сакал математика и моја прва љубов се математиката и физиката. Меѓутоа, потоа се одлучив за студии на Факултетот за електротехника и информациски технологии, кои всушност може да се сведат на применета физика. За да бидеш добар инженер во вештачка интелигенција мора да ги познаваш законите на веројатност и статистика, добро владеење на математичките закони од кои посебно би издвоил линеарна алгебра. Кога отидов на докторат работев обработка на текстуални податоци или „natural languagе processing“, како посебен дел од вештачка интелигенција. Тие податоци претежно беа фокусирани на храна и исхрана, односно како преку описот на рецепти да дознаеме дали некоја храна или некој нутриент (хемиска компонента) во таа храна е добар или не за одредена болест. Ова е важно затоа што сите бази на податоци кои се користат во клиниките се многу стари и не се ажурирани. Докторите се водат по тие податоци и не знаат што доаѓа со новите истражувања. На пример, ние како луѓе не можеме да прочитаме 1.000 трудови во еден ден, a вештачката интелигенција ни помага во тоа. Не е 100% точна, но тоа што е добро е што според нашата процена, околу 80% од резултатите се точни. Еден доста застапен пример во биомедицина на кој јас сум работел е предвидување на дијагноза на пациент земајќи ги предвид неговите претходни дијагнози и терапии. Градејќи модели каде краен корисник е човекот не треба да го заборавиме и етичкиот фактор дека резултатите од овие модели може да дојдат до лажни дијагнози, па затоа најдобро е да бидат достапни најпрво до здравствените работници, на кои би им помогнеле во донесувањето на крајната дијагноза. Тоа е еден пример на human centric model на вештачката интелигенција во кој човекот е дел од процесот на учење.

Сега сите зборуваат за ChatGPT. Toa e јазичен модел. Кога работиме на такви модели најголем проблем се податоците над кои таа архитектура се тренира. На пример, ако сега го прашаме ChatGPT прашања поврзани со биомедицина, ние ќе го добиеме точниот одговор ако тие резултати од истражувања се достапни и јавно објавени. Моделот во суштина работи добро за некои погенерални области, но за постручни прашања одговорот најчесто ќе биде неточен.

- Advertisement -

Друг важен аспект во нашата работа во областа на биомедицината е приватност на податоци, бидејќи медицински податоци се многу осетливи и мора да бидат заштитени. Не смееме да го видиме ни самиот датум кога е направена посетата кај доктор, бидејќи тоа води кон откривање на идентитетот на пациентот. За таа цел, најпрво податоците мора да поминат низ процес наречен „аномизација.“ Следен чекор е самата средина каде што се извршуваат експериментите од вештачка интелигенција да биде високо заштитена бидејќи имаме многу осетливи податоци. Во текот на мојата работа на Стенфорд никогаш немавме право да пристапиме и да ги анализараме медицинските електронските записи на свој компјутер, туку пристапувавме само на високо заштитени сервери (high computational environment). Резултатите секогаш моравме да ги сумираме за целата популација и пред да користиме некоја слика за некое истражување или труд, моравме да го консултираме одборот за етика дали ќе го дозволи тоа.

Во моментов сте еден од водечките научници во Словенија на полето на вештачката интелигенција. Во која област најмногу работите?

Најчесто со тимот со кој соработувам сме активни во две области. Една од нив е машинско учење над податоци од стохастична оптимизација што е многу блиску до она што се нарекува АutoML. Главната цел е да го најдеме најдобриот алгоритам од оптимизација или машинско учење кој ќе биде ефикасен за новите податоци што ќе се појават во иднина.

Другата област која претежно ја работиме е да предвидиме дали некоја храна предизвикува одредена болест или дали некој храна може да се користи за лекување на некоја болест. Тоа го правиме со помош на методи на обработка на природни јазици.

Неодамна сте дел и од еден стартап којшто исто така применува вештачка интелигенција но во друга областKaжете ни повеќе?

Да, идејата за примена на вештачката интелигенција во човечки ресурси дојде од моја другарка од средно образование Божанка Витанова (CEO на ТeamLift) која живее и работи во САД. Дојдовме на идеја дека вештините кои ги поседуваат вработените во компанија не се во нивната биографија (CV), туку во нивното искуство. На пример, еден човек можеби е електроинженер по едукација, но работел друга работа и по десет години тој нема вештини на електроинженер.

Го креиравме стартапот TeamLift со седиште во Њујорк. Станува збор за дистрибуиран тим во Европа и Америка, од кои поголем дел се луѓе родени во Македонија.

Какви услуги всушност нудите?

Стартапот може да го гледаме од два различни аспекти. Еден од најголемите проблеми е што менаџерите, особено на поголемите компании, не знаат кои се вештините на своите вработените. Ние им нудиме алатка која ги наоѓа вештини на вработените врз основа на нивните активности кои се репортирани во систем за менаџирање на активности. Покрај тоа што алатката нуди можност за наоѓање на вештините на секој вработен истовремно нуди можност да го оцени и нивото на експертиза каде повеќе мултимодални фактори се земени предвид. Тоа е многу битно особено кога се почнува нов проект затоа што менаџерот може да ги избере членовите на тимот според вештините кои се неопходни за успех на проектот. Ние практично идентификуваме множества на вештини базирани на искуството, а не на образованието. Од друга страна, алатката секогаш гарантира дека вработените ќе имаат ажурирана биографија врз основа на нивното искуство.

Како оди засега? Имате ли доста клиенти?

Ние сме млад стартап, инвеститорите ни се исклучиво од Силиконската долина, а неодамна ги добивме и првите клиенти.

Гледано од стручен аспект, дали CHAT GPT кој е многу популарен му прави штета или добро на човештвото?

Му прави добро. Ќе ви дадам еден пример. Додека бев PhD студент и кога требаше да визуализирам податоци го користев програмскиот јазик R. Користејќи една библиотека, никогаш не успеав да го средам кодот за визуализација, што беше доста демотивирачки. Пред една недела го прашав ChatGPT и тој ми даде цел код. Јас само ги внесов моите податоци и ја добив визуализацијата што ја сакав. Она што сакам овде да го напоменам е дека со користење на модели како ChatGPT, процесот на доаѓање до самиот резултат може многу да се забрза. На крај од денот она што е битно е дали ги имаме резултатите. Еден начин да ги добиеме е да го пребаруваме Google како може истото да го направиме и да ни одземе недела дена работа или да користиме модели што би ни го дале одговорот во секунди. Она што е битно е да знаеме што сакаме да направиме и да ги прашаме вистинските прашања. Но, никогаш нема да се случи еден модел за вештачка интелигенција да ја замени работата на луѓето, ова е особено јасно на луѓе кои имаат академско искуство во вештачка интелигенција.

Од друга страна, кога зборуваме за ChatGPT моментално зборуваме како за аватар. Некој ќе каже дека го прашал ChatGPT за развој на iOS апликација и за еден ден ја направил. Не е точно дека ChatGPT ја направил апликацијата затоа што концептот, идејата е на човекот. Човекот само е доволно способен да го искористи ChatGPT. Наместо да губи месеци за да истражува и да бара кодови како да ја направи апликацијата, го прашува ChatGPT или останатите large language models, кој му прави резиме на сите достапни информации и му го дава кодот. Тоа не е крадење на работа, туку кратење на времето за човекот да заврши некоја работа. Концептот, знаењето сепак е на човекот. ChatGPT е само аватар кој ви овозможува да бидете поефикасни во работата.

Може ли да сумираме кои се предностите за човештвото од усовршувањето на вештачката интелигенција?

Од академска гледна точка тоа што теориски го работиме е кои ќе бидат најдобрите модели за во иднина. Секој модел има свои параметри кои влијаат на ефикасноста на моделот. Паметно избрани параметри водат кон добар модел. Ние се залагаме параметрите на моделот динамично да се менуваат со текот на времето додека самиот модел се учи од податоците. Така што очекувам дека во иднина ќе има уште подобри резултати најпрвин од гледна точка на машинското учење, кои подоцна ќе придонесат и до подобри апликации. Очекувам дека во иднина ќе имаме уште подобри модели имајќи ги предвид компјутерски ресурси кои ни се достапни.

Друг аспект е поврзан со количината на податоци за учење. Она во што верувавме е концептот на Big Data. Меѓутоа денес она што е многу побитно е наместо голема количина на податоци да имаме статистичко репрезентативни податоци па макар и да е мала количина. Постојат индустрии што не можат да си дозволат големи количини на податоци, особено индустрии поврзани со експерименти каде анализите се доста скапи. Одиме во насока како да имаме подобри модели не само ако имаме голема количина податоци, туку да ги искористиме малите количини податоци. Очекувам дека во иднина многу ќе се зборува на таа тема затоа што од ова зависи прецизноста на еден модел и неговата воопштување на нови податоци во иднина.

Од аспект на примената на вештачката интелигенција можам да ви кажам дека кога размислуваме за вештачката интелигенција во индустријата пред сè треба да бидеме свесни за една работа – кој е крајниот корисник. Ако е биомедицина мора да бидеме многу внимателни, ако е општ домен можеме да си дозволиме некоја поголема флексибилност. Мислам дека вклучувајќи етичките принципи при моделирањето се многу битни за да се добијат резултати кои ќе донесат доверба кај крајниот корисник.

Како последен коментар можам да го кажам следното. Зборуваме постојано за климатски промени. Една од новите насоки кои во следните пет години сигурно ќе биде актуелна е Green AI или зелена вештачка интелигенција, што значи дека во иднина e многу битен фактот колку енергија се троши при тренирање на модел и какво влијание има тој процес врз околината.

Сподели!
- Advertisement -