Иновативна платформа што го претвора говорот на македонски јазик во пишан текст со помош на вештачка интелигенција!

- Advertisement -

„Буки“ е нова платформа базирана на вештачка интелигенција која го транскрибира говорот во пишуван текст на македонски јазик. Новата алатка ја креираа Дејан Порјазовски, експерт за технологии на вештачка интелигенција за препознавање говор од Универзитетот „Аалто“ во Финска, проф. д-р Никола Стиков, професор по биомедицински инженеринг на Политехничката школа при Универзитетот во Монтреал, проф. д-р Ордан Чукалиев, проректор за меѓународна соработка на УКИМ и проф. д-р Илина Јакимовска од Институтот за етнологија и антропологија на ПМФ, во рамките на Центарот за напредни интердисциплинарни истражувања при УКИМ.

Во интервју за Иновативност, еден од авторите, Дејан Порјазовски го опишува начинот на креирање на алатката, нејзините функциооналности, како и плановите за нејзино усовршување.

- Advertisement -

Разговараше – Сања Наумовска

Г-дин Порјазовски, вие бевте дел од тим што разви нова платформа базирана на вештачка интелигенција „Буки“ за траскрипција на говор на македонски јазик во текст. Може ли да ни кажете повеќе детали за процесот на креирање на плaтформата?

- Advertisement -

Иницијативата за создавање на модел за препознавање на македонски говор ја покрена Никола Стиков. Пред речиси една година тој ме контактираше во врска со тоа што сѐ е потребно за развивање на една таква апликацијата и дали јас би се нафатил на такво нешто. Тој ми објасни дека веќе контактирал со Илина Јакимовска, директорка на Институтот за етнологија и антропологија. Јакимовска се согласи да нѝ даде пристап до дел од архивата на институтот, која што содржи транскрибирани аудио материјали на различни македонски дијалекти. Со пристапот до овие податоци се отвори можноста за развивање на платформата.

Процесот за развивање на „Буки“ моделите беше координиран со помош на Ордан Чукалиев, директор на Центарот за напредни интердисциплинарни истражувања (ЦеНИИс) на УКИМ. Развојот на моделите траеше некаде од почетокот на август до средината на октомври 2024 година. Најголем предивзик за развивање на овие модели беше во делот на припремањето на податоците за тренинг, што нѝ одзема најмногу време.

- Advertisement -
Дејан Порјазовски

Кои беа целите што сакавте да ги постигнете што ве мотивираа да започнете со работа на еден ваков проект?

Многу македонски институции имаат илјадници часови на аудио материјал. Тој материјал, доколку не е транскрибиран, е многу тешко да се пребарува. Моделите „Буки“ нѝ овозможуваат овие снимени материјали да бида транскрибирани, а со тоа и подобро архивирани и зачувани. Освен тоа, оваа платформа ќе им овозможи на луѓето со попреченост да можат полесно да пишуваат и да користат компјутер.

Каде го гледате најголемиот бенефит од постоењето на „Буки“?

Најголемиот бенефит во постоењето на „Буки“ моделите е во тоа што се бесплатни и со отворен код. Тоа значи дека секој што сака да ги користи ќе има слободен пристап до нив. Бидејќи кодот е отворен, доколку некој сака да вметне функционалност за препознавање на македонски говор во неговата апликацијата, ќе може тоа да го стори со буквално неколку линии на код.

Друг бенефит е во тоа што нашите модели работат подобро за транскрипција на македонски говор, во споредба со веќе постоечките слободни модели Whisper на OpenAI и MMS на Meta.

Вештачката интелигенција и дигитализацијата генерално стануваат се повеќе присутни во секојдневието на луѓето. Каде стои Македонија на ова поле, во споредба со земјите од опкружувањето и пошироко?

Постојат луѓе во Македонија кои што се занимаваат во областа на вештачката интелигенција. Меѓутоа, најголем недостиг на Македонија е во тоа што немаме јазична банка, чија задача би била да собира и организира податоци кои што ќе се користат за развивање на технологии на македонски јазик. Сметам дека постоењето на една таква банка ќе придонесе за многу полесно развивање на технологии за македонски јазик.

Кои се целните групи на кои им е наменета платформата, дали ќе биде отворена за користење? Објаснете ни како функционира и како може секој да ја користи?

Како што спомнав погоре, оваа платформа е наменета за секој што има голем број на аудио материјали кои треба да бидат транскрибирани. Рачното транскрибирање одзема многу време. Со помош на „Буки“ тој процес може многу да се скрати. Платформата е слободна за користење и можете да пристапите до неа преку следниот линк: https://huggingface.co/spaces/Macedonian-ASR/Bookie-Whisper-Macedonian-ASR

Информации за тоа како работи „Буки“ и видео инструкции за тоа како да ја користите платформата можете да најдете на Сабстекот на фондацијата КАНТАРОТ, која што исто така помогна во донирање на материјали преку серијалот „Наука за деца“.

Кои се можностите за развој и надоградување на платформата во иднина?

Следен чекор за надоградување на платформата е овозможување на транскрипција преку прикачување на аудио фајл. Исто така, во план ни е да собереме повеќе аудио материјали за да ги подобриме „Буки“ моделите уште повеќе. Заедно со моделите „Буки“, промовиравме и платформа за донирање на македонски говор. Секој што сака да придонесе во подобрување на овие модели ќе може тоа да го стори доколку донира глас. Донацијата се врши преку платформата Mozilla Common Voice. Иструкции за тоа како да донирате глас можете да најдете на платформата каде се наоѓаат моделите „Буки“ или преку следниот линк: https://drive.google.com/file/d/1YdZJz9o1X8AMc6J4MNPnVZjASyIXnvoZ/view

Сподели!
- Advertisement -