Вештачка интелигенција ги претвора во звуците во слики од улици

декември 2, 2024

- Advertisement -

Користејќи генеративна вештачка интелигенција, тим нод истражувачи од Универзитетот во Тексас во Остин ги конвертира звуците од аудиоснимките во слики од улици. Визуелната точност на овие генерирани слики покажува дека компјутерите можат да ја реплицираат човечката врска меѓу аудио и визуелната перцепција на околината.

Во трудот објавен во списанието Computers, Environment and Urban Systems, истражувачкиот тим опишува обука на модел од звук во слика со вештачка интелигенција користејќи аудио и визуелни податоци собрани од различни урбани и рурални улични пејзажи, а потоа користење на тој модел за генерирање слики од аудиоснимките.

- Advertisement -

Користејќи видео и аудио на YouTube од градовите во Северна Америка, Азија и Европа, тимот создал парови од 10 секунди аудиоклипови и фотографии од различни локации и ги искористил за да обучи модел со вештачка интелигенција што може да произведе слики со висока резолуција од аудио внес. Тие потоа ги споредиле креациите од звук во слика на вештачката интелигенција направени од 100 ауди клипови со нивните фотографии од реалниот свет, користејќи човечка и компјутерска проценка. Компјутерските проценки ги споредиле релативните пропорции на зеленило, згради и небо меѓу оригиналните и генерираните слики, додека од човечките „судии“ било побарано правилно да поврзат една од трите генерирани слики со аудио примерок.

Резултатите покажале силни корелации во пропорциите од небо до зеленило меѓу генерираните и сликите од реалниот свет и малку помала корелација во градежните пропорции, а човечките учесници во просек имале 80% точност при изборот на генерираните слики кои одговараат на оригиналните аудио примероци.

- Advertisement -

Со приближни пропорции на небо, зеленило и згради, генерираните слики често ги одразувале архитектонските стилови и растојанија меѓу објектите на нивните слики од реалниот свет, како и прецизно прикажување дали звучните пејзажи се снимени за време на сончево, облачно или ноќно осветлување. Авторите забележуваат дека информациите за осветленоста може да потекнуваат од варијации на активноста во звучните пејзажи. На пример, звуците од сообраќајот или чврчорењето на ноќните инсекти може да го откријат времето од денот. Ваквите набљудувања го унапредуваат разбирањето за тоа како мултисензорните фактори придонесуваат за нашето искуство на местото.

„Кога ги затворате очите и слушате, звуците околу вас создаваат слики во вашиот ум“, вели Јухао Канг, асистент професор по географија и животна средина на UT и коавтор на студијата. „На пример, далечното брмчење на сообраќајот станува зафатен градски пејзаж, додека нежното шушкање на лисјата ве воведува во мирна шума. Секој звук плете жива таписерија од сцени, како со магија, во театарот на вашата имагинација“.

- Advertisement -

Работата на Канг се фокусира на користење на геопросторна вештачка интелигенција за проучување како луѓето комуницираат со нивните средини. Во друг неодамнешен труд објавен во списанието Nature, тој и неговите коавтори го испитуваа потенцијалот на вештачката интелигенција да ги долови карактеристиките што им даваат на градовите единствен идентитет.

(Vidi.hr)

(фото: Needpix)

Сподели!

- Advertisement -

Професија што не може да ја замени AI – мрежните инженери остануваат незаменливи.

„Април 22“, македонските биоразградливи хулахопки обоени со природни бои ги освојуваат жените!

Аммар Качар на отпадот од текстил му дава втор живот, создавајќи уникатни и иновативни модни парчиња

Добредојдовте во домот што размислува – SmartThings ја креира новата домашна магија

FanForge – македонска платформа што гради мост меѓу уметниците, франшизите и фановите

Професија што не може да ја замени AI – мрежните инженери остануваат незаменливи.

Бимилк со отворени врати за граѓаните по повод Светскиот ден на квалитет

Поволности за потрошувачки кредити во Халкбанк – што треба да знаете?

Просечната плата порасна за 9,3% во септември

Литванска компанија заработува милиони евра од трговија со половна стока

Социјалната мрежа X го открива потеклото и историјата на профилите за да се бори против ботовите

Сингапур е првата земја што ќе наплаќа зелен данок на гориво за патниците во авион

Прв целосно синтетички модел на мозочно ткиво

Професор Владимир Трајковиќ: Mладите во земјава треба да размислуваат амбициозно, да бараат решенија на глобално важни проблеми!

Првиот македонски робот „Алшар” на професорот Сефиданис предизвика огромен интерес во светот

Љупчо Паневски две деции прави хартија по рецепт од 16 век! Mузејот на хартија е една од главните туристички дестинации во Охрид

Inovativnost Insights со Димитрија Ангелков, инспиративен иноватор и професор

Во Македонија владее голем козумеризaм, но доаѓа тренд на еколошко однесување и одговорно живеење!

Професија што не може да ја замени AI – мрежните инженери остануваат незаменливи.

„Април 22“, македонските биоразградливи хулахопки обоени со природни бои ги освојуваат жените!

Аммар Качар на отпадот од текстил му дава втор живот, создавајќи уникатни и иновативни модни парчиња

FanForge – македонска платформа што гради мост меѓу уметниците, франшизите и фановите

Македонски научник предводи револуција во рано откривање и ефикасно лекување на рак на дебело црево со помош на вештачка интелигенција!

10 навики на кои губите пари секој ден

Пет вештини што работодавците ги ценат повеќе од диплома

Кога е време за појадок, а кога за „утринско кафе“?

Ако извршниот директор го прави интервјуто за работа, треба да разговарате за три работи

Научници создадоа нов градежен материјал – три пати поевтин од бетонот

Циркуларен понеделник наместо Црн петок: можеме ли да ја промениме културата на прекумерна потрошувачка?

ВИДЕО: Студентка на МИТ направи биоразградлива пластика од рибји крлушки

ОН предупредуваат дека побарувачката за клима уреди ќе се зголеми тројно до 2050 година

ВИДЕО: Дрон кој лета непрекинато додека сонцето сјае

Вештачка интелигенција ги претвора во звуците во слики од улици

Паметните домови како наша сегашност и иднина

Светскиот економски форум: Сајбер нападите меѓу топ три најголеми ризици за...

Вештачка интелигенција ги претвора во звуците во слики од улици

ПОВРЗАНИ ОБЈАВИ