Meta го претстави Movie Gen: модел на вештачка интелигенција за видео и аудио генерирање

- Advertisement -

Постојат неколку клучни играчи на пазарот на алатки за генерирање видео со вештачка интелигенција, од технолошки гиганти до ниши стартапи. Мета, OpenAI, Google DeepMind и Adobe претставуваат некои од најголемите имиња во индустријата, секое со свој уникатен пристап кон генерирањето видео со вештачка интелигенција. Runway AI, Luma AI и Captions LLC носат специјализирани алатки кои се фокусираат на специфични аспекти на видео продукцијата. Во меѓувреме, компаниите како Veed, Synthesia, Pika Labs, HeyGen и Elai нудат решенија кои се движат од создавање аватари со вештачка интелигенција до платформи за генерирање видео.

Најавата на Мета за Movie Gen доаѓа набргу по настанот Meta Connect, кој го прикажа новиот хардвер и најновата верзија на нивниот голем јазичен модел, Llama 3.2.

- Advertisement -

Возбудата се зголемува додека компанијата гледа на врвните конкуренти, Sora и Runway на OpenAI. Битката ќе се води околу холивудските студија и забавната индустрија воопшто. Минатиот месец Runway потпиша договор со Lionsgate за обука на модели во нивната филмска библиотека за подоцна да ги користат во создавањето на нови филмови, буквално рециклирање сцени од претходните филмови.

Можностите на Movie Gen го надминуваат едноставното генерирање видео од текст, како и со многу други алатки. Она што е ново е тоа што моделот може да прави насочени промени на постоечките клипови, како што се додавање објекти на сцената или менување на изгледот на површините. На пример, една демонстрација покажа жена која носи очила за VR трансформирана да изгледа како да носи двогледи со steampunk.

- Advertisement -

Моделот може да генерира и звук заедно со видеосодржина. Примерите вклучуваат човек создаден од вештачка интелигенција до водопад со звучни прскања и симфониски звуци, спортски автомобил со брмчење на моторот и чкрипење на гуми и змија која се лизга низ џунглата придружена со напнати звуци на сирена.

Movie Gen Video се состои од 30 милијарди параметри, додека Movie Gen Audio има 13 милијарди параметри. Моделот може да произведува видеа со висока резолуција до 16 секунди. Meta тврди дека ги надминува конкурентските модели во севкупниот квалитет на видеото.

- Advertisement -

Meta не даде конкретни детали за податоците користени за обука на Movie Gen, велејќи само дека користеле „комбинација од лиценцирани и јавно достапни збирки на податоци“. Изворите на податоци за обука на генеративни алатки за вештачка интелигенција остануваат контроверзно прашање. За да избегне проблеми со авторските права и прашања што може да произлезат од длабоко фејк, Meta ќе додаде воден печат на сите видеа генерирани од овој модел.

Извршниот директор Марк Цукерберг претходно ја демонстрираше функцијата за вештачка интелигенција на Meta, Imagine Me, која им овозможува на корисниците да ги вметнат сопствените лица во различни сценарија. Movie Gen може потенцијално да понуди видео верзија на оваа функција.

Не е објавен точен датум на објавување за Movie Gen, само навестено е „потенцијално идно издание“. Movie Gen е достапен само за некои внатрешни вработени и неколку надворешни партнери, вклучително и некои филмаџии. Со оглед на сопственоста на Мета на социјалните медиуми, можно е алатките базирани на Movie Gen на крајот да се интегрираат во платформи како Facebook, Instagram и WhatsApp.

(Bug.hr)

(фото: Bug.hr)

Сподели!
- Advertisement -