Pročitaj mi članak

Bil Gejts otkriva da će veštačka inteligencija zameniti podkastere i vesti

0

Majkrosoft Bila Gejtsa je predstavio novi program pod nazivom VASA koji stvara „živopisno lice virtuelnih likova koji govore sa privlačnim vizuelno efikasnim veštinama (VAS), od samo jedne date statične slike i audio snimka“.

Према одељењу за вештачку интелигенцију (АИ) у Microsoftu, технолошки гигант тајно ради на програму тако да подкастери, ТВ водитељи и вести могу бити потпуно замењени вештачком интелигенцијом.

„Наш премијерни модел, ВАСА-1, способан је не само да произведе покрете усана који су изврсно синхронизовани са звуком, већ и да ухвати велики спектар нијанси лица и природних покрета главе који доприносе перцепцији аутентичности и живости“, Бил Гејтсов тим је написао у чланку о овим најновијим дешавањима.

Naturalnews.com извештава: „Главне иновације укључују холистичку динамику лица и модел генерисања покрета главе који функционише у латентном простору лица, и развој тако експресивног и латентног простора лица помоћу видео записа. Кроз опсежне експерименте, укључујући евалуацију скупа нових метрика, показујемо да наш метод значајно надмашује претходне методе у различитим димензијама свеобухватно.“

Висококвалитетни deepfakes

Методе које користи Microsoft Research Asia да развију ове врсте дубоких фејкова налик људима дају висококвалитетни видео заједно са реалистичном динамиком лица и главе. Такав видео се може генерисати на мрежи при 512×512 са до 40 фрејмова у секунди (ФПС) и занемарљивом почетном латенцијом.

Лаички речено, технологија је толико уверљива да би многи људи вероватно насели на њу и помислили да су то стварни људи на њиховим екранима. Само најизбирљивији ће моћи да кажу да нешто није у реду са оним што виде.

„То утире пут за ангажмане у реалном времену са реалистичним аватарима који опонашају људско понашање у разговору“, поносно тврди Мицрософт Ресеарцх Асиа.

Ако сте заинтересовани да видите неколико примера ових језивих АИ покретних и говорних слика, то можете учинити на Microsoft.com.

„Наш метод је способан не само да произведе драгоцену синхронизацију звука усана, већ и да генерише широк спектар експресивних нијанси лица и природних покрета главе“, кажу из компаније.

„Може да обрађује звук произвољне дужине и стабилно емитује беспрекорне видео записе лица која говоре.”

Сврха истраживања је да се ослободи читаво друштво или армију виртуелних АИ аватара, каже Microsoft, али не брините: све је у „циљању позитивних апликација“, инсистира компанија.

„Није намењено стварању садржаја који се користи за обману“, стоји у одрицању одговорности на сајту. „Међутим, као и друге сродне технике генерисања садржаја, и даље би се потенцијално могло злоупотребити за лажно представљање људи.

„Противимо се било каквом понашању у циљу стварања обмањујућих или штетних садржаја стварних особа и заинтересовани смо за примену наше технике за унапређење откривања фалсификата. Тренутно, видео снимци генерисани овом методом и даље садрже артефакте који се могу идентификовати, а нумеричка анализа показује да још увек постоји јаз за постизање аутентичности стварних видео записа.

Наводни позитивни случајеви употребе такве технологије читају се као пародија, при чему Microsoft тврди да може да створи „једнакост у образовању“ док „побољшава доступност за појединце са комуникацијским изазовима, нуди дружење или терапеутску подршку онима којима је потребна…“