Microsoft-ը ներկայացրել է նեյրոնային ցանց, որը ցանկացած պատկերի «ստիպում է խոսել»
Վերջին մի քանի տարիների ընթացքում գեներատիվ նեյրոնային ցանցերը հաղթահարել են զարգացման կարևոր փուլ՝ դառնալով ավելի հզոր և ընդունակ ստեղծելու ոչ միայն պատկերներ, այլև տեսանյութեր՝ հիմնված տեքստային նկարագրությունների վրա։
Microsoft-ի նոր VASA-1 ալգորիթմը հավանաբար կզարմացնի շատերին, քանի որ այն գործելու համար ընդհանրապես նկարագրություն չի պահանջում: Բավական է տրամադրել մարդու մեկ պատկեր և աուդիո ֆայլ, որի հիման վրա նեյրոնային ցանցը կգեներացնի խոսող մարդու տեսագրությունը՝ հույզերի լայն շրջանակով և բնական դիմախաղի արտահայտություններով։
VASA-1-ի արդյունքը շատ իրական է թվում: Դեմքի ընդամենը մեկ լուսանկարից և ձայնի ձայնագրությունից ալգորիթմը ստեղծում է իրատեսական տեսանյութ, որում լուսանկարում նկարահանված անձը բառացիորեն «կենդանանում է», և նրա դեմքի արտահայտությունները, շրթունքների և գլխի շարժումները միանգամայն բնական են թվում:
Քանի որ VASA-1-ի միջոցով ստեղծված տեսանյութերը դժվար է անմիջապես տարբերել իրականից, արդեն կան մտավախություններ, որ զեղծարարների կողմից ալգորիթմը կարող է օգտագործվել կեղծիքներ ստեղծելու համար:
Բուն նեյրոնային ցանցի հիմնական տարբերությունն այլ համանման ալգորիթմներից դեմքի արտահայտությունների և գլխի շարժումների առաջացման ամբողջական մոդելի առկայությունն է: Microsoft-ը լայնածավալ հետազոտություն է անցկացրել՝ գնահատելով մի շարք նոր չափումներ: Արդյունքում նրանք պարզեցին, որ նոր ալգորիթմը շատ առումներով զգալիորեն գերազանցում է նախկինում ներկայացված անալոգներին։
«Մեր մեթոդը ոչ միայն ստեղծում է բարձրորակ տեսանյութ՝ դեմքի իրատեսական արտահայտություններով և գլխի շարժումներով, այլ նաև աջակցում է առցանց տեսանյութերի ստեղծմանը 512×512 պիքսելներով՝ վայրկյանում 40 կադր արագությամբ՝ ցածր նախնական հետաձգմամբ: Սա ճանապարհ է հարթում իրական ժամանակի փոխազդեցության համար իրատեսական ավատարների հետ, որոնք ընդօրինակում են մարդկային վերբալ վարքագիծը»,- ասվում է Microsoft-ի հայտարարության մեջ:
Այլ կերպ ասած, նեյրոնային ցանցը կարող է ստեղծել բարձրորակ կեղծ տեսանյութեր՝ հիմնվելով ընդամենը մեկ պատկերի վրա։ Զարմանալի չէ, որ Microsoft-ը VASA-1-ը անվանում է «հետազոտական ցուցադրություն» և չի պատրաստվում այն բերել առևտրային շուկա, համենայն դեպս ոչ շուտով:
Տեխնոլոգիական հրապարակումներն իրականացվում են Իդրամի աջակցությամբ։