Google-ը ներկայացրել է Gemini-ի նոր գործառույթը, որը կարող է պատասխանել ավտոմեքենայի պատուհանից երևացող միջավայրի մասին հարցերին
Google-ը ցուցադրել է Gemini-ի փորձնական նոր գործառույթը, որը թույլ է տալիս արհեստական բանականության օգնականին պատասխանել ավտոմեքենայի շուրջ տեղի ունեցողի վերաբերյալ հարցերին՝ ժամանակավորապես օգտագործելով դիմային տեսախցիկը։
Նոր հնարավորությունը ներկայացրել է Google-ի Android-ի նախագահ Սամիր Սամատը՝ Google AI Studio-ի արտադրանքի ղեկավար Լոգան Քիլպատրիկի հետ զրույցի ընթացքում։ Այն ցուցադրվել է Volvo EX60 էլեկտրամեքենայի վրա, որի մատակարարումները, ինչպես նշել է Սամատը, դեռ չեն սկսվել։ Այս մոդելն աշխատում է Google-ի ներկառուցված հարթակով՝ Gemini-ի աջակցությամբ, և առայժմ միակ ավտոմեքենան է, որն օգտագործում է տվյալ գործառույթը։
Այս գաղափարը ծանոթ կթվա Android սմարթֆոններում Gemini Live-ի տեսախցիկի ռեժիմից օգտվածներին։
«Մենք ցանկանում էինք հասկանալ, թե ինչ կլինի, եթե Gemini-ն կարողանա տեսնել աշխարհը, մինչ դուք վարում եք մեքենան», – ցուցադրության ընթացքում նշել է Սամատը։
Նա անդրադարձել է նաև գաղտնիության հարցերին։ Նրա խոսքով՝ Gemini-ն անընդհատ չի վերլուծում ճանապարհը, իսկ տեսախցիկից ստացվող պատկերը փոխանցվում է միայն այն դեպքում, երբ օգտատերը գիտակցաբար ակտիվացնում է Gemini-ն և հարց է տալիս։
Ցուցադրության ընթացքում նկատվել է տեսահոսքի միացման որոշակի ուշացում։ Ի տարբերություն սմարթֆոնների Gemini Live-ի, ավտոմեքենայի տեղեկատվական-ժամանցային համակարգի էկրանին տեսանյութը իրական ժամանակում չէր ցուցադրվում․ օգտատերը ստանում էր միայն Gemini-ի ձայնային պատասխանները։
Չնայած արձագանքման ավելի դանդաղ արագությանը՝ ցուցադրությունը ցույց տվեց համակարգի տպավորիչ տեսողական ընկալման հնարավորությունները։ Սամատը Gemini-ին խնդրեց ճանաչել Մաունթին Վյուում գտնվող Google-ի համալսարանի շրջակայքում դիմապակուց երևացող տեսարժան վայրերը։ Արհեստական բանականության օգնականը ճիշտ ճանաչեց մի քանի տեղական տեսարժան վայրեր, այդ թվում՝ The Orb հանրային արվեստի ինստալյացիան, նկարագրեց Gradient Canopy արևային տանիքի առանձնահատկությունները և նույնիսկ ներկայացրեց մոտակայքում գտնվող Shoreline Amphitheatre ամֆիթատրոնի ճարտարապետական պատմությունը։
Այս ցուցադրությունը վկայում է, որ Google-ն ուսումնասիրում է Gemini-ի բազմամոդալ հնարավորությունները սմարթֆոններից դուրս ընդլայնելու տարբերակները։ Ապագայում օգնականը կարող է պատասխանել ոչ միայն նավիգացիոն տվյալների հիման վրա, այլև այն ամենի վերաբերյալ, ինչ տվյալ պահին «տեսնում» է ավտոմեքենան։
Ընկերությունը դեռևս չի հայտարարել այս գործառույթի լայնածավալ ներդրման ծրագրերի մասին և չի հայտնել՝ այն հետագայում հասանելի կլինի արդյոք Google Built-in համակարգով աշխատող այլ ավտոմեքենաներում։
Ցուցադրության ավարտին Սամատը նշել է, որ ընկերությունը փորձում է գտնել այս հնարավորության լավագույն կիրառման ձևը, որպեսզի այն իրական վարորդական պայմաններում լինի առավել օգտակար։ Որպես օրինակ նա նշել է ճանապարհային նշանների օտար լեզվով գրված գրությունների թարգմանությունը ճանապարհորդության ընթացքում։
Ավելի վաղ Google-ը Gemini հավելվածի Personal Intelligence գործառույթի միջոցով ԱՄՆ-ի բոլոր օգտատերերի համար հասանելի էր դարձրել Nano Banana մոդելի հիման վրա պատկերների գեներացումը։ Նախկինում այդ հնարավորությունը հասանելի էր միայն Plus, Pro և Ultra բաժանորդներին։
Տեխնոլոգիական հրապարակումներն իրականացվում են Իդրամի աջակցությամբ։

