Բիզնես

USD BUY - 383.00+0.00 USD SELL - 386.00+0.00
EUR BUY - 446.00+0.00 EUR SELL - 455.00+1.00
OIL:  BRENT - 67.64-0.19 WTI - 65.24+0.26
COMEX:  GOLD - 3305.60+0.59 SILVER - 36.05+0.59
COMEX:  PLATINUM - 1374.60+1.68
LME:  ALUMINIUM - 2595.00+0.45 COPPER - 9878.00-0.22
LME:  NICKEL - 15245.00+0.24 TIN - 33762.00+0.04
LME:  LEAD - 2044.00+0.27 ZINC - 2779.00+0.40
FOREX:  USD/JPY - 143.84-0.56 EUR/GBP - 1.1749+0.26
FOREX:  EUR/USD - 1.1749+0.26 GBP/USD - 1.3734+0.15
STOCKS RUS:  RTSI - 1126.55-0.01
STOCKS US: DOW JONES - 43819.27+2.91 NASDAQ - 20273.46+3.27
STOCKS US: S&P 500 - 6173.07+2.45
STOCKS JAPAN:  NIKKEI - 40150.79+1.43 TOPIX - 2840.54+1.28
STOCKS CHINA:  HANG SENG - 24284.15-0.17 SSEC - 3424.23-0.70
STOCKS EUR:  FTSE100 - 8798.91+0.47 CAC40 - 7691.55+2.04
STOCKS EUR:  DAX - 24033.22+3.28
27/06/2025  CBA:  USD - 384.32-0.59 GBP - 527.56-0.77
27/06/2025  CBA:  EURO - 450.23-0.62
27/06/2025  CBA:  GOLD - 41006-58 SILVER - 452.11+9.51
Apple-ն ու Վաշինգտոնի համալսարանը փորձարկել են AI մոդելներ, ներառյալ՝ GPT և Gemini մոդելները
30/06/2025 15:53
Կիսվել

Apple-ն ու Վաշինգտոնի համալսարանը փորձարկել են AI մոդելներ, ներառյալ՝ GPT և Gemini մոդելները

Մինչ բոլորը փորձում են տեսնել, թե ինչպես կարող է արհեստական բանականությունը գրել շարադրություններ, գրել կոդ կամ ստեղծել նկարներ, Apple-ի և Վաշինգտոնի համալսարանի հետազոտողները մոտեցել են շատ ավելի գործնական հարցի․ ինչ կլինի, եթե արհեստական բանականությանը տրվի լիարժեք մուտք՝ կառավարելու բջջային հավելվածներ, արդյոք այն կարող է հասկանալ իր գործողությունների հետևանքները։

«From Interaction to Impact» խորագրով ուսումնասիրությունում, որը հրապարակվել է IUI 2025 գիտաժողովի համար, թիմը հայտնաբերել է լուրջ բացթողում․ ԱԲ-ի համար «Ջնջել հաշիվը» և «Հավանել» կոճակը շատ նման են։ Այն դեռ չի հասկանում դրանց միջև առկա ռիսկային տարբերությունը։

Դրա համար գիտնականները մշակել են հատուկ դասակարգում, որը նկարագրում է բջջային հավելվածներում գործողությունների ազդեցության հիմնական տիպեր:

Հետազոտողները ստեղծել են 250 սցենարից բաղկացած եզակի dataset, որտեղ ԱԲ-ն պետք է որոշեր՝ գործողությունը անվտանգ է, պահանջում է հաստատում, թե ընդհանրապես պետք չէ կատարել առանց մարդու։

Դա համեմատվել է հայտնի AndroidControl և MoTIF հավաքածուների հետ։ Նոր տարբերակում իրավիճակները շատ ավելի իրական էին՝ սկսած գնումներից և գաղտնաբառի փոխումից մինչև խելացի տան կառավարում։

IDram

Հետազոտության ընթացքում փորձարկվել են 5 լեզվային և մուլտիմոդալ մոդելներ․

GPT-4 (տեքստային) – աշխատում է միայն տեքստով

GPT-4 Multimodal (MM) – կարող է վերլուծել և տեքստ, և UI նկարներ

Gemini 1.5 Flash (Google) – տեքստային

MM1.5 (Meta) – մուլտիմոդալ

Ferret-UI – մասնագիտացված մոդել UI-ի համար

Թեստերը անցկացվել են 4 ռեժիմով.

Zero-shot – առանց նախնական ուսուցման

Knowledge-Augmented Prompting (KAP) – հուշում՝ ազդեցության դասակարգմամբ

In-Context Learning (ICL) – հուշում՝ օրինակներով

Chain-of-Thought (CoT) – քայլ առ քայլ մտածողությամբ

Նույնիսկ լավագույն մոդելները (օր.՝ GPT-4 MM, Gemini) հազիվ հասել են 58% ճշգրտության՝ գործողության ազդեցության մակարդակի որոշման հարցում։

Առավել դժվար են եղել վերականգնելիության տարբերակումն ու երկարաժամկետ հետևանքների ընկալումը

GPT-4-ն երբեմն շատ է մեծացրել ռիսկը, օրինակ՝ դատարկ հաշվիչի պատմությունը մաքրելը նշում էր որպես վտանգավոր քայլ։

Միևնույն ժամանակ՝ կարևոր գործողությունները թերագնահատվել են, օրինակ՝ ֆինանսական տվյալների փոփոխումը կամ կարևոր հաղորդագրության ուղարկումը։

Արդյունքում մասնագետները եզրակացրել են՝ տեխնոլոգիան դեռ պատրաստ չէ լիարժեք ինքնավարության: Անհրաժեշտ են ավելի խորը ու համատեքստային մեթոդներ, որոնք կապահովեն, որ ԱԲ-ը ճիշտ գնահատի իր գործողությունները։ Ապագայում օգտատերերը պետք է կարողանան ինքնուրույն կարգավորել ԱԲ-ի «զգուշության մակարդակը»՝ որոշելով, թե ինչ կարելի է անել առանց հաստատման, իսկ ինչ՝ ոչ։

Այս ուսումնասիրությունը կարևոր քայլ է այն ապագայի համար, որտեղ AI գործակալները պարզապես չեն սեղմի կոճակներ, այլ իրականում կհասկանան, թե ինչ են անում ու ինչ հետևանքներ կարող են լինել:

Տեխնոլոգիական հրապարակումներն իրականացվում են Իդրամի աջակցությամբ։

27/06/2025
դրամ
Դոլար (USD)
384.32
-0.59
Եվրո (EUR)
450.23
-0.62
Ռուբլի (RUR)
4.8933
-0.02
Լարի (GEL)
141.11
-0.22
41006
-58
Արծաթ
452.11
+9.51