
Չինական DeepSeek ստարտափը հետաձգել է նոր ԱԲ մոդելի թողարկումը՝ Huawei-ի չիպերի հետ խնդիրների պատճառով
Չինական DeepSeek ստարտափը հետաձգել է արհեստական բանականության նոր մոդելի թողարկումը՝ չհաջողված փորձից հետո այն ուսուցանելու Huawei-ի չիպերով: Այս մասին գրում է Financial Times-ը՝ հղում անելով իրազեկ աղբյուրներին։
Նրանց խոսքով՝ այս տարվա հունվարին մեծ արձագանք ստացած R1 մոդելի թողարկումից հետո իշխանությունները հորդորել էին DeepSeek-ին օգտագործել Huawei Ascend պրոցեսորներ՝ ամերիկյան Nvidia Corp. լուծումների փոխարեն։
Սակայն նոր R2 մոդելի ուսուցման ժամանակ Ascend-ի միջոցով ստարտափը բախվել է տեխնիկական դժվարությունների, ինչի հետևանքով այն սկսել է ուսուցման համար օգտագործել Nvidia-ի չիպերը, իսկ Huawei-ի չիպերը՝ մոդելի շահագործման փուլում։
Այս խնդիրները դարձել են մոդելը մայիսին թողարկելու պլաններից հրաժարվելու հիմնական պատճառը:
Huawei-ը տեխնիկական մասնագետների խումբ է ուղարկել DeepSeek-ի գրասենյակ՝ օգնելու Ascend-ի կիրառմանը R2-ի մշակման ընթացքում, սակայն, որոշ աղբյուրների խոսքով, դա չի բերել հաջող արդյունքի դրա ուսուցման հարցում։
Միաժամանակ DeepSeek-ը շարունակում է համագործակցել Huawei-ի հետ՝ ապահովելու Ascend-ի համատեղելիությունը մոդելի շահագործման ընթացքում։
Ընկերության հիմնադիր Լիան Վենֆենը, ըստ աղբյուրների, ներսում արտահայտել է դժգոհություն R2-ի մշակման առաջընթացից և պահանջել աշխատակիցներից ավելի շատ ուշադրություն դարձնել առաջադեմ մոդելի ստեղծմանը, որը կօգնի պահպանել ընկերության առաջնորդությունն ԱԲ ոլորտում։
R2-ի թողարկումը հետաձգվել է նաև տվյալների երկարատև մակնշման պատճառով։ Չինական լրատվամիջոցների փոխանցմամբ՝ մոդելը կարող է թողարկվել առաջիկա շաբաթների ընթացքում։
FT-ն այս շաբաթ հայտնել էր, որ Պեկինը պահանջել է չինական տեխնոլոգիական ընկերություններից հիմնավորել Nvidia H20 չիպերի պատվերները՝ խթանելու համար նրանց անցումը չինական Huawei և Cambricon արտադրանքին։
Հիշեցնենք՝ DeepSeek-ը լայն ճանաչում էր ձեռք բերել այս տարվա սկզբին R1-ի թողարկումից հետո։ OpenAI-ի մշակումներին համարժեք լինելով՝ այս մոդելը պահանջում է շատ ավելի քիչ ծախսեր ուսուցման համար, ինչը լուրջ ազդեցություն էր թողել համաշխարհային արժեթղթերի շուկաների վրա՝ մեկ առևտրային սեսիայի ընթացքում գրեթե 600 միլիարդ դոլարով նվազեցնելով Nvidia-ի շուկայական արժեքը։
Տեխնոլոգիական հրապարակումներն իրականացվում են Իդրամի աջակցությամբ։