Նյուսրում

Հրապարակվել է ՝ 19 սեպտեմբեր 2024 | Թարմացվել է ՝ 23 սեպտեմբեր 2024

Մի քանի վայրկյան՝ հայերեն բանավոր խոսքը գրավորի վերածելու համար

Lրագրող

Արհեստական բանականությունն (ԱԲ) արդեն դարձել է մեդիայի մարդկանց անփոխարինելի ընկերը։ Արհեստական բանականության գործիքների սրընթաց զարգացմանը զուգահեռ, աշխարհի առաջատար լրատվամիջոցներն իրենց ամենօրյա աշխատանքում ավելի ու ավելի շատ են կիրառում ԱԲ գործիքները։ Հայաստանյան մեդիան ևս հետաքրքրված է ԱԲ գործիքների կիրառմամբ։ Իսկ հայկական տեխնո համայնքը փորձում է գտնել ելքեր ու ճանապարհներ, որ աշխարհում լայն տարածում ունեցող մոդելները լավագույնս աշխատեն նաև հայերենի դեպքում։ Հայերեն բանավոր խոսքը տեքստի վերածելու խնդիրը հետաքրքրել է թե՛ տեխնոկրատներին, թե՛ անգամ մեդիայի աշխատակիցներին։ Media.am-ը զրուցել է նմանօրինակ մի քանի նախաձեռնությունների հեղինակների հետ ու փորձել պարզել, թե երբ հնարավոր կլինի օրինակ հայերեն բանավոր խոսքը վայրկյանների ընթացքում վերածել գրավորի։

Հայկ Հովհաննիսյան` ՍիվիլՆեթ, փաստեր ստուգող լրագրող

Ես՝ որպես փաստեր ստուգող լրագրող, իմ ամենօրյա աշխատանքում շատ ժամանակ եմ ծախսում տարբեր տեսանյութեր ու հարցազրույցներ նայելու, լսելու, դրանք սղագրելու կամ մոնիթորինգ անելու համար։ Եվ երբ վերջին ամիսներին, Արհեսատական բանականությամբ աշխատող գործիքները շատ արագ զարգացան, աշխարհի առաջատար լրատվամիջոցներն էլ սկսեցին դրանք օգտագործել բովանդակություն ստեղծելու համար, ինձ հետաքրքրեց, թե մեր տեխնո հանրությունն ի՞նչ քայլեր է անում այս ուղղությամբ։ Միտք առաջացավ ստեղծել արհեստական բանականությամբ աշխատող մի հարթակ, որը մեզ թույլ կտա հայերեն բովանդակություն ստեղծել, խմբագրել ու լավարկել այն։

Գաղափարի շուրջ հավաքվեցին տարբեր ոլորտների ներկայացուցիչներ։ Ստացվեց, որ ես, լինելով լրագրող, գույքագրեցի ու ներկայացրեցի այն բոլոր խնդիրները, որոնց լուծման կարիքն ունի մեդիան, իսկ մեր թիմի ծրագրավորող ներկայացուցիչներն էլ սկսեցին աշխատել այդ խնդիրների լուծման ճանապարհները գտնելու ուղղությամբ։ Կարծում եմ թիմի առավելությունն այն է, որ մասնագիտական առումով փոխլրացնում ենք միմյանց, ինչի արդյունքում հարթակն իսկապես կկարողնա նպաստել մեդիայի աշխատանքի արդյունավետության բարձրացմանը։

Հայկ Հովհաննիսյան

Մեր ստարտափի, մեր հարթակի հիմնական գործառույթներից մեկը արհեստական բանականության միջոցով հայրեն բանավոր խոսքը սղագրելն է լինելու, բայց որոշել ենք միայն այդքանով չսահմանափակվել։ Նախատեսում ենք, որ սղագրված տեքստը ճիշտ խմբագրելուց և անհրաժեշտ կետադրական և ուղղագրական շտկումներն անելուց բացի, հարթակը հնարավորություն կտա նաև գրավոր խոսքը վերածել բանավոր խոսքի։ Այս խնդրին մենք մեր ամենօրյա աշխատանքում ևս շատ ենք հանդիպում։ Ռեպորտաժների պատրաստման գործընթացն ավելի կհեշտանա, ծախսվող ժամանակահատվածն էլ կկրճատվի։

Այս պահին աշխատանքները ընթացքի մեջ են, սակայն դեռ հրապարակման ենթակա չեն։ Հիմա ֆինանսների հայթայթման փուլում ենք, արդեն ունենք որոշ համաձայնություններ։ Կարծում եմ առաջիկա ամիսների ընթացքում կկարողանանք ամբողջացնել նախագիծը։ Այս ամիսների ընթացքում, գիտեմ, որ այլ խմբեր էլ են սկսել նմանատիպ նախագծերի վրա աշխատել, կարծում եմ մրցակցությունը հետաքրքրացնում է աշխատանքը և ստիպում է ավելի արդյուանվետ աշխատել։

Վարուժան Բաղդասարյան` Talk2edit հարթակի հիմնադիր

Ես Պոլիտեխնիկական ինստիտուտի ասպիրանտ եմ, ասպիրանտական կրթության երեք տարիների ընթացքում բացառապես հետազոտել եմ բնական խոսքի մշակումը, հետազոտել եմ այդ գործիքներն ու փորձել եմ դրանք հարմարեցնել հայերենին։ Երեք տարի առաջ, երբ ես աշխատում էի այս նախագծի վրա չկային կամ շատ քիչ էին համապատասխան հետազոտություններն ու հոդվածները և աշխատանքները բավականին դանդաղ ու դժվար էին առաջ գնում։ Ես կարծում եմ, որ կարճ ժամանակահատվածում ոլորտի առաջատար միջազգային ընկերություններն այնքան կընդլայնեն, կլավարկեն ու կզարգացնեն լեզուների իրենց բազան, որ հայերենը վերծանելու ճշգրտությամբ կգերազանցեն հայկական բոլոր մոդելներին։ Այլ կերպ ասած, մենք ունենք այնքան ժամանակ, քանի դեռ մեծ ընկերությունները չեն սկսել հայերենը մոդելավորել։ Կարծում եմ այս ընթացքը չափազանց կարևոր է մեր գիտական մտքի զարգացման համար։

Talk2edit.com հարթակը, որը մենք ներկայացնում ենք, հայերեն խոսքի ինքնաշխատ ճանաչման համակարգ է։ Հայերեն բանավոր խոսքի սղագրման առաջին մեխանիզմներից մեկն է այն։ Սղագրում է մինչև 1 ժամ հոլովակներ (mp3, wav, mp4), աշխատում է նաև խոսափողի միջոցով։ Այս հարթակում հնարավոր է նաև վերբեռնել Youtube-ի հոլովակներ և սղագրել։

Վարուժան Բաղդասարյան

Հարթակի միջոցով հնարավոր է փորձարկել ոչ միայն խոսքի ինքնաշխատ ճանաչումը, այլ նաև քերականական և ուղղագրական լավարկումը։ Հիմա ստացել եք մի մոդել, որի սխալի հավանականությունը կազմում է մոտ 8,5%, այսինքն՝ 100 բառից ընդամենը 8,5 բառն է սխալ կանխատեսում ու սխալ սղագրում։ Նոր մոդելը, որը շուտով պիտի մարզենք, հնարավորինս շտկելու է այդ թերությունները։ Մենք նաև աշխատում ենք տեսանյութերի ենթագրերի, լուսագրերի գեներացման վրա։

Եթե փորձարկեք հարթակը, կտեսնեք, որ համակարգը բավականին ճշգրիտ աշխատում է այն դեպքերում, երբ ձայնագրությունն արվել է անաղմուկ միջավայրում։ Բավականին արագ ու թեթև է աշխատում։ Մենք այժմ փորձում ենք կատարելագործել մեր երկրորդ մոդելը, որ այն կարողանա շտկել առկա բոլոր թերությունները։ Առաջիկայում նաև նախատեսում ենք, որ համակարգը կկարողանա տարբերակել զրուցակիցներին և սղագրության ընթացքում, օրինակ՝ լրագրողական հարցազրույցը սղագրելիս, կկարողանա առանձնացնել զրուցակիցների խոսքերը։ Բացի գործիքի հզորացման և կատարելագործման աշխատանքներից մենք հիմա փորձում ենք հասկանալ, թե ինչ բիզնես մոդել կարող ենք ստեղծել, և մեր գաղափարն ինչպես կարող ենք մոնետիզացնել։ Փորձում ենք ֆինանսավորում գտնել և տարածել մեր արտադրանքը։

Լևոն Հախոյան՝ hispeech․ai հիմնադիր

Հայերեն աուդիո-ձայնագրություն սղագրելը, համառոտագրելը, ինչպես նաև աուդիո-ձայնագրություններից և տեսահոլովակներից ինչ-որ հատված հեռացնելը, կրճատելը առայժմ ձեռքով է իրականացվում, ինչը բավականին ժամանակատար է:

Մեր գործիքը՝ hispeech․ai-ին, որի վրա արդեն մեկ տարուց ավելի է ինչ աշխատում ենք, կօգնի ավտոմատ կերպով սղագրել, ինչպես նաև համառոտագրել ցանկացած աուդիո-ձայնագրություն հայերեն լեզվով: Շատ կարևոր է նաև նշել, որ հնարավոր կլինի խմբագրել աուդիո-ձայնագրությունը կամ տեսահոլովակը․ օրինակ՝ հեռացնել որոշակի կտորներ, պարզապես խմբագրելով սղագրությունը` այսինքն խմբագրելով տեքստը խմբագրում ենք աուդիոն կամ վիդեոն: Մյուս բաղադրիչը, որն ունենալու է գործիքը, տեսանյութերում ենթագրերի, լուսագրերի ավելացումն է լինելու։

Լևոն Հախոյան

Գործիքի ստեղծման գաղափարն առաջացավ մի միջոցառման ժամանակ, երբ տեսա, թե լրագրողներից մեկն ինչպես է բավականին դժվարությամբ փորձում լսել ու սղագրել միջոցառման ընթացքում արված ձայնագրությունը։ Այդ ժամանակ հասկացա, որ նման գործիքի ստեղծումը շատ օգտակար կլինի մեդիայի աշխատակիցների համար։ Հետո հետաքրքրվեցի ու հասկացա, որ նման տեխնոլոգիական լուծումը մեծապես կարող է հեշտացնել ու ավելի արդյունավետ դարձնել ոչ միայն մեդիայի աշխատողների՝ լրագրողների, փոդքաստերների, գովազդային հոլովակներ պատրաստողների աշխատանքը, այլ նաև կիրառելի կլինի նաև շատ այլ ոլորտներում։ Օրինակ՝ բանկերի, կապի օպերատորների հաճախորդների աջակցման կենտրոններում, որտեղ հեռախոսազանգերը լսելու և սղագրելու խնդիր կա, դատական համակարգում՝ դատական նիստերի սղագրում, կրթության ոլորտում՝ դասախոսությունների սղագրում, բիզնեսում վեբինարների սղագրում, համառոտագրում իրականացնելու համար։ Մյուս կարևոր ոլորտը, որը շատ ոգևորեց դա այն էր, որ նման գործիքը հնարավորություն կտա լսողության խնդիրներ ունեցողների համար ինֆորմացիան ավելի հասանելի դարձնել։

Պրոդուկտն ամբողջովին հիմնված է արհեստական բանականության վերջին ձեռքբերումների վրա: Արհեստական բանականության մոդելը ստեղծելու համար հավաքագրել և մշակել ենք հսկայական քանակությամբ տվյալներ: Ստեղծել ենք ունիկալ ալգորիթմներ, ինչի շնորհիվ պրոդուկտն ունի մարդկային ճշգրտություն, ինչը ամենակարևորն է նմանատիպ համակարգերում։ Մեր նպատակն է, որ գործիքը հայերեն գործարկելուց հետո, ավելացնենք նոր լեզուներ՝ վրացերեն ու պարկերեն։ Հետագայում կավելանան նաև նոր գործիքներ և ֆունկցիաներ, օրինակ՝ աղմուկի հեռացում, տեսահոլովակի խելացի խմբագրում և այլն։ Այս պահին հասանելի է հարթակի դեմո տարբերակը։ Կարծում ենք, որ առաջիկա մի քանի ամիսների ընթացքում ամբողջական ավարտուն ու կատարելագործված գործիք կներկայացնենք մեր նախանշած թիրախային լսարաններին։

Տաթև Հովհաննիսյան՝ Կրիսպ ընկերության աշխատակից

Ընդամենը մի քանի օր առաջ «Կրիսպը» և Հանրային հեռուստաընկերությունը համագործակցության հուշագիր են ստորագրել։ Մեր ընկերությունները կհամագործակցեն արհեստական բանականությամբ աշխատող նոր գործիքի ստեղծման շուրջ։ Արհեստական բանականությամբ աշխատող նման մոդելներ, իհարկե շատ կան, բայց որպեսզի այս տեխնոլոգիան լավագույնս հասանելի լինի նաև մեր լեզվի դեպքում, ապա անհրաժեշտ է հայերեն լեզվով տվյալների մեծ բազա։

Հանրային հեռուստաընկերության տրամադրած մեդիակոնտենտի հիման վրա «Կրիսպի»՝ արհեստական բանականությամբ աշխատող նոր գործիքը, կզարգացնի հայերեն բանավոր խոսքից տեքստեր գեներացնելու իր կարողությունը:

Տաթև Հովհաննիսյան

Հուսով ենք, որ համատեղ աշխատանքի ընթացքում կունենանք լավագույնս աշխատող մոդել։ Արդեն կա մշակված նախնական կոնցեպտը, որի հիման վրա էլ կշարունակվեն աշխատանքները։ Եվ հայերենով մեդիակոնտենտը կօգտագործվի այն ավելի լավարկելու համար։ Շատ նախնական տվյալներով կարելի է ասել, որ գործիքը հնարավոր է պատրաստ լինի գործարկման, մոտավորապես վեց ամիս անց, իհարկե սա շատ մոտավոր ժամկետ է, որը կախված է բազմաթիվ հանգամանքներից։ Հետագայում տվյալ գործիքը Հանրայինը կկիրառի հեռուստաարտադրության տարբեր փուլերում․օրինակ՝ ֆիլմերի ու հաղորդումների ժամանակ լուսագրերի ստեղման նպատակով, կամ ընթացիկ աշխատանքներն ավելի արդյունավետ ու արագ դարձնելու համար։

Արհեստական բանականության գործիքների կիրառումը մեծապես կարող է կիրառվել ինչպես մեդիայի ոլորտում, այնպես էլ գրեթե բոլոր ոլորտներում, պարզապես անհրաժեշտ ծավալի հայերեն տվյալների խնդիրն է պետք լուծել, որպեսզի այն անսխալ ու ճշգրիտ աշխատի, ինչպես օրինակ աշխատում է անգլերենի դեպքում։