Case Study. Content Moderation

30K+ փաստաթղթերի վեբ ջնջված և ծանոթագրված բովանդակության մոդերացիայի համար

Բովանդակության մոդերացիա՝ դրոշակակիր
AI-ով աշխատող բովանդակության չափավորության աճող պահանջարկ կա
որոնք ձգտում են ապահովել առցանց տարածությունը, որտեղ մենք կապվում և շփվում ենք:

Քանի որ սոցիալական լրատվամիջոցների օգտագործումը շարունակում է աճել,
կիբերհարձակման խնդիրը ի հայտ է եկել որպես
զգալի խոչընդոտ հարթակների համար, որոնք ձգտում են
ապահովել անվտանգ առցանց տարածք: Մի ցնցող
Անհատների 38%-ը հանդիպում է դրան
ամենօրյա վնասակար վարքագիծը,
ընդգծելով հնարամիտների հրատապ պահանջարկը
բովանդակության չափավոր մոտեցումներ.
Կազմակերպություններն այսօր ապավինում են օգտագործմանը
արհեստական ​​ինտելեկտը մնայունին անդրադառնալու համար
պրոակտիվ կիբերհարձակման խնդիրը:

Կիբերանվտանգություն.

Բացահայտվել է Facebook-ի 4-րդ եռամսյակի Համայնքային ստանդարտների կիրարկման հաշվետվությունը. գործողություն 6.3 միլիոն հալածանքի և ոտնձգության բովանդակության վերաբերյալ, 49.9% կանխամտածված հայտնաբերման մակարդակով:

Կրթություն:

2021 ուսումնասիրությունը պարզել է, որ 36.5%Միացյալ Նահանգներում տարեկան ուսանողների տոկոսը 12 & 17 տարիներ շարունակ կիբերհարձակման են ենթարկվել իրենց դպրոցական ուսման ընթացքում:

Համաձայն 2020 թվականի հաշվետվության՝ բովանդակության մոդերացիայի լուծումների համաշխարհային շուկան 4.07 թվականին գնահատվել է 2019 միլիարդ ԱՄՆ դոլար և ակնկալվում էր, որ մինչև 11.94 թվականը կհասնի 2027 միլիարդ դոլարի՝ 14.7% CAGR-ով:

Իրական աշխարհի լուծում

Տվյալներ, որոնք վերահսկում են գլոբալ խոսակցությունները

Հաճախորդը մշակում էր ամուր ավտոմատացված
բովանդակության մոդերացիա Մեքենայի ուսուցում
մոդել իր Cloud առաջարկի համար, որի համար նրանք
փնտրում էին տիրույթի հատուկ վաճառողի, ով
կարող է օգնել նրանց վերապատրաստման ճշգրիտ տվյալներով:

Օգտագործելով բնական լեզվի մշակման (NLP) մեր լայնածավալ գիտելիքները, մենք օգնեցինք հաճախորդին հավաքել, դասակարգել և ծանոթագրել ավելի քան 30,000 փաստաթղթեր ինչպես անգլերեն, այնպես էլ իսպաներեն՝ ստեղծելու ավտոմատացված բովանդակության մոդերատորություն Մեքենայական ուսուցման մոդել՝ բաժանված թունավոր, հասուն կամ սեռական բնույթի բացահայտ բովանդակության: կատեգորիաներ.

Իրական աշխարհի լուծում

խնդիր

  • Վեբ քերծում է 30,000 փաստաթուղթ ինչպես իսպաներեն, այնպես էլ անգլերեն լեզուներով առաջնահերթ տիրույթներից
  • Հավաքված բովանդակության դասակարգումը կարճ, միջին և երկար հատվածների
  • Կազմված տվյալների պիտակավորումը որպես թունավոր, հասուն կամ սեռական բնույթի բացահայտ բովանդակություն
  • Բարձրորակ ծանոթագրությունների ապահովում՝ նվազագույնը 90% ճշգրտությամբ:

լուծում

  • Վեբը ջնջված է 30,000 փաստաթուղթ իսպաներեն և անգլերեն լեզուներով BFSI-ից, Առողջապահությունից, Արտադրությունից, Մանրածախից: Բովանդակությունը հետագայում բաժանվեց կարճ, միջին և երկար փաստաթղթերի 
  • Դասակարգված բովանդակությունը հաջողությամբ պիտակավորվել է որպես թունավոր, հասուն տարիքի կամ սեռական բնույթի բացահայտ բովանդակություն
  • 90% որակի հասնելու համար Shaip-ը իրականացրեց որակի վերահսկման երկաստիճան գործընթաց.
    » Մակարդակ 1. Որակի ապահովման ստուգում. վավերացված ֆայլերի 100%-ը:
    » Մակարդակ 2. Կրիտիկական որակի վերլուծության ստուգում. Shaips-ի CQA թիմը կգնահատի հետընթաց նմուշների 15%-20%-ը:

Արդյունք

Վերապատրաստման տվյալները օգնեցին կառուցել բովանդակության վերահսկման ավտոմատացված ML մոդել, որը կարող է մի քանի արդյունք տալ՝ ավելի անվտանգ առցանց միջավայր պահպանելու համար: Հիմնական արդյունքներից մի քանիսը ներառում են.

  • Տվյալների հսկայական քանակի մշակման արդյունավետություն
  • Հետևողականություն չափավորության քաղաքականության միատեսակ կիրարկումն ապահովելու հարցում
  • Օգտագործողների աճող բազայի և բովանդակության ծավալներին հարմարվելու հնարավորություն
  • Իրական ժամանակի մոդերացիան կարող է բացահայտել և
    հեռացնել պոտենցիալ վնասակար բովանդակությունը, քանի որ այն ստեղծվում է
  • Ծախսերի արդյունավետություն՝ նվազեցնելով կախվածությունը մարդկային մոդերատորներից

Բովանդակության մոդերացիայի օրինակներ

Բովանդակության չափավորության օրինակներ

Արագացրեք ձեր խոսակցական AI-ն
հավելվածի մշակում 100%-ով

Ասացեք մեզ, թե ինչպես կարող ենք օգնել ձեր հաջորդ արհեստական ​​ինտելեկտի նախաձեռնությանը: