Жалған ақпараттарды мәтіннің стилін ескере отырып жіктеудегі машиналық оқытудың өз алгоритмдері бар.
Жаңалықтарды талдаудың заманауи автоматтандырылған жүйелері, әдетте, үш ұстанымның біріне сәйкес жұмыс істейді:
- Мәтіннің мазмұнын емес, стилін талдау. Жалған ақпаратты таратушылар оқырмандарды әдейі адастыру үшін белгілі бір әдіс-тәсілдерді қолдана отырып, қалаған идеяларын таңуға тырысады және өздері де өтірік ақпаратпен ұсталып қалмау жолдарын қарастырады. Бұл белгілі бір стилисткалық ерекшеліктерден байқалады: жалғандықтың белгісі болымсыз етістіктердің қолдану жиілігі мен заңдылығы, сонымен қатар сөздік қор мен мәтіннің күрделілік деңгейі.
- Тарату аймағын талдау. Тарату әдісі белгілі бір жұқпалы аурулар, оның өршу мүмкіндігіне болжам жасау кезіндегі жедел таратылатын ақпараттарға ұқсайды.
- Тұтынушылардың белсенділігін талдау. Әдіс оқырмандардың жалған ақпараттардың пайда болуына және таралуына қатысын бағалауға құрылған. Қолданушылар екі топқа бөлінеді: фейк жасау мен оны таратудан пайда көретін «қылмыскерлер» және еш мақсатсыз фейк тарататын қарапайым қолданушылар.
Бүгінгі таңда тақырыптарды, мәтінді, мультимедиалық мазмұнды, метадеректерді және басқа параметрлерді лингвистикалық талдауды орындау үшін машиналық оқыту үлгілерін пайдаланатын бірқатар қызметтер қолжетімді. Мұндай сервистерді (FakeBox, FightHoax, TrulyMedia, SocialTruth және т.б.) тестілеу кезінде дәлдік деңгейі 95%-дан асты.
Жалған ақпараттарды мәтіннің стилін ескере отырып жіктеудегі машиналық оқытудың өз алгоритмдері бар. Олар: тірек векторлар әдісі, k-ең жақын көршілер әдісі, логистикалық регрессия, «кездейсоқ орман» әдісі, «аңғал Байес үлгісі», жасанды нейрондық желілер, терең оқу әдістері.
Осы әдістердің барлығы жақсы нәтижелер көрсете алады. Бірақ әртүрлі деректер жинақтарында (жалған жаңалықтарды тану кезінде де, басқа жіктеу тапсырмаларында да) өзін жақсы дәлелдеген әдістер – логистикалық регрессия, Байес үлгілері және терең оқыту екені дәлелденген.
Фейк жаңалықтар замануи медиакеңістікте кеңінен таралғанын атап айтуымыз керек. Қазақстан жағдайында жалған ақпаратттар көбінесе әлеуметтік желілер арқылы таралатынын байқап жүрміз. Республикалық бұқаралық ақпарат құралдарында бұл жағынан сүзгінің, журналистер тарапынан шындыққа сай ақпаратты жариялау керектігі туралы жауапкершіліктің бар екендігі сезіледі. Мәселен, жақын күндері әлеуметтік желілер мен жекелеген топтарда «белгілі Алаш қайраткері Мұстафа Шоқайдың Германиядағы мазары бұзылғалы жатыр» деген жалған ақпарат желдей есті. Мұстафа Шоқайдың мүрдесін тез арада елге жеткізу мәселесі көтеріле бастады. Кейін ҚР СІМ өкілі Айбек Смадияров: «Зират орнында, ешкім оған тиіскен жоқ. Елшіліктің қызметкері барып тағы да тексеріп қайтты, зираттың басышылғымен сөйлесті» деп ақпараттың жалған екендігін растады. Осы орайда республикалық «Aiqyn» газеті бас редакторының бірінші орынбасары Гүлзина Бектас Мұстафа Шоқай мұрасын зерттеп жүрген мұстафатанушы, қоғам қайраткері Әбдіжәлел Бәкірмен «Сіз не дейсіз?» деген айдар аясында едел-жедел сұхбат ұйымдастырып, бұл тақырыпты одан әрі тереңдете зерттей бастады. Бұл сұхбатында ғалым «Аруақты қозғамайық. Мұстафа атамыз қазір Еуропа мен Азияны, Батыс пен Шығысты байланыстырып жатыр» деген пікірін айтады. Қазақ баспасөзінде жалған ақпараттардың түп-төркінін зерттеу – журналистік зерттеулерге ұласып, бұрын белгісіз болып келген ақпараттардың ашылуына түрткі болады деуге толық негіз бар. Яғни мұндағы айтпағымыз – Мұстафа Шоқайдың зираты туралы жалған ақпарат таралмаса, басылым бұл тақырыпты дәл осы кезде қозғай қоюы екіталай еді.
Көп жағдайларда фейк жаңалықтардың артында адамдар мен белгілі бір топтардың саяси, қаржылық, басқа да мүдделері жасырулы тұрады. Оның тарихына үңілсек, Дьюк университетінің (АҚШ) Л.Н.Гумилев атындағы Еуразия ұлттық университетінің ХАБАРШЫСЫ. Журналистика сериясы ISSN:2616-7174, eISSN:2663-2500 50 № 2(143)/2023 журналистік зерттеу орталығының 2021 жылғы мәліметінше, «әлемде деректердің дұрыстығын тексеретін 391 жоба бар екен. Оның 378-і қазір жұмыс істеуде». Ал одан төрт жыл бұрынғы дерек бойынша, «Фактчек форматында жұмыс жасайтын алғашқы ресурстар осыдан 30 жылдай бұрын пайда болған, қазіргі кезде әлем бойынша олардың саны 114… Латын Америкасы, Африка құрлығы, Батыс Еуропа елдерінде өз фактчекинг платформалары бар. Ең ірі фактчек-ресурстар желісі АҚШ елінде, олардың саны 30-дан асады. Шығыс Еуропа елдерінде фактчек Чехия, Польша, Литва мемлекеттерінде бар. 2014 жылы фактчекбасылымдары Грузияда, ал 2015 жылы Украинада пайда болды».