This work is devoted to the development of a system for automatic detection of fake news in Russian, relevant for the region of the Republic of Moldova and its neighboring countries. Initially, a representative dataset of fake and real news was collected from the news sites. Several machine learning models were applied for fake news detection, including Naive Bayes classifier, logistic regression, nearest neighbors, support vector machines, and random forest. The results demonstrated that support vector machines and random forest provide the highest accuracy of classification, reaching 91%, which is an impressive result for such difficult task. The developed system helps protecting society from disinformation, which is especially important in the modern world, where the information warfare and political manipulation have become commonplace.
Această lucrare este dedicată dezvoltării unui sistem de detectare automată a știrilor false în limba rusă relevante pentru regiunea Republicii Moldova și țările vecine. Inițial, a fost colectat un set reprezentativ de știri false și reale de pe site-urile de noutăți. Mai multe modele de învățare automată au fost aplicate pentru detectarea știrilor false, inclusiv clasificatorul Naive Bayes, regresia logistică, metoda vecinilor celor mai apropiați, mașinile cu vectori de suport și pădure aleatorie de arbori decizionali. Rezultatele au demonstrat că mașinile cu vectori de suport și pădure aleatorie de arbori decizionali oferă cea mai mare precizie de clasificare, ajungând la 91%, ceea ce reprezintă un rezultat impresionant pentru o sarcină atât de dificilă. Sistemul dezvoltat ajută la protejarea societății de dezinformare, ceea ce este deosebit de important în lumea modernă, unde războiul informațional și manipularea politică au devenit o realitate zilnică.