IRTUM – Institutional Repository of the Technical University of Moldova

Metode lingvistice auto-supervizate pentru detectarea articolelor false din mass-media

Show simple item record

dc.contributor CATRUC, Mariana
dc.contributor.advisor GAVRILIȚA, Mihail
dc.contributor.author SPEIANU, Dana
dc.date.accessioned 2023-02-16T12:04:09Z
dc.date.available 2023-02-16T12:04:09Z
dc.date.issued 2023
dc.identifier.citation SPEIANU, Dana. Metode lingvistice auto-supervizate pentru detectarea articolelor false din mass-media: tz. de master: Programul de studiu: Ingineria software. Cond. şt. Mihail GAVRILIȚA, 2023. en_US
dc.identifier.uri http://repository.utm.md/handle/5014/22271
dc.description Fişierul ataşat conţine: Adnotare, Annotation, Table of contents, List of Figures, Abbreviations, Introduction, Bibliography. en_US
dc.description.abstract Această lucrare de cercetare a fost realizată pentru a studia eficiența utilizătii metodelor lingvistive auto-supervizate în sarcina de a detecta articolele media false. Astfel, s-au studiat metodele existente de detectare a articolelor media false, studiind și aspectele favorabile, cât și cele mai puțin favorabile. Utilitatea inteligenței artificiale crește cu pași majori în ultimul deceniu, fiind folosită pentru eficientizarea și îmbunătățirea proceselor ce anterior erau realizate manual de către oameni sau alte metode mai puțin eficiente. În domeniul procesării limbajului natural, deasemenea, au avut loc progrese majore mai ales în direcția tehnologiilor ce sunt folosite pentru reprezentarea cuvintelor ca vectori, deoarece calculatorul nu înțelege textul, pentru a transmite informațiile către modelul de clasificare. Există modele fără context care generează o reprezentare a unui singur cuvânt pentru fiecare din vocabular, dar sunt modelele contextuale (cum ar fi BERT, GPT) care iau în considerare și contextul în care este poziționat cuvântul. Aceste modele sunt pre-antrenate pe o cantitate imensă de date și generează vectori mai performanti pentru cuvinte. Marile companii ce au acces la o cantitate imensă de date au dezvoltat modele lingvistive ce au fost pre-antrenate pe acestea. Astfel, aceste modele pre-antrenate transformă cuvintele în vectori mult mai valoroși, prin urmare obținând performanțe remarcabile în sarcinile în care sunt aplicate. en_US
dc.description.abstract This research paper was carried out to study the effectiveness of using self-supervised linguistic methods in the task of detecting fake media articles. Thus, the existence of detecting fake media articles was studied, studying both the favorable and the less favorable aspects. The utility of artificial intelligence is growing by leaps and bounds in the last decade, being used to streamline and increase processes that were previously done manually by humans or other less efficient ones. In the field of natural language processing, also, there have been major advances especially in the direction of technologies that are used to represent words as vectors, since the computer does not understand the text, to transmit the information to the classification model. There are context-free models that generate a representation of a single word for each word in the vocabulary, but it is the contextual models (such as BERT, GPT) that also take into account the context in which the word is positioned. These models are pre-trained on a huge amount of data and generate better performing word vectors. Big companies that have access to a huge amount of data have developed language models that have been pre-trained on it. Thus, these pre-trained models transform words into much more valuable vectors, thereby achieving outstanding performance in the tasks in which they are applied. en_US
dc.language.iso ro en_US
dc.publisher Universitatea Tehnică a Moldovei en_US
dc.rights Attribution-NonCommercial-NoDerivs 3.0 United States *
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/3.0/us/ *
dc.subject articole media false en_US
dc.subject procesarea limbajului natural en_US
dc.subject modele pre-antrenate de limbaj en_US
dc.subject învățare prin transfer en_US
dc.subject fake media articles en_US
dc.subject natural language processing en_US
dc.subject pre-trained language models en_US
dc.subject fine-tuning en_US
dc.subject transfer learning en_US
dc.title Metode lingvistice auto-supervizate pentru detectarea articolelor false din mass-media en_US
dc.title.alternative Self-supervised language models for detecting fake media articles en_US
dc.type Thesis en_US


Files in this item

The following license files are associated with this item:

This item appears in the following Collection(s)

Show simple item record

Attribution-NonCommercial-NoDerivs 3.0 United States Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivs 3.0 United States

Search DSpace


Browse

My Account