IRTUM – Institutional Repository of the Technical University of Moldova

Analiza comparativă a algoritmilor de inteligență artificială

Show simple item record

dc.contributor.advisor ISTRATI, Daniela
dc.contributor.advisor COJOCARU, Svetlana
dc.contributor.author GURANDA, Valeria
dc.date.accessioned 2025-01-31T13:59:36Z
dc.date.available 2025-01-31T13:59:36Z
dc.date.issued 2025
dc.identifier.citation GURANDA, Valeria. Analiza comparativă a algoritmilor de inteligență artificială. Teză de master. Programul de studiu Tehnologia Informației. Conducător ştiinţific ISTRATI Daniela. Universitatea Tehnică a Moldovei. Chișinău, 2025. en_US
dc.identifier.uri http://repository.utm.md/handle/5014/29249
dc.description Fişierul ataşat conţine: Rezumat, Abstract, Cuprins, Lista abrevierilor, Bibliografie. en_US
dc.description.abstract Lucrarea de față oferă o analiză comparativă detaliată a performanței mai multor algoritmi de inteligență artificială, având ca scop evaluarea eficienței acestora în diverse contexte aplicative. Studiul include atât algoritmi de clasificare, cum ar fi Naive Bayes, Logistic Regression, SVM, KNN, și Random Forest, cât și algoritmi probabilistici, pentru a investiga impactul diferitelor tehnici de învățare asupra seturilor de date specifice. Seturile de date utilizate în acest studiu sunt Spam, Iris și Cancer, reprezentând domenii diverse precum detecția de spam, clasificarea speciilor de flori și predicția riscului de cancer. În cadrul analizei comparative, performanța fiecărui algoritm a fost evaluată pe baza unor metrici esențiale, inclusiv acuratețea, recall, precizia, scorul F1 și timpul de execuție, pentru a înțelege atât eficiența în termenii corectitudinii, cât și impactul resurselor utilizate. Aceste metrici au permis identificarea punctelor forte și a limitărilor fiecărui algoritm în funcție de caracteristicile setului de date și de cerințele specifice ale fiecărei aplicații. Un aspect important al analizei a fost legat de timpul de execuție al algoritmilor, care a fost comparat în condițiile unor seturi de date de dimensiuni variabile. Astfel, s-a observat că algoritmii precum Naïve Bayes și Logistic Regression au avut performanțe rapide, dar cu variații în precizie, în timp ce algoritmi mai complecși precum SVM și Random Forest au demonstrat o acuratețe mai mare, dar cu costuri de calcul mai ridicate. Aceste observații au permis formularea de recomandări pentru optimizarea performanței algoritmilor, inclusiv ajustarea hiperparametrilor și implementarea unor metode de paralelizare a procesului de învățare. Lucrarea propune și direcții pentru cercetări viitoare, precum analiza algoritmilor pe seturi de date mult mai mari, pentru a evalua scalabilitatea și eficiența acestora în condiții de volum mare de date. În plus, se propune analiza comportamentului algoritmilor în condiții de date incomplete sau zgomotoase, identificând algoritmii care sunt mai rezistenți la astfel de perturbări și care pot asigura rezultate fiabile într-un mediu de date mai variabil. O altă direcție de cercetare sugerată este compararea performanței între modelele probabilistice și cele deterministe, pentru a înțelege mai bine avantajele și limitările fiecărei abordări în funcție de tipul de problemă de rezolvat. Această lucrare subliniază importanța selecției algoritmului optim pe baza cerințelor specifice ale aplicațiilor, oferind totodată o evaluare detaliată a performanței acestora. De asemenea, concluziile sugerează necesitatea continuării cercetărilor pentru îmbunătățirea eficienței algoritmilor în condiții variabile de date și resurse, în scopul implementării unor soluții mai rapide și mai precise în diverse domenii ale inteligenței artificiale. en_US
dc.description.abstract This study provides a detailed comparative analysis of the performance of several artificial intelligence algorithms, aiming to evaluate their effectiveness in various application contexts. The study includes both classification algorithms, such as Naive Bayes, Logistic Regression, SVM, KNN, and Random Forest, as well as probabilistic algorithms, to investigate the impact of different learning techniques on specific datasets. The datasets used in this study are Spam, Iris, and Cancer, representing diverse domains such as spam detection, flower species classification, and cancer risk prediction. In the benchmarking, the performance of each algorithm was evaluated based on key metrics, including accuracy, recall, precision, F1 score, and execution time, to understand both the efficiency in terms of correctness and the impact of the resources used. These metrics made it possible to identify the strengths and limitations of each algorithm depending on the characteristics of the data set and the specific requirements of each application. An important aspect of the analysis was related to the execution time of the algorithms, which was compared under the conditions of data sets of variable sizes. Thus, it was observed that algorithms such as Naive Bayes and Logistic Regression performed fast but with variations in accuracy, while more complex algorithms such as SVM and Random Forest demonstrated higher accuracy but with higher computational costs. These observations allowed the formulation of recommendations for optimizing the performance of the algorithms, including the adjustment of hyperparameters and the implementation of some methods of parallelization of the learning process. The study also suggests directions for future research, such as analyzing the algorithms on much larger datasets to assess their scalability and efficiency under high data volume conditions. In addition, it is proposed to analyze the behavior of algorithms under conditions of incomplete or noisy data, identifying algorithms that are more robust to such perturbations and that can provide reliable results in a more variable data environment. Another suggested research direction is to compare the performance between probabilistic and deterministic models to better understand the advantages and limitations of each approach depending on the type of problem to be solved. This studyemphasizes the importance of selecting the optimal algorithm based on the specific requirements of the applications, while providing a detailed evaluation of their performance. Also, the conclusions suggest the need for continued research to improve the efficiency of algorithms under variable conditions of data and resources, in order to implement faster and more accurate solutions in various fields of artificial intelligence. en_US
dc.language.iso ro en_US
dc.publisher Universitatea Tehnică a Moldovei en_US
dc.rights Attribution-NonCommercial-NoDerivs 3.0 United States *
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/3.0/us/ *
dc.subject algoritmi en_US
dc.subject inteligență artificială en_US
dc.subject analiză comparativă en_US
dc.title Analiza comparativă a algoritmilor de inteligență artificială en_US
dc.type Thesis en_US


Files in this item

The following license files are associated with this item:

This item appears in the following Collection(s)

Show simple item record

Attribution-NonCommercial-NoDerivs 3.0 United States Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivs 3.0 United States

Search DSpace


Browse

My Account