IRTUM – Institutional Repository of the Technical University of Moldova

Aspect-Based sentiment analysis using n-grams, threshold adjustment, and 3-D sentivalues with a Naive Bayes ensemble

Show simple item record

dc.contributor.author KARATU, Musa Tanimu
dc.contributor.author MUNGADI, Ibrahim Musa
dc.contributor.author SHEHU, Anas
dc.date.accessioned 2026-05-24T11:30:46Z
dc.date.available 2026-05-24T11:30:46Z
dc.date.issued 2026
dc.identifier.citation KARATU, Musa Tanimu; Ibrahim Musa MUNGADI and Anas SHEHU. Aspect-Based sentiment analysis using n-grams, threshold adjustment, and 3-D sentivalues with a Naive Bayes ensemble. Journal of Engineering Science. 2026, vol. 33, nr. 1, pp. 81-96. ISSN 2587-3474, eISSN 2587-3482. en_US
dc.identifier.issn 2587-3474
dc.identifier.issn 2587-3482
dc.identifier.uri https://www.doi.org/10.52326/jes.utm.2026.33(1).06
dc.identifier.uri https://repository.utm.md/handle/5014/36309
dc.description.abstract Aspect-Based Sentiment Analysis (ABSA) supports fine-grained understanding of user opinions by identifying sentiment toward specific aspects. Nevertheless, many existing approaches either rely on rigid feature representations or adopt deep learning models that introduce high computational cost and limited interpretability, reducing their suitability for scalable soft computing systems. This study proposes a hybrid intelligence framework for ABSA that combines TF-IDF n-gram representations with three-dimensional lexicon-based sentiment values and a threshold-adjusted Naïve Bayes ensemble. Contextual information is captured using unigram, bigram, and trigram features, while semantic polarity, objectivity, and subjectivity scores derived from SentiWordNet provide complementary sentiment knowledge. A weighted fusion of Multinomial and Gaussian Naïve Bayes classifiers is employed, alongside adaptive threshold calibration to improve minority-class detection. Experiments on a large restaurant review dataset demonstrate that the proposed approach achieves an overall accuracy of 0.92 with strong macro-averaged and weighted F1-scores, outperforming multiple baseline and hybrid methods. Statistical significance is confirmed using the Wilcoxon signed-rank test. Computational complexity analysis shows linear scalability with respect to corpus size and document length. The results indicate that the proposed hybrid framework delivers an effective balance between accuracy, interpretability, and computational efficiency, making it suitable for scalable soft computing systems and resource-constrained sentiment analysis applications. en_US
dc.description.abstract Analiza Sentimentelor Bazată pe Aspecte (ABSA) susține o înțelegere fină a opiniilor utilizatorilor prin identificarea sentimentelor față de aspecte specifice. Cu toate acestea, multe abordări existente fie se bazează pe reprezentări rigide ale caracteristicilor, fie adoptă modele de învățare profundă care introduc costuri computaționale ridicate și o interpretabilitate limitată, reducând adecvarea lor pentru sistemele scalabile de soft computing. Acest studiu propune un cadru de inteligență hibrid pentru ABSA care combină reprezentări TF-IDF n-gram cu valori de sentimente bazate pe lexicon tridimensional și un ansamblu Naïve Bayes ajustat la prag. Informațiile contextuale sunt captate folosind caracteristici unigram, bigram și trigram, în timp ce scorurile de polaritate semantică, obiectivitate și subiectivitate derivate din SentiWordNet oferă cunoștințe complementare despre sentimente. Se utilizează o fuziune ponderată a clasificatorilor Naïve Bayes Multinomiali și Gaussieni, alături de calibrarea adaptivă a pragului pentru a îmbunătăți detectarea claselor minoritare. Experimentele pe un set mare de date de recenzii ale restaurantelor demonstrează că abordarea propusă atinge o precizie generală de 0,92 cu scoruri F1 macro-mediate și ponderate puternice, depășind multiple metode de bază și hibride. Semnificația statistică este confirmată folosind testul Wilcoxon. Analiza complexității computaționale arată scalabilitate liniară în raport cu dimensiunea corpusului și lungimea documentului. Rezultatele indică faptul că cadrul hibrid propus oferă un echilibru eficient între acuratețe, interpretabilitate și eficiență computațională, ceea ce îl face potrivit pentru sisteme scalabile de soft computing și aplicații de analiză a sentimentelor cu resurse limitate. en_US
dc.language.iso en en_US
dc.publisher Technical University of Moldova en_US
dc.relation.ispartofseries Journal of Engineering Science, 2026, vol. 33, nr. 1;
dc.rights Attribution-NonCommercial-NoDerivs 3.0 United States *
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/3.0/us/ *
dc.subject naïve bayes en_US
dc.subject restaurant reviews en_US
dc.subject customer satisfaction en_US
dc.subject n-grams en_US
dc.subject recenzii restaurante en_US
dc.subject satisfacţia clienţilor en_US
dc.subject n-grame en_US
dc.title Aspect-Based sentiment analysis using n-grams, threshold adjustment, and 3-D sentivalues with a Naive Bayes ensemble en_US
dc.type Article en_US


Files in this item

The following license files are associated with this item:

This item appears in the following Collection(s)

Show simple item record

Attribution-NonCommercial-NoDerivs 3.0 United States Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivs 3.0 United States

Search DSpace


Browse

My Account