IRTUM – Institutional Repository of the Technical University of Moldova

Video lip-sync methods for realistic speech-to-face synchronization: evaluation and enhancement

Show simple item record

dc.contributor.advisor BEȘLIU, Corina
dc.contributor.advisor COJOCARU, Svetlana
dc.contributor.author CERNEI, Ion
dc.date.accessioned 2026-02-26T09:14:43Z
dc.date.available 2026-02-26T09:14:43Z
dc.date.issued 2026
dc.identifier.citation CERNEI, Ion. Video lip-sync methods for realistic speech-to-face synchronization: evaluation and enhancement. Teză de master. Programul de studiu Ingineria software. Conducător ştiinţific BEȘLIU Corina, lect. univ. Universitatea Tehnică a Moldovei. Chișinău, 2026. en_US
dc.identifier.uri https://repository.utm.md/handle/5014/35485
dc.description Fişierul ataşat conţine: Rezumat, Abstract, Contents, Introduction, Bibliography. en_US
dc.description.abstract The report presents an in-depth examination of modern lip synchronization techniques and proposes an enhanced diffusion based framework for generating realistic, identity preserving, and temporally coherent speech driven facial animation. The project addresses persistent limitations in existing lip sync systems, such as inaccurate synchronization, identity drift, visual artifacts, and limited robustness to real world conditions, by integrating novel mechanisms for personalized orofacial modeling, occlusion aware inference, and efficient spatiotemporal sequence processing. Across its chapters, the thesis reviews theoretical foundations, outlines the research methodology, details the architectural and implementation components of the proposed system, and presents comprehensive experimental evaluations. Objective and subjective assessments confirm substantial improvements in synchronization accuracy, visual realism, and occlusion robustness compared to state of the art baselines. The resulting framework demonstrates strong potential for practical applications in dubbing, digital avatars, virtual communication, and multimodal media generation. en_US
dc.description.abstract Raportul prezintă o analiză amplă a tehnicilor moderne de sincronizare labială și propune un cadru avansat bazat pe modele de difuzie pentru generarea unor mișcări faciale realiste, coerente temporal și conforme identității persoanei. Proiectul abordează limitările metodelor existente, precum discrepanțe de sincronizare, pierderea identității, apariția artefactelor vizuale și ineficiența în condiții reale, prin introducerea unor mecanisme inovatoare pentru modelarea stilului orofacial, generarea cu detectarea de obstacole și procesare spațio-temporală eficientă. Pe parcursul capitolelor, teza prezintă fundamentele teoretice, metodologia de cercetare, arhitectura și detaliile de implementare ale sistemului propus, precum și o evaluare experimentală riguroasă. Rezultatele, analizate prin metrici obiective și evaluări subiective, confirmă îmbunătățiri semnificative în acuratețea sincronizării, realismul vizual și evitarea ocluziilor, depășind performanța metodelor alternative. Sistemul demonstrat în această lucrare are potențial pentru aplicații practice în dublaj video, avatare digitale, comunicare virtuală și generare de conținut. en_US
dc.language.iso en en_US
dc.publisher Universitatea Tehnică a Moldovei en_US
dc.rights Attribution-NonCommercial-NoDerivs 3.0 United States *
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/3.0/us/ *
dc.subject lip‑synchronization en_US
dc.subject speech‑driven facial animation en_US
dc.subject digital avatars en_US
dc.subject virtual communication en_US
dc.title Video lip-sync methods for realistic speech-to-face synchronization: evaluation and enhancement en_US
dc.title.alternative Metodologii de sincronizare labială în video: evaluarea și îmbunătățirea alinierii dintre vorbire și expresiile faciale en_US
dc.type Thesis en_US


Files in this item

The following license files are associated with this item:

This item appears in the following Collection(s)

Show simple item record

Attribution-NonCommercial-NoDerivs 3.0 United States Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivs 3.0 United States

Search DSpace


Browse

My Account