Teza dată descrie structura și funcționalitățile unui pachet Python cu sursă deschisă pentru realizarea analizei secvențelor biologice. Lucrarea relatează istoria și contextul geneticii și a bioinformaticii, motivând importanța realizării unui asemenea pachet în limbajul de programare Python. În plus lucrarea descrie modulele și algoritmii principali din pachet care răspund de secvențele biologice, căutarea motif-urilor, tabele de frecvență a kmer-ilor, secvențierea peptidelor și pipeline-urile de procesarea a secvențelor biologice.
Aceasta este scrisă în limba engleză și conține 92 pagini, 5 tabele, 35 figuri, 38 listări de cod și 38 de referințe. Teza constă dintr-o listă de tabele, listă de figuri, introducere, trei capitole, concluzie și bibliografie. Acest document este destinat cititorilor specializati în domeniul tehnic.
The given thesis describes the structure and functionalities of an open-source Python package for analysis of biological sequences. It tells the history and the context of genetics and bioinformatics, explaining the motivation behind developing such a package in the Python programming language. Additionally thai work is describing the main modules and algorithms of the package that implement the biological sequences, motif search, frequency tables of k-mers, peptide sequencing and processing pipelines for biological sequences.. It is written in english and contains 92 pages, 5 tables, 35 figures, 38 code listings și 38 references. The thesis consists of a list of tables, a list of figures, introduction, three chapters, a conclusion and references. This document is intended for readers with technical background.