Τα οξυγαλακτικά βακτήρια είναι μία από τις πιο σημαντικές ομάδες βακτηρίων για τη βιομηχανία. Τα βακτήρια αυτά χρησιμοποιούνται στην παραγωγή τροφίμων και ζωοτροφών, στη βελτίωση της υγείας του ανθρώπου και των ζώων, στην παραγωγή μακρομορίων, ενζύμων και διαφόρων μεταβολιτών. Τα τελευταία χρόνια, η αλληλούχιση όλο και περισσότερων οξυγαλακτικών βακτηρίων καθώς και η ανάλυσή τους με εργαλεία βιοπληροφορικής μας έχει προσφέρει πρωτοφανείς ευκαιρίες για να ανακαλύψουμε σημαντικά χαρακτηριστικά των βακτηρίων αυτών. Η αλληλούχιση ολόκληρων γονιδιωμάτων μπορούν να παρέχουν σημαντικές πληροφορίες σχετικά με το τεχνολογικό και το προβιοτικό δυναμικό ενός στελέχους. Επιπλέον, η γονιδιωματική ανάλυση ενός στελέχους ή η συγκριτική γονιδιωματική ανάλυση μεταξύ φυλογενετικά κοντινών (ή μη) στελεχών/ειδών μπορεί να προσφέρει σημαντικές γνώσεις, όπως η βακτηριακή ποικιλομορφία και η προσαρμογή σε ποικίλους οικολογικούς θώκους.
Στα πλαίσια της παρούσας διδακτορικής διατριβής, τρία "άγρια" στελέχη οξυγαλακτικών βακτηρίων, ο Lactobacillus zymae ACA-DC 3411, ο Lactobacillus rennini ACA-DC 565 και ο Lactobacillus acidipiscis ACA-DC 1533, τα οποία έχουν απομονωθεί από παραδοσιακά Ελληνικά προϊόντα ζύμωσης και συγκεκριμένα από προζύμι, Μάνα Κοπανιστή και Κοπανιστή, αντιστοίχως, αλληλουχήθηκαν με τεχνικές υψηλής απόδοσης και τα γονιδιώματά τους σχολιάστηκαν χρησιμοποιώντας πληθώρα σύγχρονων εργαλείων βιοπληροφορικής. Αξίζει να σημειωθεί ότι αυτές είναι τα πρώτες ολόκληρες χρωμοσωμικές αλληλουχίες για κάθε ένα από τα αντίστοιχα είδη, καθώς οι υπόλοιπες αλληλουχίες που βρίσκονται στις διάφορες βάσεις δεδομένων είναι μερικώς αλληλουχιμένες.
Η ανάλυση της χρωμοσωμικής αλληλουχίας του στελέχους L. zymae ACA-DC 3411 μεγέθους 2,7 Mbp αναγνώρισε ένα σύστημα περιορισμού-τροποποίησης (RM) τύπου Ι, 19 γονιδιωματικές νήσους που περιείχαν συνολικά 265 γονίδια τα οποία πιθανότατα να προήλθαν από οριζόντια μεταφορά, τέσσερις ημιτελείς και μία υπο αμφισβήτηση αλληλουχίες προφάγων και έξι επιβεβαιωμένα και έξι υπο αμφισβήτηση συστήματα που ονομάζονται συγκεντρωμένες τακτικές παρεμβαλλόμενες σύντομες παλινδρομικές επαναλήψεις (CRISPR). Επιπλέον, η λειτουργική ταξινόμηση των γονιδίων που κωδικοποιούν πρωτεΐνες στις διάφορες ορθόλογες ομάδες γονιδίων (COG) έδειξε ότι 1.930 γονίδια (περίπου 80%) εντοπίστηκαν σε τουλάχιστον μία κατηγορία COG. Η κατηγορία COG με τα περισσότερα γονίδια (14%) σχετίζεται με την αντιγραφή, τον ανασυνδυασμό και την επιδιόρθωση του DNA.
H ανάλυση της χρωμοσωμικής αλληλουχίας του L. rennini ACA-DC 565 μεγέθους 2,4 Mbp αναγνώρισε αρκετές πρωτεΐνες τοξίνης-αντιτοξίνης, ένα σύστημα RM τύπου II και πέντε συστήματα CRISPR με τις σχετικές πρωτεΐνες cas. Επιπλέον, προσδιορίστηκε μια ημιτελής αλληλουχία προφάγου μήκους 17,1 Kbp που περιείχε οκτώ γονίδια φάγων, επτά γονίδια βακτηρίων και δύο γονίδια με υποθετική λειτουργία. Σύμφωνα με τα αποτελέσματα της κατανομής των γονιδίων στις διάφορες λειτουργικές κατηγορίες COG, 1.900 γονίδια (περίπου 87,7%) κατατάχθηκαν κάποια κατηγορία COG, ενώ η κατηγορία COG με τα περισσότερα γονίδια (9,33%) σχετίζεται με τη μεταφορά και το μεταβολισμό των υδατανθράκων.
Ενώ για τα είδη L. zymae και L. rennini, υπήρχε μόνο ένα γονιδίωμα μερικώς αλληλουχημένο στο Εθνικό Κέντρο Βιοτεχνολογικών Πληροφοριών ο L. zymae DSM 19395T και ο L. rennini DSM 20253T, αντίστοιχα, στην περίπτωση του L. acidipiscis υπήρχαν τέσσερα γονιδιώματα μερικώς αλληλουχημένα για τα στελέχη KCTC 13900, DSM 15353, JCM 10692T και DSM 15836T. Παρόλαυτά πρέπει να σημειωθεί ότι τα στελέχη KCTC 13900 και DSM 15353 είναι κλώνοι, όπως συμβαίνει και με τα στελέχη στελέχη JCM 10692T και DSM15836T το οποίο φάνηκε σε θερμικό χάρτη που υπολογίζει το ποσοστό ομοιότητας μεταξύ 2 αλληλουχιών. Λόγω του ότι η ανάγκη για την εύρεση διαφορών μεταξύ στελεχών γίνεται όλο και πιο απαραίτητη, κάναμε συγκριτική γονιδιωματική ανάλυση μεταξύ των τριών στελεχών του L. acidipiscis (ACA-DC 1533, KCTC 13900 και JCM 10692T). Με βάση τα αποτελέσματα της ανάλυσης του παν-γονιδιώματος, του κοινού γονιδιώματος μεταξύ των στελεχών, αλλά και των μοναδικών γονιδίων κάθε στελέχους, τα τρία στελέχη του L. acidipiscis παρουσίασαν υψηλό βαθμό συντήρησης σε επίπεδο γονιδιώματος. Επιπλέον, φάνηκε ότι τα στελέχη ACA-DC 1533 και JCM 10692T δεν διαθέτουν συστήματα CRISPR αλλά έχουν δύο παρόμοιες περιοχές προφάγων στα γονιδιώματά τους παρόλο που έχουν απομονωθεί από διαφορετικά οικοσυστήματα, τα οποία είναι η Κοπανιστή και ζυμούμενο ψάρι, αντίστοιχα. Αντίθετα, η ανάλυση των συστημάτων CRISPR του στελέχους KCTC 13900 έδειξε ότι το βακτήριο έχει αποκτήσει ανοσία προφάγους που βρέθηκαν στα άλλα δύο στελέχη του L. acidipiscis. Παρόλαυτά, μια αλληλουχία προφάγου που δεν βρέθηκε στα στελέχη ACA-DC 1533 και JCM 10692T βρέθηκε στο στέλεχος KCTC 13900. Τα ευρήματα αυτά υποδηλώνουν την ύπαρξη γενεαλογικού χαρακτήρα εντός του είδους. Από τα παραπάνω μοτίβα παρουσίας/απουσίας γενετικών χαρακτηριστικών στα τρία γονιδιώματα, φαίνεται ότι τα στελέχη ACA-DC 1533 και JCM 10692T είναι περισσότερο κοντά παρόλο που έχουν απομονωθεί από διαφορετικά οικοσυστήματα.
Δεδομένου ότι ο L. acidipiscis ανήκει στον κλάδο του Lactobacillus salivarius, ο οποίος αποτελείται κυρίως από συμβιωτικά είδη, πραγματοποιήθηκε συγκριτική γονιδιωματική ανάλυση μεταξύ επιλεγμένων στελεχών του κλάδου για να διερευνηθεί το επίπεδο ποικιλομορφίας μεταξύ των γονιδιωμάτων. Η συγκριτική γονιδιωματική ανάλυση μεταξύ των L. acidipiscis ACA-DC 1533, L. salivarius UCC118 και Lactobacillus ruminis ATCC 27782 αποκάλυψε σημαντικές διαφορές στον αριθμό των πρωτεϊνών που σχετίζονται με μεταβολισμό των υδατανθράκων, των πρωτεολυτικών ενζύμων, των μεταφορέων, των αλληλουχιών εισαγωγής και των ρυθμιστικών πρωτεινών. Στη συνέχεια διερευνήθηκε το προβιοτικό δυναμικό του L. acidipiscis ACA-DC 1533 σε σύγκριση με τον προβιοτικό L. salivarius UCC118, ωστόσο δεν βρέθηκαν προφανή γονιδιωματικά χαρακτηριστικά που να υποστηρίζουν ένα προβιοτικό δυναμικό για το στέλεχος ACA-DC 1533. Επιπλέον, η εύρεση μεταφορέων γλυκίνης- βεταΐνης στο χρωμόσωμα του ACA-DC 1533 θα μπορούσε να εξηγήσει την ικανότητα του στελέχους/είδους να αναπτυχθεί σε ζυμούμενα τρόφιμα με υψηλές συγκεντρώσεις άλατος. Τέλος, εντοπίστηκαν αρκετά γονίδια στο γονιδίωμα του ACA-DC 1533 που κωδικοποιούν ένζυμα κλειδιά τα οποία εμπλέκονται σε μεταβολικά μονοπάτια (κυρίως κατά τον καταβολισμό των αμινοξέων) από τα οποία παράγονται πτητικές ενώσεις, συμβάλλοντας με αυτόν το τρόπο στην ιδιαίτερη πικάντικη γεύση της Κοπανιστής.
Lactic acid bacteria (LAB) are one of the most industrially important groups of bacteria. They are used in a variety of ways, including food and feed production, health improvement in humans and animals, and production of macromolecules, enzymes and various metabolites. In recent years, the genome sequencing of LAB is booming and the increased amount of published genomics data brings unprecedented opportunity for us to reveal the important traits of LAB. Whole-genome sequences can provide significant information concerning the technological and probiotic potential of a strain. Furthermore, genomic analysis of a strain or comparative genomics among closely related (or not) strains/species could deliver important knowledge, such as bacterial diversity and adaptation to diverse ecological niches.
In the course of the present thesis, three “wild” LAB strains, namely Lactobacillus zymae ACA-DC 3411, Lactobacillus rennini ACA-DC 565 and Lactobacillus acidipiscis ACA-DC 1533, isolated from traditional Greek wheat sourdough, Mana Kopanisti and Kopanisti cheese, respectively, were sequenced by high-throughput sequencing techniques and annotated using a plethora of bioinformatics tools. It is worth noting that these are the first completely sequenced chromosomal assemblies for each of the respective species, since the rest of publicly available genome assemblies are only partially sequenced.
Analysis of the L. zymae ACA-DC 3411 chromosomal sequence (2.7 Mbp) identified one type I restriction-modification (RM) system, 19 integrated genomic islands containing a total of 265 genes potentially acquired through horizontal gene transfer, four incomplete and one questionable prophage sequences, as well as six confirmed and six questionable Clustered Regularly Interspaced Short Palindromic Repeats (CRISPR) systems. Furthermore, cluster of orthologous groups (COG) functional classification of the L. zymae protein-coding genes revealed that 1,930 of them (approximately 80%) were assigned to at least one COG category with the most abundant being related to replication, recombination and repair (14%).
Analysis of the L. rennini ACA-DC 565 chromosomal sequence (2.4 Mbp) identified toxin-antitoxin proteins, a type II RM system and five CRISPR systems with their associated cas proteins. Furthermore, an incomplete prophage sequence of 17.1 Kbp length containing eight phage-related, seven bacterial and two hypothetical proteins was also identified. According to the COG results, 1,900 protein-coding genes (approximately 87.7%) were assigned to a putative COG category with the most abundant being related to carbohydrate transport and metabolism (9.33%).
Compared to the species L. zymae and L. rennini, where only a sole partial genome sequence was available in the beginning of the present thesis (L. zymae DSM 19395T and L. rennini DSM 20253T, respectively) in the National Center for Biotechnology Information database, in the case of L. acidipiscis four partially sequenced genome assemblies were reported, namely KCTC 13900, DSM 15353, JCM 10692T and DSM15836T. It should be noted though, that L. acidipiscis strains KCTC 13900 and DSM 15353 are replicas of the same strain and the same applies for strains JCM 10692T and DSM15836T, as confirmed by an average nucleotide identity heat map. Since the need to identify strain-specific differences has become increasingly vital, comparative genomic analysis among three L. acidipiscis strains (ACA-DC 1533, KCTC 13900 and JCM 10692T) was performed. Based on the results of the pan/core-genome and singleton analysis, L. acidipiscis strains exhibited a high degree of conservation at the genome level. Furthermore, strains ACA-DC 1533 and JCM 10692T, which lack CRISPR arrays, carry two similar prophage sequences although they have been isolated from different ecological niches, i.e. Kopanisti cheese and fermented fish, respectively. On the contrary, strain KCTC 13900 seems to have acquired immunity to these prophages based on the sequences of spacers in its CRISPRs. Nevertheless, a prophage sequence that was absent from strains ACA-DC 1533 and JCM 10692T was identified in strain KCTC 13900. Interestingly, these results suggest a potential existence of lineages within the species. Based on the abovementioned presence/absence patterns of these genomic traits, strains ACA-DC 1533 and JCM 10692T appeared to be quite related despite the different isolation source.
Since L. acidipiscis belongs to the Lactobacillus salivarius clade, which is mainly consists of commensal isolates, comparative genomics among representative strains in the clade was performed to investigate the level of their genomic diversity. Thus, comparative genomic analysis among L. acidipiscis ACA-DC 1533, L. salivarius UCC118 and Lactobacillus ruminis ATCC 27782 revealed significant differences in the number of glycobiome-related proteins, proteolytic enzymes, transporters, insertion sequences and regulatory proteins. Additionally, the probiotic potential of L. acidipiscis ACA-DC 1533 was investigated and compared to the extensively studied probiotic L. salivarius UCC118 strain; however, no obvious genomic traits supporting a probiotic potential of ACA-DC 1533 strain were found. Furthermore, the detection of glycine-betaine transporters in the ACA-DC 1533 chromosome may explain the ability of the strain/species to grow in fermented foods with high salt concentrations. Finally, in silico analysis of the ACA-DC 1533 chromosome identified genes encoding key enzymes involved in metabolic pathways (mainly during the amino acids catabolism) that could underpin the production of major volatile compounds, thus contributing to the distinct piquant flavor of Kopanisti cheese.