14.2.12

Ανάλυση των Βαλκανίων και της Δυτικής Ασίας με ChromoPainter/fineSTRUCTURE

Στα πλαίσια του Dodecad Project ολοκλήρωσα μια πρώτη ανάλυση των Ελλήνων μαζί με διάφορους άλλους πληθυσμούς από την Βαλκανική χερσόνησο και τη Δυτική Ασία χρησιμοποιώντας το συνδυασμό προγραμμάτων ChromoPainter και fineSTRUCTURE (paintmychromosomes.com).

Το αυτοσωματικό DNA, δηλαδή το DNA των 22 χρωματοσωμάτων πλην του X/Y κληρονομείται σε "κομμάτια". Κάθε άνθρωπος έχει ένα ζευγάρι από το χρωματόσωμα 1, ένα από το 2, κοκ. Το DNA σε κάθε χρωματόσωμα αποτελείται από κάποια κομμάτια που ανήκαν στον πατέρα του, και κάποια κομμάτια που ανήκαν στην μητέρα του.

Η ανασύνθεση των χρωματοσωμάτων (recombination) ενός παιδιού από τα χρωματοσώματα των γονέων του στο πέρασμα των γενεών δημιουργεί ολοένα και μικρότερα (σε μήκος) κομμάτια DNA που προέρχονται από τους προγόνους κάποιου ανθρώπου, αφού η ακολουθία DNA διαρκώς διασπάται και ανασυντίθεται σε κάθε γενεά.

Η τεχνική του ChromoPainter χρησιμοποιεί στατιστικές μεθόδους για να εξάγει χρήσιμες πληροφορίες από το DNA, κοιτάζοντας όχι μόνο το τί βάση έχει ο κάθε άνθρωπος σε κάθε σημείο του γονιδιώματός του (π.χ. A, C, G, ή T) αλλά ανασυνθέτοντάς το σε κομμάτια (chunks) συνεχούς DNA τα οποία είναι πανομοιότυπα με άλλους ανθρώπους (π.χ. ACCGGTT).

Μια αναλογία βοηθάει να κατανοήσουμε τη χρησιμότητα αυτών των τεχνικών. Φανταστείτε ένα βιβλίο όπου το κείμενο αποτελείται από τα γράμματα a, b, c, d, ... Αν δεν κοιτούσαμε μόνο τί γράμματα περιέχει ένα βιβλίο αλλά και τους συνδυασμούς των γραμμάτων, θα μπορούσαμε να εξάγουμε το συμπέρασμα πως ένα βιβλίο όπου βρίσκουμε τον συνδυασμό -ing στο τέλος των λέξεων είναι πιθανό να είναι γραμμένο στα Αγγλικά, ενώ ένα βιβλίο όπου βρίσκουμε το συνδυασμό -ano είναι γραμμένο στα Ιταλικά. Η τεχνική του ChromoPainter χρησιμοποιεί όλα τα στοιχεία, από απλά "γράμματα" έως μεγάλες ακολουθίες DNA.

To γεγονός πως το DNA κληρονομείται σε "κομμάτια" ονομάζεται σύνδεση (linkage). Χρησιμοποιώντας λοιπόν πληροφορίες για την σύνδεση γενετικών δεικτών, μαζί με πληροφορίες για την πιθανότητα το χρωματόσωμα να "σχιστεί/ανασυντεθεί" σε κάθε σημείο του μήκους του (recombination map), μπορούμε να συγκρίνουμε το DNA διαφορετικών ανθρώπων πολύ πιο "έξυπνα": αν έχουν λ.χ. μεγάλου μήκους κοινές ακολουθίες DNA τότε είναι πιθανόν να είναι συγγενείς, αν έχουν αρκετές μικρού μήκους ακολουθίες, μπορεί να ανήκουν στον ίδιο ή συγγενείς πληθυσμούς, ενώ αν έχουν λίγο (συγκριτικά) κοινό DNA μπορεί να ανήκουν σε ξεχωριστούς πληθυσμούς.

Οι διάφοροι άνθρωποι έχουν κοινό το 99% του DNA τους, αλλά οι μικρές διαφορές στο υπόλοιπο 1% αρκούν για να δημιουργήσουν τις πολλαπλές φαινοτυπικές διαφορές (π.χ. στο χρώμα των ματιών ή τη διαμόρφωση των χαρακτηριστικών του προσώπου) αλλά και να μας δώσουν ασφαλείς πληροφορίες για την προέλευσή τους.

Χρησιμοποιώντας αυτές τις τεχνικές λοιπόν μπόρεσα, χρησιμοποιώντας περίπου 250 χιλιάδες γενετικούς δείκτες να εντοπίσω 25 διαφορετικούς "πληθυσμούς" σε ένα σύνολο 413 ατόμων. Η όλη διαδικασία πήρε περίπου μια βδομάδα σε ένα μέσο σύγχρονο υπολογιστή, και τα αποτελέσματα είναι εντυπωσιακά.



Δεν θα αναλύσω λεπτομερώς όλες τις πτυχές αυτής της ανάλυσης. Όλα τα στοιχεία βρίσκονται εδώ (στα Αγγλικά).

Θα επιμείνω όμως σε ορισμένα σημεία. Χάρη στη συμμετοχή στο Dodecad Project, έχω τώρα ένα δείγμα 20 Ελλήνων (Greek_D) από διάφορες περιοχές εντός και εκτός της σημερινής Ελλάδας, καθώς και ενός Έλληνα της Κύπρου (Greek_Cypriot_D). Το υπάρχον δείγμα κατανέμεται σε τρεις υποομάδες:

  • pop8 όπου βρίσκονται Έλληνες από την ηπειρωτική Ελλάδα
  • pop14 όπου βρίσκονται Έλληνες από την Κρήτη, το Αιγαίο, τη Μικρά Ασία, την Καππαδοκία και τον Πόντο, με διάφορους βαθμούς πρόσμιξης με Έλληνες από την ηπειρωτική Ελλάδα
  • pop11 όπου βρίσκονται οι Ελληνοκύπριοι από μια δημοσιευμένη μελέτη (Cypriots) ο ένας Ελληνοκύπριος του Dodecad Project καθώς και 3 Τουρκοκύπριοι και ένας που έχει μερική Τουρκοκυπριακή καταγωγή
Ενδιαφέρον έχει επίσης και ο pop22 όπου βρίσκονται σειρά ατόμων από τον Πόντο διαφόρων εθνικοτήτων/γλωσσών.

Είναι σημαντικό να παρατηρήσουμε πως η τεχνική αυτή κατόρθωσε να ομαδοποιήσει σωστά άτομα που προέρχονται από διαφορετικούς πληθυσμούς. Στους μεν πληθυσμούς που αντιπροσωπεύονται από μεγάλο δείγμα (όπως οι Έλληνες, Τούρκοι, και Αρμένιοι) μπόρεσε να αντοπίσει υποομάδες πληθυσμών. Στους δε πληθυσμούς όπου τα δείγματα είναι μικρά (όπως π.χ. σε διάφορες ομάδες της Βαλκανικής ή στους διάφορους πληθυσμούς του Πόντου) ομαδοποίησε ορθά συγγενείς ή γεωγραφικά κοντινούς πληθυσμούς.

Όσο αυξάνονται ο αριθμός των δειγμάτων, τόσο θα αυξάνεται και η δυνατότητά μας να ανακαλύπτουμε την δομή των διαφόρων πληθυσμών. 

Για παράδειγμα, τα μικρά δείγματα Σλοβένων, Σέρβων, Βοσνίων, κτλ. ομαδοποιούνται τώρα στην pop18. Το ίδιο και τα μικρά δείγματα Τούρκων/Αρμενίων/Λαζών/Μουσουλμάνων Ποντίων από τον Πόντο στην ομάδα pop22. Αυτή η ομαδοποίηση θα μπορέσει πιθανότατα στο μέλλον να οδηγήσει σε πιο λεπτομερείς ομάδες, αρκεί να βρεθούν περισσότεροι συμμετέχοντες από τις συγκεκριμένες περιοχές.

Για παράδειγμα, αυτή τη στιγμή υπάρχει μόνο ένας αμιγής Κρητικός στο πρόγραμμα, ο οποίος βρίσκεται με διάφορους άλλους Έλληνες στην ομάδα pop14. Αν συμμετάσχουν αρκετοί Κρητικοί ακόμα, είναι πιθανό να δημιουργηθεί μια "Κρητική ομάδα" αντίστοιχη με αυτοί που έχουν οι πολλοί περισσότεροι Κύπριοι (pop11). Αντίστοιχα, αν συμμετάσχουν πολλοί Σέρβοι και Σλοβένοι, είναι πιθανόν να σπάσει η ομάδα pop18 και να δημιουργηθούν ομάδες Σέρβων και Σλοβένων.

Υπάρχουν επίσης και πληθυσμοί με καμία εκπροσώπηση, όπως Αλβανοί, 100% Ελληνοπόντιοι, 100% Έλληνες από το Ιόνιο, Μαυροβούνιοι, κοκ Είναι προφανές πως αν αυτές οι ομάδες έχουν κοινά γενετικά χαρακτηριστικά, αυτά δεν μπορούν να ανακαλυφθούν εάν δεν υπάρχει κανένας από αυτούς στο πρόγραμμα!

Γι' αυτό προσκαλώ όσους θέλουν να συμμετάσχουν στο Dodecad Project να ρίξουν μια ματιά στους όρους συμμετοχής και να επικοινωνήσουν μαζί μου στο dodecad@gmail.com για επιπλέον πληροφορίες.