Ξεκίνησα ένα πρόγραμμα ανάλυσης γενετικών δεδομένων (Dodecad Ancestry Project) που προέρχονται από πελάτες της εταιρείας 23andMe (Δεν συστήνω ούτε αυτή ούτε καμιά άλλη εταιρεία, αλλά η συγκεκριμένη έχει αρκετά μεγάλο αριθμό πελατών, και είναι βολική για τους σκοπούς του προγράμματός μου).
Στο διαδίκτυο υπάρχουν ήδη αρκετά δημοσιευμένα δείγματα από πολλές μελέτες με εκατοντάδες χιλιάδες δείκτες SNP. Είναι λοιπόν δυνατόν να αναλυθούν από οποιονδήποτε έχει έναν μέσο υπολογιστή και δωρεάν επιστημονικό λογισμικό όπως το PLINK και το ADMIXTURE.
Αναλύοντας αυτά τα δεδομένα είναι δυνατό να διακριθούν αρκετές συνιστώσες της σύστασης των Ευρασιατικών πληθυσμών. Έχω κάνει πολλές τέτοιες αναλύσεις στο άλλο μου blog και για το Dodecad Project, χρησιμοποιώ 10 συνιστώσες με ενδιαφέρουσα κατανομή στον χώρο της Ευρασίας και Αφρικής (*)
Οι δέκα αυτές συνιστώσες παρουσιάζουν μέγιστο στην Βόρεια Ευρώπη, Νότια Ευρώπη, Καύκασο/Δυτική Ασία, Αραβία/Νοτιοδυτική Ασία, Βορειοδυτική Αφρική, Δυτική Αφρική, Ανατολική Αφρική, Νότια Ασία, Βορειοανατολική Ασία και Ανατολική Ασία.
Οι συμμετέχοντες στο πρόγραμμα υποβάλλουν τα γενετικά τους δεδομένα και λαμβάνουν τα ποσοστά ανάμιξης από αυτές τις δέκα συνιστώσες. Μέχρι στιγμής υπάρχουν εξαιρετικά ενδιαφέροντα δεδομένα, και μπορείτε να δείτε ορισμένα ποσοστά ανάμιξης εδώ.
Η μεγάλη πρόκληση για το μέλλον
Πέραν από το ενδιαφέρον μου να φέρω τις ανακαλύψεις της σύγχρονης γενετικής (δωρεάν) από τις σελίδες των επιστημονικών περιοδικών σε ένα ευρύτερο κοινό, το κίνητρο μου στο Dodecad Project είναι κυρίως να καλύψω μια μεγάλη "τρύπα" που υπάρχει αυτή τη στιγμή στις γενετικές έρευνες.
Δυστυχώς υπάρχουν ελάχιστα ελεύθερα προσβάσιμα αυτοσωματικά γενετικά δεδομένα από επιστημονικές μελέτες στο διαδίκτυο για ορισμένες περιοχές του κόσμου. Μια από αυτές είναι η δική μας: υπάρχει ένα μικρό δείγμα Τούρκων, ένα δείγμα Ρουμάνων, και ένα δείγμα Τοσκάνων. Οι κρίσιμες περιοχές της Νότιας Ιταλίας, Σικελίας, ολόκληρης της Βαλκανικής (μαζί με την Ελλάδα) απουσιάζουν τελείως.
Σκοπός μου είναι να συλλέξω και αναλύσω τέτοια δεδομένα για να δούμε πώς ταιριάζουμε εμείς και οι γείτονές μας στον γενετικό χάρτη της Ευρασίας. Είναι επίσης δυνατό να ανακαλύψουμε μια επιπλέον συνιστώσα στις 10 υπάρχουσες, που θα εδράζεται στον δικό μας γεωγραφικό χώρο. Δίχως τα ανάλογα δείγματα, αυτό είναι αδύνατο.
Γι' αυτό παροτρύνω όσους Έλληνες έχουν κάνει τεστ στην 23andMe να μου στείλουν τα δεδομένα τους, και φυσικά δεν πρόκειται να δημοσιευθούν ή διανεμηθούν ούτε τα δεδομένα τους, ούτε οποιοδήποτε βιογραφικό τους στοιχείο, ούτε θα αναλυθούν για οποιονδήποτε άλλο σκοπό από αυτόν της ανάλυσης καταγωγής.
Η πιλοτική φάση υποβολής των δεδομένων τελειώνει στις 31 Οκτωβρίου, αλλά φυσικά για τους Έλληνες θα δέχομαι δεδομένα και μετά από αυτή την ημερομηνία. Παρακαλώ όμως να μου στείλετε πρώτα ένα e-mail στο dodecad@gmail.com για να σας επιβεβαιώσω πως μπορώ να δεχτώ και να επεξεργαστώ τα δεδομένα σας.
(*) Φυσικά ελπίζω να αυξήσω αυτό τον αριθμό από το 10, και γι' αυτό ονόμασα το πρόγραμμα Dodecad, μιας και το 12 είναι ένα αρχαίο σύμβολο της πληρότητας.