Κασέτες και DNA για την αντιμετώπιση της έκρηξης των ψηφιακών μας δεδομένων

Η έρευνα, η βιομηχανία και τα άτομα συγκεντρώνουν όλο και περισσότερα ψηφιακά δεδομένα. Τόσο πολύ που οι σκληροί δίσκοι και άλλες συσκευές εγγραφής σύντομα θα κατακλυστούν. Για να αντισταθμιστεί το έλλειμμα του μέλλοντος, μια αρχαιότητα εξελίσσεται διαρκώς: οι μαγνητικές κασέτες, ενώ περιμένουν την τεχνολογία αιχμής που βασίζεται στο DNA.

α σε μια φωτογραφία, βίντεο στο Instagram οδηγώΤου ΗΛΕΚΤΡΟΝΙΚΗ ΔΙΕΥΘΥΝΣΗ… κάθε άτομο συγκεντρώνει σημαντικό όγκο ψηφιακών δεδομένων, συνεχώς αυξανόμενο με τις νέες τεχνολογίες που έχουμε στη διάθεσή μας – βίντεο σε 4K, ροή στο Netflix – όλα αποθηκευμένα όχι σε σκληρούς δίσκους, αλλά στο “σύννεφο”, ” σύννεφα “, μερικές φορές εκατοντάδες χιλιόμετρα από μόνα τους. Αλλά αυτά τα δεδομένα, αν και πολύ γνωστά, δεν είναι τα πιο βαριά δεδομένα στα “Big Data”, μαζικά δεδομένα.

Η έρευνα έχει πολύ πιο σημαντική συμβολή. Τα ανθρώπινα επιστημονικά πειράματα είναι βαριά, πολύ βαριά: Ευρωπαϊκός Οργανισμός Πυρηνικής Έρευνας, CERN, κοντά στη Γενεύη, από τη δημιουργία του, έχει συσσωρεύσει πάνω από 100 petabytes (PB) εικόνων, ακατέργαστων δεδομένων, πληροφοριών για τις μελλοντικές γενιές που επιθυμούν να τα μελετήσουν. 1 Terabyte (TB) σκληρών δίσκων προς πώληση για 100 άτομα PO ισοδυναμεί με περίπου 102.400…

Η πρώτη εικόνα της μαύρης τρύπας M87* απαιτούσε τεράστιο όγκο δεδομένων.
Η πρώτη εικόνα της μαύρης τρύπας M87* απαιτούσε τεράστιο όγκο δεδομένων. Τηλεσκόπιο Event Horizon (EHT)/Εθνικό Ίδρυμα Επιστημών/Handau

πρώτη φωτογραφία της μαύρης τρύπας Απαιτούνται περίπου 5 PO, που ισοδυναμούν με 5.000 σκληρούς δίσκους 1 TB. Η βιομηχανία, όπως το Twitter, η EDF ή οποιαδήποτε εταιρεία με ελάχιστη ψηφιοποίηση, είναι άλλοι συνεισφέροντες στα Big Data.

φυσικά όρια

Μεταξύ 2010 και 2020, ο όγκος των πληροφοριών που περιέχονται σε τεράστια δεδομένα έχει πολλαπλασιαστεί κατά περισσότερο από 30, πηγαίνοντας από 2 zettabyte (2 εκατομμύρια PO) σε 60 zettabyte. Και ο ρυθμός επιταχύνεται. Μέχρι το 2025, η ανθρωπότητα αναμένεται να παράγει 175 Zettabyte δεδομένων.

Ο François Capes, ο κυτταρικός βιολόγος υπεύθυνος για μια μελλοντική ομάδα εργασίας για την αποθήκευση ψηφιακών δεδομένων μεταξύ 2018 και 2021, εξηγεί: Το 2018, το ένα εκατομμυριοστό της επιφάνειας της Γης καταλήφθηκε από κέντρα δεδομένων. Με αυτόν τον εκθετικό ρυθμό, το 2060, όλη η γη θα καλύπτεται από δημόσια κέντρα δεδομένων., ,

Κατασκευή κέντρου δεδομένων Facebook στο Eagle Mountain, Γιούτα στις 5 Οκτωβρίου 2021.
Κατασκευή κέντρου δεδομένων Facebook στο Eagle Mountain, Γιούτα στις 5 Οκτωβρίου 2021. Getty Images μέσω AFP – George Frey

Ωστόσο, κατά τη διάρκεια των 70 ετών, οι ερευνητές συνέχισαν να μειώνουν το μέγεθος των συστημάτων αποθήκευσης, μεταβαίνοντας από δισκέτες σε σκληρούς δίσκους, για αυξημένη χωρητικότητα. Αλλά στο συμπέρασμά της, η έκθεση της ομάδας εργασίας που δημοσιεύθηκε το 2020 το υπενθυμίζει αυτό Νόμος του Μουρ Ισχύει επίσης για ηλεκτρονικά και μαγνητικά συστήματα αποθήκευσης σε ημιαγωγούς. , Δεν είναι δυνατή η μικρογραφία και η βελτιστοποίηση επ’ αόριστον. Για αρκετές δεκαετίες, η χωρητικότητα διπλασιαζόταν κάθε δύο χρόνια και η τιμή μειώθηκε στο μισό, αλλά αυτή η προσαρμογή επιβραδύνεται. Φτάνουμε σε κάποια σκληρά φυσικά όρια και ο βαθμός προσαρμογής που μπορούμε να περιμένουμε είναι σχετικά χαμηλός. », αναφέρεται στον François Capes.

READ  Το Star Citizen τελειώνει τη χρονιά με το Alpha 3.16 - Taylor Report

Κασέτα, λύση έκτακτης ανάγκης

Εάν τα ηλεκτρονικά συστήματα αποθήκευσης φτάσουν στα όριά τους, η κασέτα συνεχίζει να σπάει ρεκόρ. Ναι, μιλάμε για το κλειδί της κασέτας, το οποίο εισάγετε στην παλιά σας βιντεοκάμερα ή κασετόφωνο, του οποίου οι κασέτες μπορούν να κοπούν προς όλες τις κατευθύνσεις εάν αποτύχουν. Αλλά οι κασέτες που αναπτύχθηκαν σήμερα δεν έχουν καμία σχέση με τις κασέτες του αύριο. Τελευταία αρχεία από τη Fujifilm και την IBM 580 TB. στέκεται από πάνω Το οποίο ισοδυναμεί με 76 εκατομμύρια κασέτες ήχου (60 MB/κασέτα) το 1990. Εδώ είναι ένα βίντεο από το ρεκόρ του 2017, το οποίο ήταν 330 TB τότε.


Με ταινία είκοσι φορές πιο λεπτή από μια τρίχα και περισσότερο από ένα χιλιόμετρο μήκος, η κασέτα χωράει στην παλάμη ενός χεριού και υπάρχουν ακόμη χρόνια μπροστά της. Ο Mark Lantz, ερευνητής μαγνητικής ταινίας στην IBM, λέει: Αυτό πράγματι καταδεικνύει τη δυνατότητα να συνεχιστεί η τεχνολογία ταινιών, ουσιαστικά με ιστορικούς ρυθμούς διπλασιασμού της χωρητικότητας φυσιγγίων κάθε δύο χρόνια για τουλάχιστον τα επόμενα δέκα χρόνια. ,

Τα επόμενα δέκα χρόνια… και μετά; Αναδεικνύοντας αυτή τη χρονικότητα, ο Mark Lantz, όπως πολλοί μηχανικοί που εργάζονται στην αποθήκευση, δείχνει ότι γνωρίζει καλά τα όρια της ηλεκτρονικής και μαγνητικής αποθήκευσης. Και οι δύο καταναλώνουν τεράστιους πόρους σε ενέργεια και χώρο.

Ο επιστήμονας της IBM, Mark Lantz, έχει αρκετές εκατοντάδες TB ταινία στο χέρι του.
Ο επιστήμονας της IBM, Mark Lantz, έχει αρκετές εκατοντάδες TB ταινία στο χέρι του. © Φωτογραφία ευγενική προσφορά της IBM Research

Ωστόσο, οι μαγνητικές κασέτες έχουν το πλεονέκτημα ότι απαιτούν λιγότερα ηλεκτρονικά: ένας αναγνώστης μπορεί να διαβάσει πολλές κασέτες, όπου κάθε σκληρός δίσκος έχει το δικό του σύστημα ανάγνωσης. Επιπλέον, μια ταινία διαρκεί για δεκαετίες, σε αντίθεση με έναν σκληρό δίσκο, και είναι πιο ενεργειακά αποδοτική.

Ωστόσο, μια κασέτα, όσο ισχυρή κι αν είναι, εξακολουθεί να καταλαμβάνει πολύ φυσικό χώρο και δεν θα μπορεί να συγκρατήσει το μέγεθος των τεράστιων δεδομένων που πρόκειται να έρθουν. Οπότε πρέπει να ανεβάσουμε ταχύτητα. Και αυτό ήθελε να κάνει η ομάδα εργασίας του François Capes. , Λογικά εξετάσαμε επιλογές όπως χάραξη σε γυαλί, κρυστάλλους ή αποθήκευση σε πολυμερή όπως το DNA. Μας φαινόταν πιθανό ότι η μόνη τεχνολογία που μπορούσε να αναπτυχθεί εγκαίρως και είχε ουσιαστικούς παράγοντες βελτίωσης ήταν η αποθήκευση σε πολυμερή. συνοψίζει ο ερευνητής.

READ  Κριτική Polar Pacer Pro: Το ρολόι της επιλογής για τρέξιμο

περιμένοντας DNA

DNA; Μην πανικοβάλλεστε: δεν τίθεται θέμα αποθήκευσης πληροφοριών σε έμβια όντα ή άμεσης τροποποίησης τους σε οποιονδήποτε. Φυσικά, είχε οραματιστεί να γίνει αυτό σε βακτήρια ή σπόρια, αλλά αυτό δεν είναι πλέον το κύριο κομμάτι.

Το DNA είναι μια μεγάλη αλυσίδα μορίων που δίνει οδηγίες για την αναπαραγωγή και την ανάπτυξη των ζωντανών όντων. Εδώ, είναι η λέξη «οδηγία» που έχει ενδιαφέρον. Το DNA είναι μια αλυσίδα τεσσάρων μονομερών, «ράβδων» που συνδέουν δύο έλικες: A, C, G και T. Η αλληλουχία αυτών των μονομερών (π.χ. AAGTTCCGATAT) δίνει πληροφορίες, ακριβώς όπως … το δυαδικό σύστημα, που βασίζεται στο 1 και το 0, στον πυρήνα οποιουδήποτε συστήματος υπολογιστή.

Η αλληλουχία DNA αποτελείται από τέσσερα διαφορετικά μονομερή: A, C, T, G.
Η αλληλουχία DNA αποτελείται από τέσσερα διαφορετικά μονομερή: A, C, T, G. Getty Images – AllanPhillips

Αρχικά, είναι απαραίτητο να προσδιοριστεί ποια ακολουθία μονομερών επιθυμεί κανείς να ευθυγραμμίσει για να κωδικοποιήσει το ψηφιακό αρχείο. Ας φανταστούμε ότι το a0 είναι 0, το c0 είναι 1, το g1 είναι 1 και το t1 είναι 0. Ας πάρουμε ένα εντελώς ψεύτικο παράδειγμα. Εάν θέλουμε να αποθηκεύσουμε μια φωτογραφία με κωδικοποίηση 01 11, αυτό σημαίνει ότι ο υπολογιστής πρέπει να , Μετάφραση » 01 11 στο Λιμενικό. Αυτή είναι η κωδικοποίηση, κωδικοποιούμε το αρχείο. Στη συνέχεια, πρέπει να γράψετε “χημικά” το CG στο DNA και στη συνέχεια να το αποθηκεύσετε για να το αφαιρέσετε όταν χρειαστεί.

Κατά τη στιγμή της ανάγνωσης, το λογισμικό θα μετατρέψει την ακολουθία των γραμμάτων σε δυαδικό κώδικα, αναδημιουργώντας έτσι τη φωτογραφία στην οθόνη. Με λίγα λόγια, λοιπόν, υπάρχουν πέντε βήματα: κωδικοποίηση, εγγραφή, αποθήκευση, ανάγνωση, αποκωδικοποίηση.

Γιατί όμως να αποθηκεύουμε τις πληροφορίες μας στο DNA; Όσο για την ποσότητα των πληροφοριών που μπορούν να κωδικοποιηθούν σε αυτό (πυκνότητα πληροφοριών), τον ενεργειακό περιορισμό και τη μονιμότητά του. Σε αντίθεση με τα κέντρα δεδομένων, δεν χρειάζεται να ψύχεται το DNA: μπορεί να αποθηκευτεί σε θερμοκρασία δωματίου … για 52.000 χρόνια, εάν χρησιμοποιηθεί τεχνολογία ενθυλάκωσης από τη γαλλική εταιρεία Imagine.

READ  Το WhatsApp δεν θα λειτουργεί σε αυτά τα κινητά τηλέφωνα από τις 31 Μαΐου.


Κάθε κάψουλα μπορεί να χωρέσει 0,8 γραμμάρια DNA ή 1,4 exabyte δεδομένων. Για υπενθύμιση, ένα exabyte αντιπροσωπεύει ένα εκατομμύριο σκληρούς δίσκους 1 TB. Έτσι 0,8 γραμμάρια DNA θα περιείχαν τόσες πληροφορίες όσο ένας σκληρός δίσκος 150 τόνων! Θα χρειαζόταν μόνο 175 κιλά DNA για να αποθηκευτούν 175 zettabytes Big Data μέχρι το 2025. Το αμερικανικό πρακτορείο DARPA πιστεύει ότι το DNA θα μπορούσε να καταστήσει δυνατή τη διαίρεση της κατανάλωσης ενέργειας των δεδομένων μας με χίλια.

Δυνατότητα ανάπτυξης?

Το κύριο πλεονέκτημα του DNA είναι ότι το γνωρίζουμε καλά, θυμάται ο François Capes: Η Biomedical έχει αναπτύξει τεχνολογία DNA που είναι ήδη πολύ προηγμένη. Αυτό σημαίνει ότι έχουν ήδη γίνει όλες οι απαραίτητες μέθοδοι αποθήκευσης και αρχειοθέτησης ψηφιακών δεδομένων, τώρα δεν σημαίνει ότι είναι σε εμπορική κλίμακα, καθόλου. ,

Ωστόσο, η τεχνολογία προχωρά πολύ γρήγορα. , Το κόστος της αλληλούχισης του ανθρώπινου γονιδιώματος [la lecture, NDLR] Είναι εξαιρετικά χαμηλά. Ήμασταν 3 δισεκατομμύρια δολάρια το 2003, σήμερα είμαστε στα 500 », ενθουσιάζει την ερευνήτρια. Υπάρχουν όμως όρια: 500 $ για ανάγνωση DNA σε ταχύτητες 2022 είναι ακόμα 1.000 φορές πολύ ακριβό και 1.000 φορές πολύ αργό σε σύγκριση με έναν σκληρό δίσκο. Για να γράψω, είναι ακόμη και 100 εκατομμύρια φορές πιο αργό και πολύ ακριβό.

, Υπάρχουν άνθρωποι που μας είπαν να επιστρέψουμε στο τέλος του αιώνα και να μιλήσουμε γι’ αυτό. φυσικά όχι! Οι τεχνολογίες που σχετίζονται με το DNA προχωρούν κατά δύο φορές περίπου κάθε έξι μήνες : Τέσσερις φορές πιο γρήγορα από τα ηλεκτρονικά μεταξύ 1976 και 2011. Με αυτόν τον ρυθμό, ο συντελεστής 1000 της ανάγνωσης θα καταποθεί μέσα σε πέντε χρόνια, περίπου το 2025. Και 100 εκατομμύρια να γράψω, γύρω στο 2035! ,

Ήδη, ορισμένες εφαρμογές για DNA είναι δυνατές έως το 2035. Δεν χρειάζεται να διαβάζονται ή να γράφονται όλα τα δεδομένα τακτικά. Έτσι, ο INA, ένας γαλλικός οργανισμός που είναι υπεύθυνος για την αρχειοθέτηση οπτικοακουστικών παρουσιάσεων, συγκεντρώνει επιπλέον 20 PB δεδομένων κάθε χρόνο. Δεν χρειάζεται να βγουν γρήγορα όλα αυτά τα δεδομένα, επομένως είναι ενδιαφέρον να τα κωδικοποιήσουμε στο DNA. Ομοίως, ο τραπεζικός τομέας, ο οποίος πρέπει να διατηρεί τα τραπεζικά δεδομένα των πελατών του για μερικές δεκαετίες, θα μπορούσε να χρησιμοποιήσει αυτή τη νέα τεχνολογία αποθήκευσης.

Απόδειξη ότι το διακύβευμα είναι τεράστιο, με την αμερικανική DARPA να επενδύει εκατοντάδες εκατομμύρια ευρώ σε τεχνολογίες DNA. Η Γαλλία, από την πλευρά της, αρχίζει να σημειώνει πρόοδο, ειδικά χάρη στην ομάδα εργασίας του François Capes, με Επένδυση 20 εκατ. ευρώ Κρατική χρηματοδότηση για την έρευνα αποθήκευσης DNA.

Εγώ Διαβάστε επίσης: Μπροστά στο τεράστιο όγκο των Big Data, οι στρατηγικές των ερευνητών δημοσιογράφων

Haralambos Barberakos

"Εμπειρογνώμονας για τη δια βίου μπύρα. Βραβευμένο maven μπέικον. Μελετητής μουσικής. Οπαδός του Διαδικτύου. Buff αλκοόλ."

Αφήστε μια απάντηση

Η ηλ. διεύθυνση σας δεν δημοσιεύεται.

Back to top