Δημοσίευση:
Τελευταία ενημέρωση:

Εξαφανίζεται η διαδικτυακή ιστορία – Μπορεί το Αρχείο Διαδικτύου να τη σώσει;

Ψηλαφίζουμε τη βαθύτερη ιστορία της ανθρωπότητας μέσα από παπύρους και χειρόγραφα, όμως το διαδίκτυο φαίνεται ότι «σβήνει» τη νεότερη ιστορία.

Επιμέλεια: Βασιλική Διαμάντη
Δημοσίευση:
Τελευταία ενημέρωση:
Εξαφανίζεται η διαδικτυακή ιστορία – Μπορεί το Αρχείο Διαδικτύου να τη σώσει;
Επιμέλεια: Βασιλική Διαμάντη

Ψηλαφίζουμε τη βαθύτερη ιστορία της ανθρωπότητας μέσα από παπύρους και χειρόγραφα, όμως το διαδίκτυο φαίνεται ότι «σβήνει» τη νεότερη ιστορία.

Η έρευνα δείχνει ότι το 25% των ιστοσελίδων που δημοσιεύτηκαν μεταξύ 2013 και 2023 έχουν εξαφανιστεί. Λίγοι οργανισμοί αγωνίζονται να σώσουν τον απόηχο του διαδικτύου, αλλά νέοι κίνδυνοι απειλούν την ίδια την ύπαρξή τους.

Είναι δυνατόν, χάρη σε σωζόμενα θραύσματα παπύρου, ψηφιδωτών και κερένιων πινακίδων, να μάθουμε τι έτρωγαν οι Πομπηιανοί για πρωινό πριν από 2.000 χρόνια. Αν καταλάβετε αρκετά μεσαιωνικά λατινικά, μπορείτε να μάθετε πόσα ζώα εκτρέφονταν σε αγροκτήματα στο Northumberland της Αγγλίας του 11ου αιώνα -χάρη στο Domesday Book, το παλαιότερο έγγραφο που φυλάσσεται στα Εθνικά Αρχεία του Ηνωμένου Βασιλείου.

Μέσα από επιστολές και μυθιστορήματα, έρχεται στο προσκήνιο η κοινωνική ζωή της βικτοριανής εποχής -και ποιον αγαπούσαν και ποιον μισούσαν.

Αλλά οι ιστορικοί του μέλλοντος ίσως δυσκολευτούν να κατανοήσουν πλήρως πώς ζούσαμε τη ζωή μας στις αρχές του 21ου αιώνα. Αυτό οφείλεται σε έναν δυνητικά ιστοριοκτόνο συνδυασμό του τρόπου με τον οποίο ζούμε τη ζωή μας ψηφιακά -και στην ανεπάρκεια των επίσημων προσπαθειών για την αρχειοθέτηση των παγκόσμιων πληροφοριών, όπως αυτές παράγονται στις μέρες μας.

Ωστόσο, μια άτυπη ομάδα οργανισμών αντιστέκεται στις δυνάμεις της ψηφιακής εντροπίας -πολλοί από αυτούς λειτουργούν από εθελοντές με ελάχιστη θεσμική υποστήριξη. Κανένας δεν είναι πιο συνώνυμος με τον αγώνα για τη διάσωση του διαδικτύου από το Internet Archive, ένα αμερικανικό μη κερδοσκοπικό ίδρυμα με έδρα το Σαν Φρανσίσκο, που ξεκίνησε το 1996 ως έργο πάθους του πρωτοπόρου του διαδικτύου Brewster Kahl.

Ο οργανισμός έχει ξεκινήσει το πιο φιλόδοξο έργο ψηφιακής αρχειοθέτησης όλων των εποχών χρόνο, συγκεντρώνοντας 866 δισεκατομμύρια ιστοσελίδες, 44 εκατομμύρια βιβλία, 10,6 εκατομμύρια βίντεο από ταινίες και τηλεοπτικά προγράμματα και πολλά άλλα. Στεγασμένες σε μια χούφτα κέντρα δεδομένων διάσπαρτα σε όλο τον κόσμο, οι συλλογές του Internet Archive και μερικών παρόμοιων ομάδων είναι τα μόνα πράγματα που στέκονται εμπόδιο στην ψηφιακή λήθη.

«Οι κίνδυνοι είναι πολλαπλοί. Όχι μόνο ότι η τεχνολογία μπορεί να αποτύχει, αλλά αυτό σίγουρα συμβαίνει. Αλλά το πιο σημαντικό, να αποτύχουν τα ιδρύματα ή να βάλουν λουκέτο οι εταιρείες. Οι ειδησεογραφικοί οργανισμοί καταβροχθίζονται από άλλους ειδησεογραφικούς οργανισμούς ή, όλο και πιο συχνά, κλείνουν», λέει ο Μαρκ Γκράχαμ, διευθυντής του Wayback Machine του Internet Archive, ενός εργαλείου που συλλέγει και αποθηκεύει στιγμιότυπα ιστοσελίδων για τις επόμενες γενιές.

Υπάρχουν πολυάριθμα κίνητρα για τη διάθεση περιεχομένου στο διαδίκτυο, λέει, αλλά είναι λίγα αυτά που ωθούν τις εταιρείες να το διατηρήσουν μακροπρόθεσμα.

Παρά τα μέχρι τώρα επιτεύγματα του Internet Archive, ο οργανισμός και άλλοι παρόμοιοι οργανισμοί αντιμετωπίζουν οικονομικές απειλές, τεχνικές προκλήσεις, κυβερνοεπιθέσεις και νομικές μάχες από επιχειρήσεις που δεν τους αρέσει η ιδέα των ελεύθερα διαθέσιμων αντιγράφων της πνευματικής τους ιδιοκτησίας.

Και όπως δείχνουν οι πρόσφατες δικαστικές απώλειες, το εγχείρημα της διάσωσης του διαδικτύου μπορεί να είναι εξίσου φευγαλέο με το περιεχόμενο που προσπαθεί να προστατεύσει.

«Όλο και περισσότερες από τις πνευματικές μας προσπάθειες, περισσότερη από την ψυχαγωγία μας, περισσότερες από τις ειδήσεις μας και περισσότερες από τις συζητήσεις μας υπάρχουν μόνο σε ψηφιακό περιβάλλον», λέει ο Graham. «Αυτό το περιβάλλον είναι εγγενώς εύθραυστο».

Σώζοντας την ιστορία μας

Το ένα τέταρτο όλων των ιστοσελίδων που υπήρχαν κάποια στιγμή μεταξύ 2013 και 2023 τώρα… δεν υπάρχουν. Αυτό προκύπτει από πρόσφατη μελέτη του Pew Research Center, ενός think tank με έδρα την Ουάσινγκτον, η οποία κρούει τον κώδωνα του κινδύνου για την εξαφάνιση της ψηφιακής μας ιστορίας.

Οι ερευνητές διαπίστωσαν ότι το πρόβλημα είναι πιο έντονο όσο πιο παλιά είναι μια ιστοσελίδα: Το 38% των ιστοσελίδων στις οποίες προσπάθησε να αποκτήσει πρόσβαση το Pew και οι οποίες υπήρχαν το 2013 δεν λειτουργούν πλέον.λλά είναι επίσης ένα ζήτημα για πιο πρόσφατες δημοσιεύσεις. Περίπου το 8% των ιστοσελίδων που δημοσιεύθηκαν κάποια στιγμή το 2023 είχαν εξαφανιστεί μέχρι τον Οκτώβριο του ίδιου έτους.

Αυτό δεν είναι μόνο μια ανησυχία για τους λάτρεις της ιστορίας και τους εμμονικούς του διαδικτύου. Σύμφωνα με τη μελέτη, ένας στους πέντε κυβερνητικούς ιστότοπους περιέχει τουλάχιστον έναν σπασμένο σύνδεσμο.

Η Pew διαπίστωσε ότι περισσότερα από τα μισά άρθρα της Wikipedia έχουν έναν σπασμένο σύνδεσμο στην ενότητα των παραπομπών τους, πράγμα που σημαίνει ότι τα στοιχεία που υποστηρίζουν τις πληροφορίες της διαδικτυακής εγκυκλοπαίδειας διαλύονται σιγά σιγά. Όμως χάρη στο έργο του Internet Archive, δεν είναι εντελώς απρόσιτοι όλοι αυτοί οι νεκροί σύνδεσμοι.

Εδώ και δεκαετίες, το πρόγραμμα Wayback Machine του Αρχείου στέλνει στρατιές ρομπότ να σέρνονται στους λαβύρινθους του διαδικτύου. Αυτά τα συστήματα κατεβάζουν λειτουργικά αντίγραφα των ιστοτόπων καθώς αλλάζουν με την πάροδο του χρόνου -συχνά καταγράφοντας τις ίδιες σελίδες πολλές φορές μέσα σε μία μόνο ημέρα- και τα διαθέτουν δωρεάν στο κοινό.

«Όταν στη συνέχεια πήγαμε και κοιτάξαμε πόσες από αυτές τις διευθύνσεις URL ήταν διαθέσιμες στο Wayback Machine, διαπιστώσαμε ότι τα δύο τρίτα από αυτές ήταν διαθέσιμες κατά κάποιον τρόπο», λέει.

Υπό αυτή την έννοια, το Internet Archive κάνει αυτό που ξεκίνησε να κάνει -σώζει αρχεία της διαδικτυακής κοινωνίας για τις επόμενες γενιές. μερικοί άλλοι οργανισμοί, μεγάλοι και μικροί, εργάζονται σε παρόμοια έργα. Η Βιβλιοθήκη του Κογκρέσου των ΗΠΑ, για παράδειγμα, διατηρεί κυβερνητικές ιστοσελίδες, τις ιστοσελίδες των μελών του Κογκρέσου και μια συλλογή αμερικανικών ειδησεογραφικών ιστοσελίδων.

Η Βιβλιοθήκη του Κογκρέσου διατήρησε επίσης ένα αντίγραφο κάθε tweet που στάλθηκε από την ίδρυση του Twitter (σήμερα γνωστό ως X), μέχρι που το έργο έκλεισε το 2017. Άλλες κυβερνήσεις τρέχουν τις δικές τους πρωτοβουλίες. Το UK Web Archive διεξάγει μια ετήσια σάρωση των ιστότοπων με ονόματα τομέα .UK, αποτυπώνοντας ένα στιγμιότυπο του βρετανικού διαδικτύου τουλάχιστον μία φορά το χρόνο.

Το 2022, μια ομάδα εθελοντών να ξεκινήσει να σώζει το ουκρανικό διαδίκτυο, καθώς είχε πληγεί από ρωσικές κυβερνοεπιθέσεις.

Ωστόσο, το πεδίο εφαρμογής αυτών των έργων είναι περιορισμένο, ενώ το Internet Archive στοχεύει σε μια ολοκληρωμένη προσέγγιση. Δεδομένων των διαθέσιμων πόρων, θα ήταν αδύνατο να συλλεχθεί οτιδήποτε που να πλησιάζει το σύνολο του διαδικτύου, αλλά τα συστήματά του απλώνουν ένα ευρύ δίχτυ.

Ανάλογα με το τι ψάχνετε, η συλλογή του Internet Archive είναι τόσο λεπτομερής που μερικές φορές μπορεί να μοιάζει με μια λειτουργικά πλήρη καταγραφή του διαδικτύου.

Η επιτυχία γεννά εφησυχασμό

Τα δημόσια προσβάσιμα έγγραφα του Αρχείου συμβάλλουν στη διατήρηση των αρχείων της ζωής μας στη σημερινή εποχή. Έχει γίνει συνήθης πρακτική στη Βικιπαίδεια να αναφέρονται αντίγραφα ιστοτόπων από το Wayback Machine του Internet Archive, αντί για τους ίδιους τους αρχικούς ιστοτόπους.

Ο οργανισμός διατηρεί επίσης μια τεράστια συλλογή μέσων ενημέρωσης που προϋπήρχαν της ψηφιακής εποχής. Η αγαπημένη κωμική σειρά Fernwood 2 Night του 1977 δεν είναι διαθέσιμη σε καμία υπηρεσία streaming, αλλά μπορείτε να την παρακολουθήσετε δωρεάν στο Internet Archive.

Βιβλία, περιοδικά και ιστότοποι παραθέτουν στο Internet Archive σαρωμένα ψηφιακά αντίγραφα βιβλίων που δεν είναι διαθέσιμα σε φυσικές βιβλιοθήκες. Λειτουργεί ακόμη και ως εργαλείο διατήρησης για το κοινό –ο καθένας μπορεί να ανεβάσει βίντεο, ιστότοπους και σχεδόν ο,τιδήποτε άλλο στους διακομιστές του οργανισμού.

Μεταξύ των σημαντικότερων συλλογών που έχει διασώσει το Wayback Machine από τα ψηφιακά απορρίμματα είναι τα αρχεία ιστοτόπων που έχουν δημιουργηθεί στο GeoCities, μια υπηρεσία φιλοξενίας προσωπικών ιστοσελίδων που έχει πλέον καταργηθεί.

Πολύ πριν από τα μέσα κοινωνικής δικτύωσης, το GeoCities ήταν από τις πρώτες πλατφόρμες που διευκόλυναν τον καθένα να δημιουργήσει τον δικό του ιστότοπο. Οι ιστορικοί θεωρούν το GeoCities ως ένα από τα πιο σημαντικά κεφάλαια στις πρώτες ημέρες του παγκόσμιου ιστού, και χωρίς τις προσπάθειες του Internet Archive, οι περισσότεροι ιστότοποι θα είχαν χαθεί.

Στην πιο πρόσφατη ιστορία, μια επιτροπή του αμερικανικού Κογκρέσου βασίστηκε στο Internet Archive για τη διατήρηση άρθρων και εγγράφων που σχετίζονται με την εξέγερση της 6ης Ιανουαρίου.

«Κάθε λίγα χρόνια έρχεται μια νέα πλατφόρμα και τότε οι οικονομικές δυνάμεις ξαφνικά καταρρέουν κατά κάποιο τρόπο μέσα σε αυτήν», λέει ο Andrew Jackson, τεχνικός αρχιτέκτονας του μητρώου διατήρησης στο Digital Preservation Coalition, μια ομάδα υποστήριξης και φιλανθρωπικό ίδρυμα με έδρα το Ηνωμένο Βασίλειο που συμβουλεύει για τον τρόπο διατήρησης των διαδικτυακών ψηφιακών αρχείων του κόσμου.

Το Internet Archive «ξεκίνησε από ένα άτομο και έχει γίνει ένα είδος άξονα», λέει ο Jackson. «Είναι επίσης ένα πιθανό σημείο αποτυχίας. Αν και είναι πολύ πιο εξελιγμένο από τους εθελοντές, είναι ένα ίδρυμα σε μια περιοχή, κάτω από ένα νομικό πλαίσιο».

Η οργάνωση συμμερίζεται αυτές τις ανησυχίες. Αν σταματήσει το έργο του Internet Archive και «αυτό το κενό δεν καλυφθεί αμέσως, τότε μεγάλο μέρος όσων διατίθενται σήμερα στον δημόσιο ιστό θα κινδυνεύσει», λέει ο Graham.

Είναι ξεκάθαρος ότι το Internet Archive δεν θα αποσυρθεί από τις ευθύνες του σύντομα, αλλά το έργο μπορεί να χρησιμοποιήσει εξωτερική βοήθεια. «Υπάρχουν ευκαιρίες για πολλούς άλλους να συνεισφέρουν με διάφορους τρόπους», λέει.

Κοινές ευθύνες, μοιρασμένες προτεραιότητες

Χωρίς επίσημη προσπάθεια οργάνωσης των προσπαθειών για τη διατήρηση του διαδικτύου, το έργο έχει αφεθεί στους χομπίστες, στους εθελοντές και σε μερικές ομάδες ανεπίσημων φορέων που λειτουργούν γενικά ανεξάρτητα.

«Είναι λογικό η αρχειακή απάντηση να είναι αποκεντρωμένη», λέει ο Mar Hicks, ιστορικός της τεχνολογίας στο Πανεπιστήμιο της Βιρτζίνια. «Αλλά ένα από τα προβλήματα είναι οι διαφορετικές προτεραιότητες».

Ο Hicks επισημαίνει ότι ένα από τα πρώτα πράγματα που θα εξετάσει κάθε αρχειοφύλακας όταν δημιουργεί ένα αρχείο είναι το τι πρέπει να θέσει σε προτεραιότητα. «Και όταν είναι τόσο αποκεντρωμένο, οι προτεραιότητες θα είναι πολύ διαφορετικές», λέει ο Hicks.

«Θα υπάρχουν άνθρωποι σε ομάδες που θα δίνουν προτεραιότητα στην προσπάθεια να αρπάξουν τα πάντα -όσο το δυνατόν περισσότερα μπορούν, μπορεί να είναι πολύ ολοκληρωτικοί». Στη συνέχεια, θα υπάρξουν άλλοι που θα επικεντρωθούν μόνο σε ορισμένους τομείς – για παράδειγμα, στην προσπάθεια αρχειοθέτησης στο Ηνωμένο Βασίλειο.

Η ανησυχία σχετικά με μια τέτοια ad hoc, αποκεντρωμένη προσέγγιση είναι ότι είναι πιθανό να υπάρχει επικάλυψη, πράγμα που σημαίνει ότι πολύτιμοι πόροι αρχειοθέτησης σπαταλούνται για να ληφθούν διπλά ή τριπλά αντίγραφα των πιο δημοφιλών ιστότοπων, ενώ κάποιες περιοχές που μπορεί να έχουν ιστορική σημασία παραβλέπονται επειδή εμπίπτουν στις αρμοδιότητες διαφορετικών ομάδων.

Ένα βιβλίο είναι ένας πιο προφανώς πεπερασμένος πόρος -μπορεί να χαθεί ή να καταστραφεί. Αλλά το διαδίκτυο είναι τόσο προσιτό. Οποιοσδήποτε με σύνδεση στο διαδίκτυο μπορεί να ανοίξει ένα πρόγραμμα περιήγησης στο διαδίκτυο και να καλέσει μια διεύθυνση URL. Είναι όλα εκεί -μέχρι να μην είναι.

«Οι αρχειονόμοι θα σας πουν ότι αυτά τα ζητήματα υπάρχουν εδώ και πολύ καιρό», λέει ο Hicks. Αλλά επιδεινώνονται από το επίπεδο του υλικού που παράγεται στον ψηφιακό μας κόσμο. Σχεδόν ένα δισεκατομμύριο μηνύματα ηλεκτρονικού ταχυδρομείου αποστέλλονται κάθε μέρα. Το YouTube αναφέρει ότι κάθε λεπτό αναρτώνται στην πλατφόρμα περισσότερα από 500 ώρες περιεχομένου βίντεο.

Το διαδίκτυο είναι «ουσιαστικά μια μάνικα πληροφοριών και υλικού», λέει ο Hicks. «Δεν έχει νόημα να προσπαθούμε να πιάσουμε όλα όσα βγαίνουν από τη μάνικα. Αυτό δεν θα είχε νόημα από την άποψη των πόρων».

Κατά μία έννοια, αυτή είναι μια παλιά ανησυχία. «Έχουμε, ως ιστορικοί, τα ίδια προβλήματα», λέει ο Hicks. «Έχουμε έναν πλούτο εγγράφων από το παρελθόν. Αλλά έχουμε μόνο ορισμένα έγγραφα και τις φωνές ορισμένων ανθρώπων, και πολλές από αυτές τις φωνές που λείπουν ήταν απίστευτα σημαντικές και έχουν σβηστεί».

Για τον Hicks, πρέπει να υπάρξει κάποιου είδους προτεραιότητα σχετικά με το τι σώζεται από τα ψηφιακά αποτυπώματα της γενιάς μας. Διαφορετικά κινδυνεύουμε να παραμερίσουμε τις προσπάθειες διάσωσης της ιστορίας του διαδικτύου, για να μην αναφέρουμε τους ωκεανούς των ψηφιακών αρχείων που ζουν εκτός σύνδεσης.

«Αν πρέπει να διατηρήσετε τα πάντα, αυτό γίνεται πολύ ακριβό», λέει ο Τζάκσον από τον Συνασπισμό Ψηφιακής Διατήρησης (Digital Preservation Coalition). «Συχνά υπάρχει παλαιότερο περιεχόμενο ή λιγότερο συναρπαστικό περιεχόμενο [που] χάνεται στην άκρη του δρόμου», λέει.

«Δεν καταγράφουμε καλά τον μη δυτικό κόσμο», παραδέχεται ο Jackson. «Υπάρχουν τώρα κενά γύρω από την ελλιπή παρουσία σε διάφορους πολιτιστικούς τομείς».

Και ενώ πολλοί από αυτούς τους οργανισμούς εργάζονται για να καταπολεμήσουν τις προκαταλήψεις τους, συχνά αφήνονται να σηκώσουν το βάρος του έργου, ενώ οι κυβερνήσεις και οι εταιρείες που διαχειρίζονται τις πλατφόρμες και τους ιστότοπους κάθονται αμέτοχες.

«Ανεξάρτητες ομάδες ανθρώπων, οι οποίοι απλώς νοιάζονται γι’ αυτό και είναι πρόθυμοι να αφιερώσουν τον ελεύθερο χρόνο τους για να το κάνουν, διαθέτουν καλύτερους πόρους και είναι πιο εξειδικευμένοι από τους θεσμούς που είναι επίσημα υπεύθυνοι», λέει ο Τζάκσον.

Μείνετε ενημερωμένοι με το Newpost. Ακολουθήστε μας για να μάθετε πρώτοι όλες τις ειδήσεις από την Ελλάδα και τον Κόσμο.

ολες οι ειδησεις

Δείτε όλες τις τελευταίες Ειδήσεις από την Ελλάδα και τον Κόσμο, στο Newpost.gr