Accueil l'audio Sur les domaines morts et les liens perdus: pourquoi le web est si fragile

Sur les domaines morts et les liens perdus: pourquoi le web est si fragile

Anonim

Pour toutes les discussions sur la quantité d'informations produites chaque année et sur la façon dont chaque petit morceau de notre vie est partagé et rendu instantanément découvrable, il est surprenant de voir à quel point il peut être difficile de trouver des informations sur le Web, dans leur état d'origine à partir de seulement il y a cinq ans, encore moins 10 ou 15.


Alors que nous étions autrefois régalés d'histoires sur la façon dont Internet pouvait résister à la guerre nucléaire, grâce à une structure complexe de redondance et de sauvegardes géographiques, de simples erreurs humaines, associées à un acte de malveillance occasionnel, ont réduit notre espoir que les données, une fois publiées, être à jamais stable.


Je crois fermement au concept du cloud et y ai déplacé pratiquement toutes mes données, en s'appuyant sur un ordinateur portable centré sur le cloud chaque jour et en enregistrant mes fichiers dans le cloud. Mais tout le monde ne fait pas aussi attention à la sélection des fournisseurs et à la maintenance des plates-formes et des domaines que je l'ai été, et il n'est pas trop rare que des sites et des signets entiers disparaissent du Web, avec seulement Archive.org et d'autres caches intelligents pour raconter l'histoire.


Avant que cela ne ressemble à un conte sordide ou à une chape anti-Web de quelqu'un intégré au Web, permettez-moi de vous donner un exemple spécifique. Imaginez, si vous voulez, une URL unique pointant vers le boom du dotcom d'origine - un simple comme .com.com. Non, je ne l'ai pas tapé deux fois. Le domaine com.com appartient depuis longtemps à CNET, qui fait partie de CBS Interactive. Bien que CNET ait subi un certain nombre de propriétaires au cours des décennies qui ont suivi son lancement, on a également constaté une variation extrême dans la façon dont ils ont commercialisé leur site principal et leurs URL. Pour ceux d'entre nous qui voulaient juste les nouvelles, c'était News.com. Plus tard, News.com redirigerait vers News.Cnet.com, comme il le fait aujourd'hui.


Archive.org montre News.com.com dans un bon état connu antérieur


Mais à un moment donné, News.com a redirigé vers News.com.com, et pour une raison quelconque, c'est le signet que je me suis suivi de navigateur en navigateur depuis des années. Tout à coup, il y a quelques mois, ce signet a cessé de fonctionner, au lieu de me montrer un répertoire de liens, qui ressemblait à un squatter qui avait saisi l'URL et l'avait repris. Archive.org montre la même chose. News.com.com a fonctionné et puis en juillet … il a cessé de rediriger. C'est donc ennuyeux. Bien qu'il soit assez simple pour moi de mettre à jour mon signet, et je suis sans aucun doute dans la petite minorité d'utilisateurs qui ont conservé cette URL, avoir une URL potentiellement de haut niveau comme .com.com ne fait absolument rien … semble stupide.


Mais maintenant, l'ancienne URL de News.com.com est de la pure ordure


Assez parlé de .com.com. Ce qui est parfois aussi frustrant, c'est la courte durée de conservation des liens et des images des années passées. Mon propre blog existe depuis un peu plus de sept ans, et dans les quelque 3 000 articles que j'ai publiés depuis le début, chacun a eu de nombreux liens. Au fur et à mesure que les entreprises vont et viennent, leurs sites Web et les liens vers leurs sous-pages disparaissent. Les sites de médias d'information, dont on espère qu'ils présenteraient une archive intemporelle, une longue queue d'informations aux chercheurs de vérité là-bas, sont souvent les pires contrevenants, car les articles d'une certaine date tombent derrière un mur payant, ou les plates-formes du site changent, détournant pour toujours la structure des liens et le rendu des liens précédents incompétents.


Un des plus grands regrets que j'ai en ce qui concerne le Web est celui que Ryan Tate (maintenant avec WIRED) et moi partageons. À l'époque plus préhistorique du Web, à la fin des années 1990, lui et moi travaillions tous les deux au journal étudiant Daily Californian de l'UC Berkeley. Nous avons tous les deux écrit des centaines de nouvelles, couvrant tout, des élections étudiantes aux fous du campus et des homicides occasionnels. Mais à un moment donné, après avoir quitté le journal, notre site a été piraté / corrompu, et tout le contenu existant a été perdu - choquant sans sauvegarde. Donc, plus de 99% de ces données ont disparu pour de bon, et il faudra soit se rendre sur le campus de Berkeley et prendre un papier cartonné pour voir notre travail, soit tout simplement disparaître. Bien que peu de mes histoires méritent d'être lues environ 15 ans plus tard, elles font partie de mon histoire personnelle (et professionnelle), qui a peu de résultats.


De l'écriture sur la mort réelle à la mort du lien … bien que la rupture du lien de CNET avec .com.com soit une surprise, cela pourrait être dû à une vente, pour être utilisé par un acquéreur inconnu, ou à une simple négligence. Le pire est quand on voit des liens raccourcis automatiquement, seulement pour que le raccourcisseur d'URL disparaisse, ou pour que le service d'hébergement invalide d'autres liens courts. Bien que j'aie fait valoir que les URL soient belles et intuitives, nous nous sommes habitués à voir des URL plus petites, illustrées par le t.co de Twitter, utiles sur leur service, ainsi que goo.gl de Google, bit .ly, et autres. Mais en achetant un service d'URL court, vous exigez qu'il soit maintenu par les propriétaires d'origine et que toutes les tables soient intactes. Donc pour ceux d'entre nous qui ont longtemps partagé avec ff.im de FriendFeed, c'est par la grâce de Facebook que ces vieilles choses sont toujours là, et pratiquement personne ne serait surpris s'ils suivaient le chemin du dodo dans les deux prochaines années.


Mon argument est que le Web doit être construit pour la permanence. Un lien que je poste aujourd'hui devrait être un lien qui fonctionnera plus tard. Un permalien vers une page dédiée avec du contenu devrait produire ce même contenu, même si le cadre environnant a été mis à niveau, à l'avenir. Et les liens et domaines courts doivent se comporter de manière fiable et conviviale. Ce serait une tragédie mineure si la page de démarrage que vous utilisez quotidiennement devenait soudainement autre chose, et plus grande si le domaine sur lequel vous hébergez vos histoires personnelles fermait simplement la boutique parce que l'hôte ne trouvait pas financièrement possible de continuer. . Ainsi, bien que la magie du Web soit réelle et qu'il semble parfois que vous puissiez pratiquement trouver quoi que ce soit et l'obtenir instantanément (en supposant un haut débit rapide), les lacunes me font penser que nous pouvons faire mieux.


Et oui, CNET. Quoi de neuf?


Republié avec la permission de http://blog.louisgray.com/Original article peut être trouvé ici: http://blog.louisgray.com/2013/09/deadlinksarelame.html.

Sur les domaines morts et les liens perdus: pourquoi le web est si fragile