Huis audio Over dode domeinen en vervallen links: waarom het web zo kwetsbaar is

Over dode domeinen en vervallen links: waarom het web zo kwetsbaar is

Anonim

Voor al het gepraat over hoeveel informatie elk jaar wordt geproduceerd, en hoe elk klein stukje van ons leven wordt gedeeld en direct vindbaar wordt gemaakt, is het verrassend hoe moeilijk het kan zijn om informatie op het web te vinden, in de oorspronkelijke staat vanaf slechts vijf jaar geleden, laat staan ​​10 of 15.


Hoewel we ooit werden onthaald met verhalen over hoe het internet nucleaire oorlog kon weerstaan, dankzij een gecompliceerde structuur van redundantie en geografische back-ups, hebben eenvoudige menselijke fouten, samengevoegd met af en toe een daad van kwaadwilligheid, onze verwachting verlaagd dat gegevens, eenmaal gepost, zullen voor altijd stabiel zijn.


Ik geloof sterk in het concept van de cloud, en heb praktisch al mijn gegevens daar naartoe verplaatst, elke dag afhankelijk van een cloudgerichte laptop en mijn bestanden in de cloud opslaan. Maar niet iedereen is zo voorzichtig met het selecteren van providers en het onderhouden van platforms en domeinen als ik, en het is niet ongewoon dat hele sites en bladwijzers van het web verdwijnen, met alleen Archive.org en andere slimme cachers over om het verhaal te vertellen.


Voordat dit klinkt als een smerig verhaal of een anti-webdekvloer van iemand die is ingebed in het web, wil ik u een specifiek voorbeeld geven. Stel je voor, als je zou willen, een unieke URL die verwijst naar de originele dotcom-boom - een eenvoudige zoals .com.com. Nee, ik heb het niet twee keer getypt. Het domein com.com is al lang eigendom van CNET, onderdeel van CBS Interactive. Hoewel CNET sinds de lancering een aantal eigenaars heeft ondergaan sinds de lancering, is er ook een extreme variatie in de manier waarop ze hun hoofdsite en URL's op de markt brachten. Voor degenen onder ons die alleen het nieuws wilden, was het News.com. Later zou News.com doorverwijzen naar News.Cnet.com, zoals nu het geval is.


Archive.org toont News.com.com in een eerdere bekende goede staat


Maar op een gegeven moment werd News.com doorgestuurd naar News.com.com, en om welke reden dan ook, dat is de bladwijzer die ik jarenlang van browser naar browser heb gevolgd. Plotseling, een paar maanden geleden, stopte deze bladwijzer met werken, maar liet me een map met links zien, die eruitzag alsof een kraak de URL had overgenomen en overgenomen. Archive.org toont hetzelfde. News.com.com werkte en vervolgens in juli … stopte het met omleiden. Dus dat is vervelend. Hoewel het voor mij eenvoudig genoeg is om mijn bladwijzer bij te werken, en ik ben ongetwijfeld in de kleine minderheid van gebruikers die die URL hebben bewaard, om een ​​potentieel opvallende URL zoals .com.com helemaal niets te laten doen … lijkt dwaas.


Maar nu is de URL van Old News.com.com Pure Rubbish


Genoeg over .com.com. Wat soms net zo frustrerend is, is de korte houdbaarheid voor links en afbeeldingen van jaren geleden. Mijn eigen blog bestaat al iets meer dan zeven jaar en in de ongeveer 3000 berichten die ik sinds het begin heb geplaatst, heeft elke blog veel links gehad. Naarmate bedrijven komen en gaan, verdwijnen hun websites en de koppelingen naar hun subpagina's. Nieuwsmediasites, waarvan men hoopt dat die een tijdloos archief, een lange staart van informatie voor de waarheidzoekers daarbuiten zouden presenteren, zijn vaak de ergste overtreders, omdat artikelen van een bepaalde datum achter een betaalmuur vallen, of siteplatforms veranderen, voor altijd kaping linkstructuur en vorige links ongeschikt maken.


Een van de grootste spijt die ik heb wat het web betreft, is er een die Ryan Tate (nu met WIRED) en die ik deel. In de meer prehistorische tijden van het web, eind jaren negentig, werkten hij en ik allebei bij de Daily Californian studentenkrant van UC Berkeley. We hebben allebei honderden nieuwsverhalen geschreven, van alles over studentenverkiezingen tot gekken op de campus en af ​​en toe een moord. Maar op een gegeven moment, nadat ik het papier had verlaten, was onze site gehackt / beschadigd en was alle bestaande inhoud verloren - schokkend zonder back-up. Dus meer dan 99% van die gegevens zijn voorgoed verdwenen, en men zal ofwel naar de campus van Berkeley moeten reizen en een gebonden krant moeten ophalen om ons werk te zien, of het is gewoon weg. Hoewel enkele van mijn verhalen de moeite waard zijn om ongeveer 15 jaar later te lezen, maken ze deel uit van mijn eigen persoonlijke (en werk) geschiedenis, die weinig verslag heeft.


Van schrijven over werkelijke dood tot link-dood … terwijl de link-time van CNET met .com.com een ​​verrassing is, kan dit mogelijk het gevolg zijn van een verkoop, gebruik door een onbekende verwerver of eenvoudige verwaarlozing. Erger is het wanneer men links automatisch ziet ingekort, alleen voor de URL-verkorter om te verdwijnen, of voor de hostingdienst om andere korte links ongeldig te maken. Hoewel ik ervoor heb gepleit dat URL's er goed uitzien en intuïtief zijn, zijn we eraan gewend geraakt kleinere URL's te zien, het beste geïllustreerd door de t.co van Twitter, behulpzaam bij hun service, samen met goo.gl van Google, bit .ly en anderen. Maar door je aan te melden bij een korte URL-service, moet je deze onderhouden door de oorspronkelijke eigenaren en moeten alle tabellen intact zijn. Dus voor degenen onder ons die lang met ff.im van FriendFeed hebben gedeeld, is het bij de gratie van Facebook dat die oude dingen er nog steeds zijn, en vrijwel niemand zou verbaasd zijn als ze de komende jaren de weg van de dodo zouden gaan.


Mijn argument is dat het web moet worden gebouwd voor duurzaamheid. Een link die ik vandaag plaats, zou een link moeten zijn die later werkt. Een permanente link naar een speciale pagina met inhoud zou in de toekomst dezelfde inhoud moeten produceren, zelfs als het omringende frame is geüpgraded. En korte links en domeinen moeten zich op een betrouwbare, gebruikersvriendelijke manier gedragen. Het zou een kleine tragedie zijn als de startpagina die je dagelijks gebruikt, plotseling iets anders zou worden, en een grotere als het domein waarop je je persoonlijke verhalen host, gewoon de winkel sloot omdat de host het financieel niet haalbaar vond om door te gaan . Dus hoewel de magie van het web echt is, en het lijkt er soms op dat je praktisch alles kunt vinden en het meteen kunt krijgen (uitgaande van snelle breedband), denk ik dat we door de gaten beter kunnen doen.


En ja, CNET. Hoe gaat het?


Opnieuw gepubliceerd met toestemming van http://blog.louisgray.com/Original artikel kan hier worden gevonden: http://blog.louisgray.com/2013/09/deadlinksarelame.html.

Over dode domeinen en vervallen links: waarom het web zo kwetsbaar is