För allt samtalet om hur mycket information som produceras varje år och hur varje liten bit av våra liv delas och göras omedelbart upptäckbara, är det förvånande hur svårt det kan vara att hitta information på webben, i sitt ursprungliga skick från bara för fem år sedan, än mindre 10 eller 15.
Medan vi en gång var regalade med berättelser om hur Internet skulle kunna motstå nukleär krig, tack vare en komplicerad struktur av redundans och geografiska säkerhetskopior, har enkla mänskliga misstag, i konflikt med enstaka ondskapsakt, minskat vår förväntan på att data, en gång publicerat, kommer att vara för alltid stabil.
Jag tror starkt på molnbegreppet och har praktiskt taget flyttat alla mina data till det och förlitat mig på en molncentrisk bärbar dator varje dag och sparat mina filer i molnet. Men inte alla är lika noga med att välja leverantörer och underhålla plattformar och domäner som jag har varit, och det är inte så ovanligt att hela webbplatser och bokmärken försvinner från webben, med bara Archive.org och andra smarta cachare kvar för att berätta historien.
Innan det här låter som en hård berättelse eller en anti-web-screed från någon inbäddad på webben, låt mig ge dig ett specifikt exempel. Föreställ dig, om du skulle göra det, en unik URL som pekar tillbaka till den ursprungliga dotcom-boom - en enkel som com.com. Nej, jag skrev inte det två gånger. Domänen com.com har länge ägs av CNET, en del av CBS Interactive. Medan CNET har genomgått ett antal ägare under decennierna sedan lanseringen, såg man också extrem variation i hur de marknadsförde sin huvudsida och webbadresser. För oss som bara ville ha nyheterna var det News.com. Senare skulle News.com omdirigera till News.Cnet.com, som det gör idag.
Archive.org Visar News.com.com i ett tidigare känt bra tillstånd
Men vid en tidpunkt omdirigerades News.com till News.com.com, och av vilken anledning det är, är det bokmärket jag har följt mig från webbläsare till webbläsare i flera år. Plötsligt, för ett par månader sedan, slutade detta bokmärke att fungera, i stället visade jag en katalog med länkar, som såg ut som en sprickor hade tagit URL och tagit över den. Archive.org visar samma sak. News.com.com fungerade och sedan i juli … slutade omdirigeringen. Så det är irriterande. Även om det är tillräckligt enkelt för mig att uppdatera mitt bokmärke, och utan tvekan är jag i den lilla minoriteten av användare som har behållit den webbadressen, att ha en potentiellt hög profil-URL som .com.com gör absolut ingenting … verkar dumt.
Men nu är den gamla News.com.com URL: ren skräp
Tillräckligt med .com.com. Det som ibland är lika frustrerande är den korta hållbarheten för länkar och bilder från tidigare år. Min egen blogg har funnits i drygt sju år, och i de ungefär 3 000 inlägg jag har gjort sedan starten har var och en haft många länkar. När företag kommer och går försvinner deras webbplatser och länkarna till deras undersidor. Nyhetsmediasidor, som man hoppas skulle kunna presentera ett tidlöst arkiv, en lång svans av information till sanningssökande där ute, är ofta de värsta gärningsmännen, eftersom artiklar från ett visst datum faller bakom en betalvägg, eller webbplatsplattformar förändras, för evigt kapa länkstruktur och återge tidigare länkar odugliga.
En av de största ånger jag har när det gäller webben är en som Ryan Tate (nu med WIRED) och jag delar. Under webben mer förhistoriska tider, tillbaka i slutet av 1990-talet, arbetade han och jag båda på Daily Californian studenttidningen på UC Berkeley. Båda av oss skrev hundratals nyheter, som täcker allt från studentval till campus-galningar och enstaka mord. Men vid ett tillfälle, efter att jag lämnat papperet, hackades / skadades vår webbplats och allt existerande innehåll försvann - chockerande utan säkerhetskopiering. Så mer än 99% av dessa uppgifter försvinner för gott, och man måste antingen resa till Berkeley-campus och hämta ett hårdbundet papper för att se vårt arbete, eller så är det bara borta. Medan få av mina berättelser är värda att läsa cirka 15 år senare, är de en del av min egen personliga (och arbete) historia, som har lite rekord.
Från att skriva om den faktiska döden till att länka döden … medan CNETs länk förfaller med .com.com är en överraskning, kan det möjligen bero på en försäljning, som ska användas av en okänd förvärvar eller enkel försummelse. Värre är det om man ser länkar som förkortas automatiskt, bara för att URL-förkortaren försvinner eller för att värdtjänsten upphäver andra korta länkar. Medan jag har gjort mitt fall för att URL: er ska se bra ut och vara intuitiva, har vi vant oss vid att se mindre URL: er, bäst exemplifierade av t.co från Twitter, användbara för deras tjänst, tillsammans med goo.gl från Google, bit .ly och andra. Men genom att köpa in en kort URL-tjänst kräver du att den upprätthålls av de ursprungliga ägarna och att alla tabeller är intakta. Så för de av oss som länge delat med ff.im från FriendFeed, är det av Facebook-nåd att de gamla sakerna fortfarande finns, och praktiskt taget skulle ingen bli förvånad om de gick vägen för dodo under de kommande par åren.
Mitt argument är att webben ska byggas för permanenthet. En länk som jag publicerar idag borde vara en länk som fungerar senare. En permalänk till en dedikerad sida med innehåll bör producera samma innehåll, även om den omgivande ramen har uppgraderats i framtiden. Och korta länkar och domäner bör bete sig på ett pålitligt, användarvänligt sätt. Det skulle vara en mindre tragedi om startsidan du använder dagligen plötsligt blir något annat, och en större om domänen där du är värd för dina personliga berättelser helt enkelt stängde butiken eftersom värden inte tyckte att det var ekonomiskt genomförbart att fortsätta mer . Så medan magin på webben är verklig, och det ibland verkar som om du praktiskt taget kan hitta något där ute och få det direkt (förutsatt snabbt bredband), har luckorna mig att tro att vi kan göra bättre.
Och ja, CNET. Vad händer?
Publiceras med tillstånd från http://blog.louisgray.com/Original artikel kan hittas här: http://blog.louisgray.com/2013/09/deadlinksarelame.html.