Archieven & archiveren | snapshots maken

Bijgewerkt op 2021-04-20 om 17:27:03 door Harrie Baken

Archieven – onmisbaar

Je kent het wel. Je leest ergens iets interessants, bijvoorbeeld over het aanleggen van archieven, en denkt: die pagina moet ik onthouden. Dan volg je uit nieuwsgierigheid een link naar een andere pagina, en zo gaat dat maar door.

Een week (of zelfs maar een uur) later vertel je je v. enthousiast over je nieuw verworven kennis. Maar op de vraag ‘waar heb je dat gelezen dan?’ heb je geen antwoord. ‘Eh… ik héb het ergens gelezen! Maar waar?’

Een archief: de geschiedenis/history van je browser

Om je bron te achterhalen is een voor de hand liggend (maar beperkt) hulpmiddel natuurlijk de ‘geschiedenis’ van je webbrowser.
Of… van meerdere webbrowsers! Niet iedereen beperkt zich tot één browser. (Ikzelf spaar ze allemaal, bij wijze van spreken. Zelfs Edge van M$ gebruik ik soms.)
Uiteindelijk staan de adressen van al die bezochte sites dus toch nog verspreid over verschillende browsers. En op verschillende apparaten, ook dat nog. (Dit laatste probleem kun je overigens voor de afzonderlijke browsers oplossen door synchronisatie.)

Pocket

Voor het bewaren en ordenen (met behulp van tags) van url’s oftewel adressen van websites of webpagina’s vind ik Pocket een doeltreffende methode. Vooral heel handig is dat je je verzameling op elk apparaat en met elke browser kunt aanvullen. De gegevens worden gesynchroniseerd.

‘Echte’ archieven

Behalve de archieven die je in de loop van de tijd zelf aanlegt op de bovengenoemde manieren, zijn er natuurlijk ook de archieven van allerlei organisaties. Vakbonden, universiteiten, stadsarchieven, musea, enzovoorts. Het is dus handig om te weten waar je die grote databanken kunt vinden, met gegevens, artikelen, boeken, video’s, gedigitaliseerde manuscripten en ga maar door.

Zelf archiveren

Met zowel archive.org als archive.today kun je een webpagina opslaan en dus vastleggen zoals ze is op dat ene moment. Daar komen allerlei lastige zaken bij kijken, maar één eigenschap van die 2 archieven maakt ze geweldig. Afgezien van rampen als bommen en aardbevingen zijn ze ‘voor altijd’. En afgezien van politieke aardverschuivingen kan niemand erbij, en staan ze dus veilig.

Archive.org en archive.today

Met 2 sites voor archivering heb ik tot nu toe ervaring. Archive.org ken ik al jaren en de WayBack Machine daarvan gebruik ik bijna dagelijks. Half 2020 ontdekte ik Archive.today.

Archive.org & WayBack Machine

  • De WayBack Machine van het Internet Archive – ruim 525 miljard (2021-02-01) opgeslagen webpagina’s.
  • 6 Ways to Save Pages in the WayBack Machine – tips voor het gebruik van de WayBack Machine
    NB Het hele archive.org is vaak traag, maar het subdomein blog.archive.org is helemáál zult, en geeft soms niet eens op tijd antwoord (time-out). Maar ook al hapert archive.org vaak, het is en blijft een geweldig archief. Met een plug-in van archive.org kun je in de meeste webbrowsers een kopie maken van een webpagina. Dat werkt niet wanneer de website in kwestie het verbiedt of wanneer er fatal errors optreden. Dat is natuurlijk allebei frustrerend.
    En dan zijn er ook nog bedrijven die door amateurisme óf met opzet de WayBack Machine dwarszitten met een cookiewall, soms bijna paginagroot. Een paar onsympathieke kranten doen dat.
  • Een goed alternatief voor de hiervoor genoemde pagina met tips is Save Pages in the WayBack Machine. (Die pagina komt ook van een van hun subdomeinen, namelijk help.archive.org, maar dat subdomein functioneert tenminste redelijk goed.)

Archiveren op archive.org

Opgeslagen kopieën worden uiteraard beschikbaar voor iedereen. Van een drukbezochte pagina kan een flinke verzameling van momentopnames (snapshots) ontstaan. Op archive.org ziet dat er bijvoorbeeld zo uit: [screenshot, Baken!]

Archive.today = archive.vn = archive.md

Niet elke webpagina die je tegenkomt, kun je archiveren met de WayBack Machine van Archive.org. Sommige websites hebben een bepaald type cookiewall waardoor de WayBack Machine vastloopt. Bij een betaalmuur gaat het bijna altijd mis.

Archive.today is dan meestal de oplossing. Van de meeste cookiewalls en betaalmuren trekt de software van Archive.today zich niets aan. Hij archiveert gewoon wat je invoert. Dat is een uitkomst wanneer je lastige pagina’s – bijvoorbeeld die van bepaalde kranten – wilt archiveren.

De websites van sommige kranten komen nooit in archieven

Het Belang van Limburg en Het Nieuwsblad zijn 2 voorbeelden van kranten die alles op alles zetten om je geen enkel artikel gratis te laten lezen. Je moet meteen een abonnement nemen of het gewenste artikel kopen. Ook Archive.today is hier niet tegen opgewassen.

Er zijn ook kranten waarvan je 1 à 3 artikelen mag lezen, mits je je registreert. Daarna is het uit met de pret. Bij sommige voor altijd, bij andere mag je na een maand opnieuw hetzelfde aantal stukken gratis lezen.

Een pdf maken als laatste redmiddel

Bij zulke lastige gevallen is het zaak om meteen het artikel te printen. Niet gewoon printen, maar “afdrukken naar bestand” ofwel “print to file“. Het is soms even wat zoeken en pielen voordat je de optimale instellingen hebt. Maar voor een belangrijk artikel is dat de moeite waard: een gave pdf is het resultaat.

Exif

Een perfecte pdf (die ook goed geïndexeerd wordt door zoekmachines) heb je pas wanneer je alle (mogelijke) metadata toevoegt. Voor een pdf zijn dat de volgende exif-gegevens: titel, onderwerp, auteur/copyright en de trefwoorden. Ze zijn vergelijkbaar met de gegevens in de Eigenschappen van een tekstbestand van bijvoorbeeld Writer (van LibreOffice), en met de gegevens die bij een foto horen.

Exif bewerken en/of toevoegen

Die exif-gegevens kun je toevoegen of bewerken met een programma als exiftool, geschreven door Phil Harvey. Exiftool is ongelooflijk veelzijdig en werkt op zowel Linux als Mac OS als M$ Windows. (Zie ook de specifieke tags voor pdf’s.)

Een al bestaande pdf genaamd “Voorbeeld.pdf” zou ik op de opdrachtregel (command line) van mijn schattige doos harbeidbak als volgt onder handen kunnen nemen:

har@harbeidbak:~>exiftool Voorbeeld.pdf -Author="Harrie de Schrijver, Tilburg 2021" -Subject="Deze pdf gaat over van alles. En nog wat." -Title="Dit is de titel." -Keywords="Voorbeeld, Harrie de Schrijver, Tilburg, 2021, pdf, alles, titel"[enter]

Na het geven van de enter worden de eventuele oude tags vervangen door de bovenstaande tags (maar niet onherstelbaar), en de oorspronkelijke pdf wordt niet overschreven, maar krijgt een duidelijke nieuwe extensie, namelijk zo: Voorbeeld.pdf_original.

Exif bekijken

De gegevens opvragen is simpel. Je tikt: exiftool Voorbeeld.pdf[enter] en de gegevens vliegen over je beeldscherm. Maar zoals eerder al bleek, staan ze ook vermeld in de pdf zelf, onder Bestand -> Eigenschappen. Ook in je bestandsbeheerder worden ze weergegeven bij hover ofwel mouseover. Dat geldt overigens allemaal ook voor een hele berg andere bestanden: afbeeldingen, teksten, audio en video.

&

Archieven & zoekmachines

Thema’s & speciale onderwerpen

Pdf’s in mijn archieven

De pdf’s (en de rest) hieronder zijn bestemd voor pagina’s die ik nog moet maken. De meeste ervan stonden ooit op harricot.nl.

Kunst – pdf’s in de voorraadkast

Filosofie – pdf’s (en wat webpagina’s)

Afrika

Overige

Noam Chomsky – nog even in ‘t archief

  • Chomsky: Creativiteit blijft een groot mysterie, Florentijn van Rootselaar, Filosofie Magazine 2014/2 [pdf, 86 KiB]
  • Eerst maken we alles kapot en dan gaan we zitten jammeren“, Mirthe Berentsen interviewt Noam Chomsky, Vrij Nederland, 2 maart 2015 [pdf, 343 KiB]
  • Noam Chomsky, The Responsibility of Intellectuals, 23 februari 1967. (Om jaarlijks te herlezen, intellectuelen elke maand.)
  • Peter Augustine Lawler, Talking Man, National Review, 9 september 2016. [pdf, 60 KiB]
    Abstract: Tom Wolfe is a critic of the Darwinian theory of evolution. He thinks that the theory might explain all of nature, all observable reality – up to, but emphatically not including, the human being: the “beast with speech” (Homo loquax). In his invigorating 2006 Neh Jefferson lecture, he claimed to explain everything we need to know about that singular beast, and in his new book he explains why famous scientists have failed to come up with an alternative to the failed Darwinian explanation.”
  • Captain Fantastic, film van Mat Ross. Recensie door Gerhard Busch, VPRO gids, 6 september 2016 [pdf, 164 KiB]
  • De taal denkbaar denkbaar de taal, Arnout Jaspers, VPRO-gids, 27 september 2016 [pdf, 122 KiB] Over Lera Boroditsky en haar linguïstisch onderzoek.
  • Noam Chomsky on the Evolution of Language: A Biolinguistic Perspective [pdf, 123 KiB]. Interview door C.J. Polychroniou in Truthout, 24 september 2016.
  • Ibbotson and Tomasello, Language in a New Key, Scientific American, 2016 [Pdf, 3,5 MiB]
    Recent taalkundig onderzoek ondergraaft volgens de schrijvers de theorie van de ‘universal grammar’ (transformationeel-generatieve grammatica) van Chomsky. In hun artikel concluderen Ibbotson en Tomasello:
    “Much of Noam Chomsky’s revolution in linguistics – including its account of the way we learn languages – is being overturned.”

De bovengenoemde teksten horen thuis in een blogpost (die ik nog moet schrijven) over Noam Chomsky. Ik had al eens geoefend, naar aanleiding van Chomsky’s 89e verjaardag, in 2017.

Webpagina’s etc. voorlopig hier geparkeerd voor Simone Rops, alias perroportret, alias Natasha de Bruijn

‘The Animated Bayeux Tapestry’
De invasie van Engeland door Willem de Veroveraar in 1066
Animatie aan de hand van het Tapijt van Bayeux

Tapijt van Bayeux

Narcisme & megalomanie

  • Hoe herken je een narcist, een uitgebreide lijst kenmerken, door Mjon van Oers, Knack, 28 februari 2019 [pdf, 235 KiB]
  • Narcisten zijn niet eigenlijk heel onzeker, Roos Vonk ontzenuwt de opvatting dat paaslelies voortkomen uit onzekerheid. In: Psychologie Magazine, 26 oktober 2017 [pdf, 590 KiB]
  • De narcist: superieur, maar o zo kwetsbaar, NPO Radio 1 Special, 30 januari 2020, NTR, door Corlijn de Groot.
    In dit artikel onder meer een verwijzing naar een YouTube-video over de vraag: ‘Zijn er tegenwoordig meer narcistische mensen dan vroeger, en moeten we ons daar dan zorgen over maken?’ Sander Thomaes van de Universiteit Utrecht houdt hierover een interessante voordracht tijdens ‘t Betweter Festival 2016.
  • Fotografen van nu kruipen in de huid van Ed van der Elsken, Creators, 21 maart 2017. [pdf, 4,3 MiB] Hoe Debra Barraud, de bazin van Humans of Amsterdam, meedeed aan een fotowedstrijd van het Stedelijk in Amsterdam. Dat deed Barraud met een foto van Simone Rops van “vorig jaar”, zei Barraud. Maar de foto is van 31 maart of 1 april 2015, en was dus al bijna 2 jaar oud. De zaak tillen, noemen ze dat in Tilburg.
    Verder noemt deze superfotograaf de pilaar in Amsterdam C.S. waar Simone Rops tegenaan zit, een “stenen piano”. Dat is wel héél erg bijzonder apart & poëtisch & potsierlijk. Of stekeblind.

Angst & aanverwante ellende

Heidegger in het archief

Filosofie en feminisme

Voor Simone Rops houd ik feministische filosofie/filosofen in de gaten, want al zeker vanaf woensdag 19 april 2017 (we gingen toen samen naar De Pont) is ze daarnaar op zoek. Zei ze. Maar Simone Rops zegt wel vaker iets dat niets blijkt.

Taal & festigevalletjes

Kunst

Sean Scully – The Making of Black Square (2020)

Gevarieerde varia in ‘t archief

  • Herman Brusselmans, Wij van links, racistische column in de HUMO, 28 maart 2016. Na lezing van dit strontstuk heb ik acuut ruim een meter Brusselmans uit m’n boekenkast gekieperd. Ik heb de hele handel ingepakt, een printje van de “column” erbij gedaan, en afgegeven bij ‘t Boekenschop, Bredaseweg, Tilburg. (Toffe winkel, lieve mensen, goede goede doelen.)
  • RAL-kleurenwaaier – vooral met RAL 9010 heb ik samen met Harrie van I. menig pand in Tilburg onder-, vol- en ingesmeerd. Buiten lijkt RAL 9010 spierwit, binnen valt het meestal truttig uit, beetje crème, dus vies & bah. Geef mij maar RAL 9003.
  • A 900-Page Pre-Pantone Guide to Color from 1692: A Complete High-Resolution Digital Scan, Josh Jones op openculture.com, 6 april 2021.
  • Singer-songwriter Sarah Mary Chadwick (zo lees je het via archive.org, anders moet je eerst een keiduur abo nemen). Ik heb altijd gedacht dat alles wat zingt ongezond is voor m’n kop (uitgezonderd Billie Holiday natuurlijk en Françoise Hardy en Candace Kucsulain, en al degenen ik nu vergeet).
  • Maar misschien slaat de ouderdom toe, en ga ik allerlei maffe dingen leuk vinden. Want onlangs stuitte ik via Bandcamp op Sarah Mary Chadwick en ‘t was gaaf wat ik hoorde.
    Ik heb op Bandcamp subiet een digital album van haar gekocht, en wel haar recentste, Me & Ennui Are Friends, Baby (5 februari 2021):

Voor S. (en mezelf)

Menu

home | overzicht | Oude Warande | Lustwarande 2021 – STATIONS | LW 2019 | LW 2018 | LW 2017 | LW 2016 | LW 2011 | Lustwarande 2004 | logboek | dagboek | archieven | WP-app | validator | harrie@harriebaken.nl | Lustwarande Moet Blijven

Plaats een reactie

20 − 3 =

Deze website gebruikt Akismet om spam te verminderen. Bekijk hoe je reactie-gegevens worden verwerkt.

%d bloggers liken dit: