Archieven & archiveren | snapshots maken

Bijgewerkt op 2022-08-05 om 23:53:48 door Harrie

Archieven – vinden & zelf aanleggen

Automatisch archief: de geschiedenis van je webbrowser

Voor sommige archieven hoef je niks te doen, ze zijn er vanzelf. Bijvoorbeeld de geschiedenis of history van je browser. Of van meerdere webbrowsers. Niet iedereen beperkt zich tot één browser. (Ikzelf spaar ze allemaal, bij wijze van spreken. Zelfs Edge van M$ gebruik ik soms.)

Pocket

Voor het bewaren en ordenen (met behulp van tags) van url’s oftewel adressen van websites of webpagina’s vind ik Pocket een doeltreffende methode. Vooral heel handig is dat je je verzameling op elk apparaat en met elke browser kunt aanvullen. De gegevens worden gesynchroniseerd.

Echte archieven

Behalve de archieven die je in de loop van de tijd zelf aanlegt op de bovengenoemde manieren, zijn er natuurlijk ook de archieven van allerlei organisaties. Vakbonden, universiteiten, stadsarchieven, musea, enzovoorts. Het is dus handig om te weten waar je die grote databanken kunt vinden, met gegevens, artikelen, boeken, video’s, gedigitaliseerde manuscripten en ga maar door.

Zelf archiveren

Met zowel archive.org als archive.today kun je een webpagina opslaan en dus vastleggen zoals ze is op dat ene moment. Daar komen allerlei lastige zaken bij kijken, maar één eigenschap van die 2 archieven maakt ze geweldig. Afgezien van rampen als bommen en aardbevingen zijn ze ‘voor altijd’. En afgezien van politieke aardverschuivingen kan niemand erbij, en staan ze dus veilig.

Archive.org en archive.today

Met 2 sites voor archivering heb ik tot nu toe ervaring. Archive.org ken ik al jaren en de WayBack Machine daarvan gebruik ik bijna dagelijks. Half 2020 ontdekte ik Archive.today.

Archive.org & WayBack Machine

  • De WayBack Machine van het Internet Archive – ruim 525 miljard (2021-02-01) opgeslagen webpagina’s.
  • 6 Ways to Save Pages in the WayBack Machine – tips voor het gebruik van de WayBack Machine
    NB Het hele archive.org is vaak traag, maar het subdomein blog.archive.org is helemáál zult, en geeft soms niet eens op tijd antwoord (time-out). Maar ook al hapert archive.org vaak, het is en blijft een geweldig archief. Met een plug-in van archive.org kun je in de meeste webbrowsers een kopie maken van een webpagina. Dat werkt niet wanneer de website in kwestie het verbiedt of wanneer er fatal errors optreden. Dat is natuurlijk allebei frustrerend.
    En dan zijn er ook nog bedrijven die door amateurisme óf met opzet de WayBack Machine dwarszitten met een cookiewall, soms bijna paginagroot. Een paar onsympathieke kranten doen dat.

Archiveren op archive.org

Opgeslagen kopieën worden uiteraard beschikbaar voor iedereen. Van een drukbezochte pagina kan een flinke verzameling van momentopnames (snapshots) ontstaan. Op archive.org ziet dat er bijvoorbeeld zo uit: [screenshot, Baken!]

Archive.today

Niet elke webpagina die je tegenkomt, kun je archiveren met de WayBack Machine van Archive.org. Sommige websites hebben een bepaald type cookiewall waardoor de WayBack Machine vastloopt. Bij een betaalmuur gaat het zelfs bijna altijd mis.

Archive.today is dan meestal de oplossing. Van bijna(!) geen enkele cookiewall en paywall trekt de software van Archive.today zich niets aan. Hij archiveert gewoon wat je invoert. Dat is een uitkomst wanneer je lastige pagina’s wilt archiveren, bijvoorbeeld die van bepaalde kranten.

Registreren voor mini-abo op een krant

Er zijn kranten waarvan je 1 à 3 artikelen mag lezen, mits je je registreert. Daarna is het uit met de pret. Bij sommige voor altijd, bij andere mag je na een maand opnieuw hetzelfde aantal stukken gratis lezen.

Sommige kranten willen hun pagina’s per se niet laten archiveren

Het Belang van Limburg en Het Nieuwsblad zijn twee voorbeelden van Vlaamse kranten die alles op alles zetten om je geen enkel artikel gratis te laten lezen. Je moet meteen een abonnement nemen of het gewenste artikel kopen. Ook Archive.today is technisch niet opgewassen tegen zulke paywalls.

(Bijna) laatste redmiddel: een pdf maken

Schijnbaar onmogelijke gevallen pak je aan door het artikel te printen. Niet gewoon printen, maar “afdrukken naar bestand” oftewel “print to file“. Het is soms wat zoeken en pielen voordat je de optimale instellingen hebt en elke browser heeft z’n eigenaardigheden. Voor een belangrijk artikel is enig gepiel wel de moeite waard.

Exif

Een perfecte pdf (die ook goed geïndexeerd wordt door zoekmachines) heb je pas wanneer je alle (mogelijke) metadata toevoegt. Voor een pdf zijn dat de volgende exif-gegevens: titel, onderwerp, auteur/copyright en de trefwoorden. Ze zijn vergelijkbaar met de gegevens in de Eigenschappen van een tekstbestand van bijvoorbeeld Writer (van LibreOffice), of met de gegevens die bij een foto horen.

Exif bewerken en/of toevoegen

Die exif-gegevens kun je toevoegen of bewerken met een programma als exiftool, geschreven door Phil Harvey. Exiftool is ongelooflijk veelzijdig en werkt op zowel Linux als Mac OS als M$ Windows. (Zie ook de specifieke tags voor pdf’s.)

Exiftool

Een al bestaande pdf genaamd “Voorbeeld.pdf” zou ik op de opdrachtregel (command line) van mijn machine harbeidbak als volgt onder handen kunnen nemen:

har@harbeidbak:~>exiftool Voorbeeld.pdf -Author="Harrie de Schrijver, Tilburg 2021" -Subject="Deze pdf gaat over van alles. En nog wat." -Title="Dit is de titel." -Keywords="Voorbeeld, Harrie de Schrijver, Tilburg, 2021, pdf, alles, titel"[enter]

Na het geven van de enter worden de eventuele oude tags vervangen door de bovenstaande tags (maar niet onherstelbaar).

Exif bekijken

De gegevens opvragen is simpel. Je tikt: exiftool Voorbeeld.pdf[enter] en de gegevens vliegen over je beeldscherm. Maar ze staan ook vermeld in de pdf zelf, onder Bestand -> Eigenschappen.

Printen in reader view

Nog een truc. Ergens in het menu van je browser zit een knopje voor Lezerweergave (Firefox) of Reader View (G. Chrome) of Lezermodus aanzetten (Opera), etc. Ook in die ‘modus’ kun je printen naar bestand, dus pdf. Deze manier levert je snel een vereenvoudigd document op. Voordeel: geen 1 MiB, maar 50 KiB (en minder vaak een lege inktpatroon na een echt printje).

Allerlaatste redmiddel: c&p

Wanneer van het bovenstaande echt niks werkt, kopieer je de hele pagina. Bij voorkeur na een ctrl+a, dus met afbeeldingen, opmaak en de hele reut. Dat plak je in een nieuwe pagina in je tekstverwerker. Sla op en geef het een voorlopige naam. (Doe rustig aan, want het kán een enorm bestand zijn.)

Veel werk

De grootte van de klus hangt af van de ruis die je moet verwijderen en van de opmaak die je moet bijwerken. Ook is het verstandig je eigen persoonlijke gegevens (die soms in de oorspronkelijke link zitten!) te verwijderen. En even verstandig en sowieso fatsoenlijk is het om de bron te vermelden en de auteur en de onderschriften bij – en de makers van – de afbeeldingen.

Héél veel werk

En dan ben je nog niet klaar. Geef het document de juiste ‘eigenschappen’ oftewel metadata. Titel, auteur, samenvatting, trefwoorden. Exporteer daarna je document vanuit je tekstverwerker naar een pdf met de beste naam die je kunt bedenken.

Archieven & zoekmachines

Thema’s & speciale onderwerpen

Pdf’s in mijn archieven

De pdf’s (en de rest) hieronder zijn bestemd voor pagina’s die ik nog moet maken. De meeste ervan stonden ooit op harricot.nl.

Kunst – pdf’s en artikelen in de voorraadkast

Filosofie – pdf’s (en wat webpagina’s)

Afrika

Hypatia van Alexandrië, filosoof
Hypatia van Alexandrië, filosoof

Overige filosofie

The Philosopher Queens, Rebecca Buxton and Lisa Whiting, ISBN 9781783528295 front cover
The Philosopher Queens, Rebecca Buxton and Lisa Whiting

Noam Chomsky – nog even in ‘t archief

Noam Chomsky, portretfoto zwart-wit
Noam Chomsky
  • Chomsky: Creativiteit blijft een groot mysterie, Florentijn van Rootselaar, Filosofie Magazine 2014/2 [pdf, 86 KiB]
  • Eerst maken we alles kapot en dan gaan we zitten jammeren“, Mirthe Berentsen interviewt Noam Chomsky, Vrij Nederland, 2 maart 2015 [pdf, 343 KiB]
  • Noam Chomsky, The Responsibility of Intellectuals, 23 februari 1967. (Om jaarlijks te herlezen, intellectuelen elke maand.)
  • Peter Augustine Lawler, Talking Man, National Review, 9 september 2016. [pdf, 60 KiB]
    Abstract: Tom Wolfe is a critic of the Darwinian theory of evolution. He thinks that the theory might explain all of nature, all observable reality – up to, but emphatically not including, the human being: the “beast with speech” (Homo loquax). In his invigorating 2006 Neh Jefferson lecture, he claimed to explain everything we need to know about that singular beast, and in his new book he explains why famous scientists have failed to come up with an alternative to the failed Darwinian explanation.”
  • Captain Fantastic, film van Mat Ross. Recensie door Gerhard Busch, VPRO gids, 6 september 2016 [pdf, 164 KiB]
  • De taal denkbaar denkbaar de taal, Arnout Jaspers, VPRO-gids, 27 september 2016 [pdf, 122 KiB] Over Lera Boroditsky en haar linguïstisch onderzoek.
  • Noam Chomsky on the Evolution of Language: A Biolinguistic Perspective [pdf, 123 KiB]. Interview door C.J. Polychroniou in Truthout, 24 september 2016.
  • Ibbotson and Tomasello, Language in a New Key, Scientific American, 2016 [Pdf, 3,5 MiB]
    Recent taalkundig onderzoek ondergraaft volgens de schrijvers de theorie van de ‘universal grammar’ (transformationeel-generatieve grammatica) van Chomsky. In hun artikel concluderen Ibbotson en Tomasello:
    “Much of Noam Chomsky’s revolution in linguistics – including its account of the way we learn languages – is being overturned.”

De bovengenoemde teksten horen thuis in een blogpost (die ik nog moet schrijven) over Noam Chomsky. Ik had al eens geoefend, naar aanleiding van Chomsky’s 89e verjaardag, in 2017.

Webpagina’s en pdf’s voor #SR

Narcisme & megalomanie & theatrale stoornis

  • Hoe herken je een narcist, een uitgebreide lijst kenmerken, door Mjon van Oers, Knack, 28 februari 2019 [pdf, 235 KiB]
  • Narcisten zijn niet eigenlijk heel onzeker, Roos Vonk ontzenuwt de opvatting dat paaslelies voortkomen uit onzekerheid. In: Psychologie Magazine, 26 oktober 2017 [pdf, 590 KiB]
  • De narcist: superieur, maar o zo kwetsbaar, NPO Radio 1 Special, 30 januari 2020, NTR, door Corlijn de Groot.
    In dit artikel onder meer een verwijzing naar een video op YouTube/Google over de vraag: ‘Zijn er tegenwoordig meer narcistische mensen dan vroeger, en moeten we ons daar dan zorgen over maken?’ Sander Thomaes van de Universiteit Utrecht houdt hierover een interessante voordracht tijdens ‘t Betweter Festival 2016.
  • Beter dan de rest: er zit een narcist in ons allemaal, Doetie Talsma, in Univers, 25 oktober 2021.

Angst & aanverwante ellende

Heidegger in het archief

Bayeux & Hastings

Een kleine verzameling over het Tapijt van Bayeux en de slag bij Hastings. Daarover kwamen Simone Rops en ik te spreken in ‘t restaurant van museum De Pont. Dit gesprek – en feitelijk de hele middag in De Pont – bleek kort daarna een van haar staaltjes überprofessioneel acteerwerk. Dat was wel een beetje kut. Denk je een maatje erbij te hebben, blijkt het allemaal toneel. Ik haat verraad. Ja, toneel ook.

Willem de Veroveraar

Ons gekeuvel over Guillaume le Conquérant (alias Willem de Bastaard) was naar aanleiding van talen en onze taalbeheersing, en de invloed van het Normandisch Frans op het Engels, na de slag bij Hastings in 1066.

‘The Animated Bayeux Tapestry’
De invasie van Engeland door Willem de Veroveraar in 1066
Animatie aan de hand van het Tapijt van Bayeux

Bayeux – geborduurd stripverhaal

Kunst

Sean Scully – The Making of Black Square (2020)

Vervolg (voorlopig, de pagina wordt te groot)

Tarkovsky – uren en uren
Sergei Eisenstein: Potemkin – ruim een eeuw geleden

Archief – allerlei

  • Herman Brusselmans, Wij van links, een racistische column in de HUMO, 28 maart 2016. Na lezing heb ik acuut ruim een meter Brusselmans uit m’n boekenkast gekieperd. Ik heb de hele handel ingepakt, een printje van de “column” erbij gedaan, en afgegeven bij ‘t Boekenschop, Bredaseweg, Tilburg. (Toffe winkel, lieve mensen, goeie goede doelen.) [Naschrift, december 2021] ‘t Boekenschop is verhuisd naar de D.J. Jittastraat 2, 5042 MX Tilburg (Westermarkt).
  • RAL-kleurenwaaier – vooral met RAL 9010 heb ik samen met meester-schilder Harrie van I. menig pand in Tilburg onder-, vol- en ingesmeerd. Kijk er mee uit, want buiten lijkt RAL 9010 spierwit, terwijl het binnen meestal truttig uitvalt, een beetje crème, dus vies & bah. Geef mij daarom maar RAL 9003.
  • Moeilijke Miles, Rick de Gier, VPRO-gids 7 september 2019 – recensie van Birth of the Cool, een filmportret van Miles Davis. (Gezien met JB en Max Miles in september 2019.)
  • A 900-Page Pre-Pantone Guide to Color from 1692: A Complete High-Resolution Digital Scan, Josh Jones op openculture.com, 6 april 2021.
  • De mythe van één miljoen huizen: hoe bouwcijfers worden beïnvloed, artikel in Cobouw (16 december 2021) over het onderzoek van Cobouw en Follow the Money naar (en de ontmaskering van) de leugen dat er in de landstreek NL in no time ‘n miljoen huizen moeten worden bij gepropt. [pdf, 3,1 MiB]

Voor SB (en mezelf) – praat

home | overzicht | Oude Warande | Lustwarande 2022 – GODHEAD | LW 2021 | LW 2019 | LW 2018 | LW 2017 | LW 2016 | LW 2011 | LW 2004 | logboek | archieven | WP-app | validator

mail harrie@harriebaken.nl

dagboek (alle weken)

Plaats een reactie

drie × drie =

Deze site gebruikt Akismet om spam te verminderen. Bekijk hoe je reactie-gegevens worden verwerkt.

%d bloggers liken dit: