Date archives "December 2011"

LibraryCloud, een voorwaarde tot innovatie

LibraryCloud is een open metadata server die opgezet is door de Harvard Library Innovation Laboratory. Op de server worden metadata van bibliotheken en andere organisaties geaggregeerd en vrij beschikbaar gesteld als Linked Open Data en via API‘s. Het doel van LibraryCloud is om innovatief gebruik van collectie-data te stimuleren.

The aim is to enable completely unexpected disruptive innovation

Interessant omwille van de inhoud
LibraryCloud stelt meer dan 12 miljoen bibliografische records vrij beschikbaar, maar is vooral bijzonder omwille van het feit dat er naast de metadata over vorm en inhoud van de publicaties ook data over het gebruik van de bibliotheekcollecties beschikbaar is: o.a. uitleengegevens van de voorbije 10 jaar aan Harvard! De metadata-verzameling geeft info over het gebruik van titels in de lessen en reservaties door studenten.  Daarnaast zijn ook verwijzingen toegevoegd naar digitale versies en Wikipedia-boekenpagina’s. Als je nu zou denken dat dit enkel interessant is binnen een academische setting kan ik je geruststellen.  LibraryCloud bevat ook enkele miljoenen bibliografische records en bijhorende uitleendata van openbare bibliotheken: de San Francisco Public Library, de San Jose Public Libary en de Darien CT Public Library.
Wat nog ontbreekt is wat de lezers zelf over de collectie vertellen.  Daar is ook aan gedacht: er wordt een verrijking aangekondigd met gegevens uit het sociale boekennetwerk LibraryThing.

Interessant omwille van de open architectuur
LibraryCloud is opgezet als LAMP stack.  De gegevens zijn Linked Open Data compliant en er is een API.  De documentatie voor gebruik maakt de openheid compleet.

Interessant omwille van het vrij gebruik met respect voor privacy
LibraryCloud heeft de policy om data alleen te accepteren als die zonder licentie publiek bruikbaar zijn. Data met user-ID’s worden niet aanvaard uit respect voor de privacy. Aan bibliotheken die uitleengegevens doorsturen wordt gevraagd om de leners-ID’s en -namen te verwijderen. Het tijdstip van uitlening, en andere kenmerken die nuttig zijn voor het herkennen van patronen, zijn wel onderdeel van de dataset.

Interessant omwille van het vervolg
Veel data in de bibliotheeksector zitten -soms zelfs voor eigen gebruik- opgesloten in systemen die onderhouden worden door softwareleveranciers die hun eigen tempo, voorwaarden en ideeën als norm voor vooruitgang hanteren. Als data los van een systeem open beschikbaar gesteld worden kan iedereen mee de innovatie mee bepalen. Een blik van buitenaf kan verrassende inzichten en ideeën opleveren. Meer nog, het verrijken van geïsoleerde data met andere datasets kan nieuwe informatie en inzichten opleveren.

Open data voorzien, is geen innovatie op zich maar een voorwaarde tot innovatie. De gevolgen van LibraryCloud zijn daarom misschien wel het meest interessante deel van het verhaal.
En, er zijn al enkele toepassingen en experimenten met de LibraryCloud data.  Meer daarover in deze post!

The power of digital disorder

Binnenkort komt het nieuwe boek+blog Too Big To know van David Weinberger uit. Hoog tijd dus om samen te vatten waarom zijn vorige boek+blog Everything Is Miscellaneous een aanrader is voor iedereen die met organiseren van gegevens te maken heeft. Iedereen dus.
David Weinberger beschrijft hoe we doorheen de tijd gegevens of objecten op andere manieren zijn beginnen organiseren.  De veelheid aan content en objecten + de digitalisering en het internet hebben een belangrijke rol in deze evolutie.

De verschillende manieren waarop we dingen organiseren worden in het boek opgedeeld als:

  1. The first order of order – 1 ding op 1 plaats
    Dit is hoe we ons organiseren in de fysieke wereld, hoe we bijvoorbeeld onze kledij ordenen in de kast, het bestek in een lade, boeken in een boekenkast, …
    De first order of order is de fysieke ordening bij ons thuis, in een bibliotheek, in een winkel, …
  2. The second order of order – 1 ding op enkele plaatsen
    Dit is hoe we in de fysieke wereld de first order of order proberen te overstijgen door systemen te ontwikkelen die objecten op verschillende manieren terugvindbaar maken. Bij deze systemen wordt de ordening gescheiden van de fysieke objecten. Het meeste typische voorbeeld van de second order of order is de steekkaartencatalogus, of een fichebak.
    Bibliotheken maken hun collectie toegankelijk via papieren of digitale steekkaarten door verschillende ‘zoektoegangen’ te voorzien in de vorm van metadata: een titel, auteur, onderwerpen, …  Dit zijn afgesproken indelingen die zo consequent mogelijk toegepast worden.
  3. The third order of order – 1 ding op oneindig veel plaatsen
    Dit is hoe we digitale objecten kunnen organiseren.  Een digitale foto kan via oneindig veel tags of trefwoorden terugvindbaar gemaakt worden.  Een tekst of boek kan op elk woord doorzoekbaar gemaakt worden, … Er is geen vooraf bepaalde indeling afgesproken, de mogelijkheden van het digitale worden maximaal benut.

Ondanks de vele mogelijkheden van het digitale is onze geest nog grotendeels afgesteld op hoe we de fysieke wereld ordenen.  We maken mapjes op onze computer waarin we 1 foto, 1 tekst, … op een vaste plaats willen opbergen.  Maar onze digitale omgeving is niet langer de schijf van de eigen computer alleen.  Ons informatie universum is oneindig groot geworden.  Naast onze eigen computer is er de ondoorzichtige oneindig grote wanordelijke informatiewolk: het internet. In deze wanorde schuilt, zo zegt de auteur, net de grote kracht.

Ondanks al onze inspanningen om te ordenen blijft er altijd en overal een restrubriek. Dat zijn de moeilijk op te ruimen spullen, de documenten die overal en nergens thuishoren, een lade met keukengerei allerhande, een varia-rubriek in de bibliotheek, …  De ‘Miscellaneous’ in het verhaal van Weinberger staat voor alles wat zich moeilijk laat indelen. Zijn stelling is dat alles in de digitale wereld van het internet miscellaneous geworden is. Meer nog, door het maken van vooraf bepaalde indeel-keuzes sluiten we mogelijk relevante informatie uit.

De kracht van de wanorde schuilt in de mogelijkheden van onder andere het sociale web waar iedereen met eigen gekozen terminologie op vele verschillende manieren dezelfde of gelijkaardige objecten kan benoemen op sites als Flickr, YouTube, …. Deze digitale wanorde overstijgt de beperkt dimensionale voorindelingen en creëert de mogelijkheid om een eigen persoonlijke indelingen of filtering achteraf te maken.  Het feit dat daarbij verschillende terminologie gebruikt wordt voor gelijksoortige objecten is volgens Weinberger geen probleem, maar een verrijking van het internet.  Zijn nieuwe boek Too Big To know zal ingaan op de gevolgen van dit alles op de manier waarop we vandaag omgaan met kennis en informatie.

Everything Is Miscellaneous is geschreven in 2007, maar het onderwerp is nog altijd actueel. Het boek geeft een kader aan hoe we denken over ordening, en hoe we daar kunnen op inspelen om online en offline diensten te designen.  In het boek worden problemen geschetst waar we allemaal elke dag mee worstelen op onze eigen computer, op websites, in de winkel, in onze kast, …