MongoDB, I.

Zo nu en dan zal ik hier ingaan op mijn belevenissen met MongoDB. MongoDB is een document georienteerd database systeem en dat wil zo veel zeggen dat in dit systeem diverse soorten data in één database, c.q. tabel kan worden ingebracht.

Dat MongDB het toestaat om verschillende soort data door elkaar te plaatsen, wil natuurlijk niet zeggen dat het zinvol is om volledig verschillende soorten data te mengen in één database. U begrijpt dat het op een adequate manier weer tevoorschijn halen van die data gebaat is bij een zekere structuur of uniformiteit.

In de praktijk kan ik mij de volgende situatie bedenken. Men ontwerpe een database met MongoDB, we noemen de nieuweling ‘titles’ en vervolgens creeren we in deze database een ‘collection’, deze nieuweling noemen we ook ‘titles’. In MongoDB kringen wordt een ‘collectie’ wel eens vergeleken met de ‘table’ in bijvoorbeeld MySQL, voor de duidelijkheid. De veldstructuur, kolommen in de relationele database wereld genoemd, geven we hier niet aan, dat hoeft niet namelijk.

Nu is het in mijn situatie zo dat bibliografische metadata van verschillende oorsprong, nogal eens verschilt. Zo kan de volgorde van de verschillende onderdelen verschillen, of biedt de ene bron meer informatie dan de andere. Ter illustratie, in de bibliotheek van het Vredespaleis kan data komen van onze bibliotheeksoftware leverancier (OCLC voorheen PICA) en bijvoorbeeld van Swets. De data (1 record) van OCLC ziet er zo uit:
PPN : 271808578
0200 2001:12-02-05
0210 1009:11-05-11 09:51:32.000
0230 1009:11-05-11
0500 Aax
2000 3902021403
2065 973534230
1500 /1eng
1100 2004
1700 /1at
4204 Met lit. opg4000 @Peace operations in Africa : 34th IPA Vienna Seminar / ed. by: Ernst Sucharipa
3011 Ernst@Sucharipa!333857747!Ernst Sucharipa
3161 @IPA Vienna Seminar ; 34 (Vienna) : 30-06-2004
4030 Wien : Diplomatische Akademie Wien
4060 176 p
4062 24 cm
4061 ill
4170 @Favorita papers ; 03/2004
4201 Omslagtitel
5500 <0>Peacekeeping forces * Congresses $ Africa
5030 JZ6377.A35 – I63 2004
5030 JZ
6501 !076239381!Africa
6502 !076246299!Peacekeeping
6503 !076251853!Regional security
6504 !07623939X!Conferences
6505 !076242633!Vienna
6506 !250168707!2004
6000 41
6010 179 Afrique
7001 11-05-11 : r069x
7100 429 E 1
8200 06071170

De data (1 record) van Swets ziet er zo uit:
“Symeonides, Symeon C”,”Choice of Law in the American Courts in 2010: Twenty-Fourth Annual Survey”,”American Journal of Comparative Law”,”2011″,”59″,”2″,”303-395″,”0002919X”,””,””

Ik zal u niet vermoeien met de details, maar een goed verstaander ziet toch wel enkele velden, in deze zeer van elkaar verschillende informatieverzamelingen, die gezamenlijk zijn: een auteur bijvoorbeeld, een titel, pagina info en een jaar.

Wat zou het toch handig zijn om de delen uit beide bronnen die gezamenlijk zijn bij elkaar onder te brengen in een informatieverzameling, maar daar tegelijkertijd de verschillende informatie in mee te nemen, in bovenstaande voorbeeld ontbreekt bijvoorbeeld bij Swets plaats en uitgevers informatie, of het isbn.

In een volgend verslag ga ik in op een lokale installatie van MongoDB, dus niet op een server, maar gewoon op mijn pc. En daarnaast besteed ik wat aandacht aan de verwerking van de verschillende data in mijn MongoDB, titles.

Dit bericht is geplaatst in mongodb met de tags , , . Bookmark de permalink.

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *