Version française

Inhoud

Bekijk hier de opname van de LIBISnet-workshop over dit thema (28 februari 2023)

Wat zijn de FRBR- & dedup-processen?

FRBR en dedup zijn twee mechanismen die in Limo afzonderlijke Alma-records verzamelen zodat gebruikers records die 'samenhoren' ook als groep terugvinden in de zoekresultatenlijst. Beide processen werken volgens een verschillend basisprincipe.

Het FRBR-proces (of FRBRization) vertrekt vanuit het FRBR-model. Dat staat voor Functional Requirements for Bibliographic records. Binnen dit model is het FRBR-proces bedoeld om gelijkaardige records te groeperen: het gaat dan, in FRBR-termen, om het samenbrengen van de verschillende manifestaties en expressies van hetzelfde werk. In meer 'klassieke' catalografische termen, kan je stellen dat FRBR bedoeld is om de verschillende edities van een bepaalde tekst te verzamelen en als een overzichtelijk geheel aan de gebruiker te presenteren.

Het dedup-proces (of deduplication) zorgt ervoor dat gelijke records worden samengesmolten. Het gaat dan niet over records die verschillende edities beschrijven maar om records die dezelfde editie beschrijven. Verschillende scenario's leiden ertoe dat in Limo meerdere records voor dezelfde editie aanwezig kunnen zijn:

  • omdat in Alma 2 afzonderlijke records worden gemaakt voor de fysieke (P) en elektronische (D/E) versie van eenzelfde editie.
  • omdat in Limo records samenkomen uit verschillende bronnen (Alma, Lirias) waartussen overlap bestaat en eenzelfde editie dus in twee of meer bronbestanden beschreven is.
  • omdat (al dan niet per ongeluk) eenzelfde editie meerdere bibliografische records kreeg in Alma.

De FRBR- en dedup-processen werken niet op alle records die in Limo getoond worden:

  • FRBR & dedup werken op de records die vanuit Alma in Limo getoond worden (uitgezonderd bepaalde groepen, cf. infra).
  • FRBR & dedup werken ook op records die rechtstreeks in Limo worden ingeladen (bv. Lirias-records).
  • FRBR & dedup werken ook tussen beide vorige groepen (de lokale records): Alma en Lirias-records worden dus ook onderling samengevoegd volgens FRBR- en dedup-principes.
  • records uit de Central Discovery Index (CDI) worden onderling wel volgens dedup samengevoegd, maar niet volgens FRBR.
  • er is ook geen FRBR, noch dedup tussen records lokale records en records uit de CDI.

Hoe worden FRBR en dedup zichtbaar in Limo?

FRBR brengt gelijkaardige records samen in een FRBR-groep. Deze zijn in een zoekresultatenlijst duidelijk herkenbaar aan het specifieke icoontje, de aanduiding Meerdere versies i.p.v. een specifiek documenttype en de aanduiding [x] versies gevonden. Bekijk alle versies onder de titel.

Image Placeholder

Wanneer een gebruiker in een zoekresultatenlijst op een FRBR-groep klikt, wordt daarna de lijst van de afzonderlijke edities binnen deze groep getoond. Deze staat standaard alfabetisch gesorteerd (al is de titel normaliter dezelfde) en vervolgens aflopend chronologisch met dus de meest recente editie bovenaan.

Image Placeholder

Records die door het dedup-mechanisme zijn samengesmolten zijn in de zoekresultatenlijst (met opzet) minder herkenbaar. Ze worden net als andere records getoond als 1 zoekresultaat. Aan dit zoekresultaat wordt dan wel alle inventory gekoppeld van de samengevoegde records. Een record waarbij zowel verwezen wordt naar beschikbare fysieke exemplaren als naar een elektronische toegang, zal dus bijna altijd een dedup-groep van 2 of meer samengesmolten records zijn.

Image Placeholder

Bij dedup is er op het niveau van het bibliografisch record geen samensmelting. Limo 'kiest' 1 van de records in de dedup-group als preferred record volgens volgende principes:

  • als je in je zoekopdracht een zoekterm opgaf die slechts in 1 van de records voorkomt, wordt dit record als preferred record getoond. Je krijgt dus steeds het voor jou meest relevante record te zien.
  • is er op dit punt geen verschil te maken, dan geeft Limo de voorrang aan de fysieke versie.

Belangrijk: de samengesmolten records van een dedup-groep zijn opzoekbaar met alle zoektermen uit alle records. Ook in de facets worden de termen van de verschillende records getoond.

Er is ook een methode om in Limo met zekerheid na te gaan of een zoekresultaat een dedup-groep toont of niet:

  • klik het zoekresultaat aan zodat het record in detail wordt weergeven in Limo.
  • voeg in de adresbalk van je browser achteraan de url &ShowPnx=true toe.
  • je ziet nu het PNX-record (de 'achterkant' van het mooi vormgegeven Limo-record).
  • zoek in de control-sectie naar het label isDedup. Als daarachter true staat, heb je te maken met een dedup-groep.
Image Placeholder

Hoe bepaalt Limo welke records in FRBR- of dedup-groepen horen?

Beide mechanismen werken op een gelijkaardige manier: losse metadata-elementen uit de bronrecords in Alma, Lirias, CDI, ... (partial keys) worden volgens vaste regels gecombineerd tot complete keys. Zo krijgt elk record een set van complete keys die dan kan vergeleken worden met de sets van andere records. Zodra één van de complete keys in 2 of meerdere records exact overeenkomt, spreken we van een match en worden de records samengebracht in een FRBR- of dedup-groep.

Voor het FRBR-mechanisme is de opbouw van de keys vrij eenvoudig:

  • als het record een tag 100, 110 of 111 bevat wordt deze tag gecombineerd met de volledige titel (245) tot de unieke FRBR-key voor dat record. Zowel auteursnaam als titel worden wel vereenvoudigd zodat bv. leestekens geen invloed hebben op de opmaak van de FRBR-key.
  • Als er geen tag 100, 110 of 111 in het record zit, worden er FRBR-keys gemaakt voor alle combinaties van de tags 700, 710 en 711 in het record met de volledige titel (245). Een record zonder tag 100, 110 of 111 maar met 2 700- en 1 710-tag zal dus 3 FRBR-keys krijgen.

Voor dedup is de opbouw van de keys een stuk complexer. Dat komt omdat er naast auteursnamen en titels ook nog heel wat andere metadata-elementen worden opgenomen in de dedup keys: identifiers uit tag 035, ISBN, ISSN, datum van uitgave, uitgever. Een voorbeeld: de meest uitgebreide dedup complete key maakt volgende combinatie:

  • de volledige titel uit tag 245
  • het publicatiejaar (uit 008 of als dat niet is ingevuld uit 260 $$c of als dat niet aanwezig is uit 264 $$c)
  • de uitgever (260 $$b > 264 $$b)
  • de paginering (300 $$a)
  • De hoofdauteur (uit 100 of 110)
Dat resulteert dan voor bv. record 9992150769201471, na vereenvoudiging van de tekst, in de volgende complete key: relations internationales~2014~larcier~463 p.~drain michel.

De dedup complete keys worden ook op een andere manier samengesteld voor monografische en seriële (tijdschriften én artikels) publicaties. Voor elk record worden dus meestal meerdere dedup complete keys opgemaakt en ook hier geldt dat wanneer twee (of meer) records 1 van die dedup complete keys delen, deze records tot 1 dedup groep worden samengesmolten.

Een volledig overzicht van alle partial keys en de manier waarop ze tot complete keys in elkaar worden gepuzzeld, is beschikbaar op volgende webpagina: Understanding the Dedup and FRBR processes.

Hoe krijg je als catalograaf zicht op wat FRBR/dedup met 'jouw' record zal doen?

FRBR en dedup zijn geen 'toverdozen'. Ze verwerken volgens logische principes de gegevens uit (Alma-)records en vergelijken deze met andere records. Het is ook mogelijk om in Alma al zicht te krijgen op:

  • de set van complete keys die voor een bepaald record wordt aangemaakt.
  • de vergelijking van de sets van 1 record met die van andere records.

Zo vind je antwoorden op de vragen of 'jouw' record in een FRBR- of dedup-groep is ondergebracht, welke andere records tot die groep behoren en op basis van welke gegevens ze werden samengebracht/samengesmolten.

De tool die we daarvoor gebruiken is de Dedup and FRBR Test Utility. Deze open je als volgt:

  • klik onderaan links het Alma scherm op Configuration.
  • klik nu in de linkermenubalk op Discovery.
  • klik in de lijst van functies onder Other op Dedup and FRBR Test Utility.

Deze tool neemt nu zowat het hele Alma-scherm in. Bovenaan zie je dat de tool is ingedeeld in twee tabs voor de twee verschillende manieren waarop je deze tool kan gebruiken.

Image Placeholder

Find matching records

Hier kan je het MMS ID van 1 record ingeven en vervolgens kijken of het record tot een FRBR- of dedup-groep behoort:

  • plak het MMS ID in het vakje achter Record ID. Dit mag zowel het MMS ID van het record in de Network Zone zijn (eindigend op 1471) als het MMS ID van het record in jouw Institution Zone.
  • kies of je de vergelijking wil zoeken naar matching records volgens de FRBR-regels of volgens dedup-principes.
  • klik op de knop Find matching records.
  • de tool toont nu eerst de set van complete keys die voor het record werden samengesteld. Vooral interessant zijn de kolom met de Description waarin de opbouw van elke key wordt getoond (welke metadata-elementen er in elke key worden opgenomen) en de kolom Key waarin dan de juiste samenstelling van die key voor het gezochte record wordt getoond.
  • als er andere records zijn die matchen met het record dat je zocht, worden deze onderaan opgelijst. Achter elk record is een ...-knop zichtbaar. Klik erop om ofwel een lijst te krijgen van de keys die beide records delen (View mutual keys) of van de hele key set van het record in kwestie (View keys).
Image Placeholder

Compare records

Dit deel van de tool laat toe om 2 records tegenover elkaar te zetten en de key sets nauwkeurig te vergelijken.

  • plak in de 2 vakken de MMS ID's van 2 records die je wil vergelijken. Ook hier kunnen NZ en IZ MMS gebruikt worden en zelfs door elkaar.
  • klik op Compare.
  • de key sets van beide records worden naast elkaar gezet. Groene vinkjes en rode kruisjes geven aan welke complete keys wel resp. niet met elkaar overeenkomen.
Image Placeholder

Opgelet: bij nieuwe records kan je deze tool pas gebruiken nadat het record voor een eerste keer definitief is opgeslagen (Save). Pas dan wordt het record in Alma geïndexeerd en worden de geïndexeerde metadata-elementen gebruikt om de key set op te bouwen en te vergelijken met de al aanwezige key sets. Het is dus niet mogelijk om tijdens het opstellen van een record al te 'proberen' of het record zal matchen of niet.

Hoe kunnen we de werking van FRBR en dedup aanpassen?

Er zijn twee manieren waarop we op niveau van configuratie de werking van de FRBR- en dedup-mechanismes kunnen aanpassen.

Ten eerste kan er gesleuteld worden aan de manier waarop de key sets worden opgebouwd: bestaande complete keys kunnen ge(des)activeerd worden en het is ook mogelijk om op basis van de partial keys nieuwe complete keys te laten opbouwen en deze toe te voegen aan de key set. De out-of-the-box configuratie van PrimoVE die wordt toegepast in Limo werd zoveel mogelijk aangepast om de werking van de FRBR- en dedup-processen te reproduceren zoals die bestond in Limo classic (op basis van Primo). Toch zijn er nog enkele verschillen zoals bv. het gebruik van tag 035 als een belangrijk element in het dedup-mechanisme. Deze werd niet gebruikt in Limo classic.

Verdere aanpassingen van deze configuratie zijn nog mogelijk maar moeten heel goed overwogen worden:

  • een aanpassing om een bepaald effect te bereiken (bv. dat bepaalde types records wel of niet deduppen) heeft vaak ongewenste neveneffecten op andere records.
  • een aanpassing in de configuratie heeft niet meteen effect in Limo: daarvoor moeten de betrokken records geherindexeerd worden en dit kan enkel manueel record per record (zie verder) of op aanvraag door Ex Libris worden gedaan.

Ten tweede is het mogelijk om regels te bepalen die het dedup- en/of FRBR-mechanisme voor bepaalde groepen van records uitschakelen. Op dit moment wordt dit systeem op twee manieren gebruikt:

  • voor records die oude drukken, handschriften, kaarten en grafisch materiaal (images) beschrijven is zowel het FRBR- als dedup-mechanisme onderdrukt. Deze records zullen dus steeds elk afzonderlijk op een Limo-zoekresultatenlijst verschijnen.
  • wanneer een catalograaf in het bibliografisch record de tag 900 $$a NO DEDUP toevoegt, dan zal het dedup-mechanisme niet ingrijpen op het record. FRBR werkt wel en het record kan dus wel in een een FRBR-groep op de zoekresultatenlijst terechtkomen [noot: dit mechanisme werkt omwille van technische problemen momenteel nog niet. Er wordt met Ex Libris naar een oplossing gezocht].

Hoe kan je als catalograaf de impact van dedup en/of FRBR op een specifiek record manipuleren?

Soms merk je in Limo op dat twee of meer records door het FRBR- of dedup-mechanisme worden samengebracht of samengesmolten (of juist niet) en heb je daar vragen bij. De FRBR and Dedup test utility helpt antwoorden en oplossingen te zoeken. Je werkt best steeds in drie stappen.

Analyse

Met de test utility kan je nagaan waarom 2 of meer records matchen (of juist niet) en de oorzaak achterhalen: gaat het om foutjes of onvolledigheden in de records, werkt FRBR/dedup hier zoals verwacht/gewenst? Verzamel allereerst de MMS ID's van de records die je wil vergelijken (tip: kopieer ze even naar bv. Notepad). Gebruik vervolgens de test utility om deze records naast elkaar te zetten. Vooral de Compare records-functie is daarbij erg handig. Wanneer twee records onverwacht niet matchen is het natuurlijk zoeken naar de verschillen tussen de key sets. Wanneer twee records onverwacht wel matchen, bekijk je vooral de complete keys die overeenkomen (groen vinkje).

Op basis van die vergelijking moet je beoordelen of het al dan niet groeperen door FRBR en dedup terecht of onterecht is.

FRBR en dedup-(niet)groepering is terecht wanneer:

  • alle betrokken bibliografische records volledig zijn ingevoerd. Let daarbij vooral op de tags 008, 035, 020, 022, 245, 264, 300, 1XX en 7XX. Dit zijn immers de velden die door FRBR en dedup worden gebruikt om de key sets op te bouwen.
  • de bibliografische records in Alma zijn correct volgens de regelgeving ingevoerd. Ze bevatten geen (tik)fouten en alle regels zijn toegepast. Heel belangrijk is bv. de correcte identificatie en invoer van een eventuele hoofdauteur in tag 100/110. Voor auteursnamen in het algemeen (100/110/700/710) geldt dat de invoer via authority control een grote hulp is om de consistente invoer (en dus de correcte werking van FRBR/dedup) te verzekeren.

Wanneer FRBR en dedup op basis van correcte gegevens key sets opbouwen die vervolgens al dan niet voor matches zorgen, wordt de werking van FRBR en dedup ook als correct beschouwd.

Omgekeerd wordt het ingrijpen van FRBR en dedup als niet-correct beschouwd wanneer dit gebeurt op basis van onvolledige records of records die fouten bevatten. Een speciaal aandachtspunt hierbij zijn documenten die zo weinig bibliografische informatie bevatten dat het quasi-onmogelijk is om voldoende rijke bibliografische records op te stellen (denk aan grijze literatuur met generiek titels, ontbreken van auteursnamen, publicatieplaats, -jaar en uitgever ...).

In dat laatste geval moet dus bekeken worden of we door aanpassingen aan de bibliografische records de werking van FRBR en/of dedup kunnen corrigeren.

Verbeteren en aanvullen of dedup blokkeren

Het grootste deel van onterechte (niet)-werking van FRBR en dedup kan opgelost worden door de bib records op punt te stellen:

  • kijk het record goed na en verbeter fouten.
  • vul ontbrekende bibliografische gegevens toe indien mogelijk.
  • vooral bij oudere records is het vaak nodig om het record 'in regel te stellen' met de huidige regelgeving. Dat geldt in het bijzonder voor het onderscheiden van een hoofdauteur in tag 100/110 én voor het aanpassen van auteursnamen naar de hoofdvorm van het authority record (dus tags 100/110/700/710 via F3 opzoeken in het authority bestand).

Opgelet: het is niet de bedoeling dat we de kar voor het paard gaan spannen en aanpassingen doorvoeren die ingaan tegen de regelgeving met het doel om FRBR/dedup te doen werken zoals we dat wensen/verwachten. Elk record wordt afzonderlijk opgesteld volgens de vastgelegde regels. Een voorbeeld: een oude editie van Consciences De leeuw van Vlaenderen zal niet in een FRBR-groep terechtkomen met een recente editie met licht anders gespelde titel De leeuw van Vlaanderen. Maar beide records zijn elk op zich correct opgesteld (de titel werd immmers volgens basisprincipe take what you see overgenomen uit beide edities) en dus beschouwen we de niet-groepering door FRBR als correct. 

Image Placeholder

In (zeer) uitzonderlijke gevallen kan een catalograaf beslissen om het dedup-mechanisme te blokkeren voor een specifiek record door in dat record de tag 900 $$a NO DEDUP in te voeren. Dat zal dan voornamelijk nodig zijn in de eerder genoemde bibliografische records voor documenten met zeer beperkte/generieke bibliografische gegevens. Dergelijke records worden soms onterecht in een FRBR- of dedup-groep opgenomen. Om aan collega's duidelijk te maken wat er aan de hand is, voeg je in 900 $$b ook een korte 'motivering' toe waarom de NO DEDUP-sleutel noodzakelijk was.

De FRBR/dedup-groepering voor een record herberekenen

Een of meerdere records verbeteren en aanvullen of zelfs een blokkerende 900 $$a NO DEDUP toevoegen is op zich niet genoeg om ook het beoogde effect te bereiken in Limo. FRBR- en dedup-groepen zijn immers heel 'hardnekkig' en het is daarom noodzakelijk om manueel de herberekening van deze groepen voor gewijzigde records op te starten. Ook hiervoor hebben we de FRBR and Dedup Test utility nodig.

  • zorg dat je het MMS ID van minstens één van de bewerkte records bij de hand hebt (bv. gekopieerd naar Notepad) en open de test utility.
  • plak het MMS ID op de tab Find matching records in het juiste vak en klik op de knop Recalculate FRBR and Dedup groups.
  • na een korte tijd wachten verschijnt de boodschap dat de job gestart is.
  • even later zal je bij een nieuwe test in de tool vaststellen dat de key set van het record is aangepast en dat ook de lijst van matching records aangepast is. Als alles correct verloopt zie je daar nu wel (of juist niet) de records waarmee het bewerkte record moet (of niet mag) matchen.
  • op de aanpassing in Limo is het soms nog even langer wachten maar ook deze zal na een tijd gelijk lopen met de resultaten van de test utility.

Samenvattend: tips voor catalografen

Om af te sluiten nog een aantal tips die catalografen kunnen gebruiken om bij het opstellen van nieuwe records ervoor te zorgen dat FRBR en dedup correct zullen werken. De meeste zijn vanzelfsprekend:

  • werk een record eerst zo volledig mogelijk uit voor je het een eerste keer definitief opslaat (Save). Op die manier zal de indexering en de indeling in FRBR- en dedup-groepen ook gebeuren op basis van het volledige record. De automatische bewaarfunctie in Alma zorgt ervoor dat ook voorlopig werk niet verloren gaat.
  • pas de regels die bepalen of er een hoofdauteur in 100 of 110 kan worden ingevoerd en - bij meerdere 'kandidaten' - hoe je beslist wie dat dan moet zijn, correct toe. De aanwezigheid van een main heading (een tag 1XX) weegt immers zwaar door in FRBR- en dedup-keys. Meer informatie: Personen en corporaties in 100/110 of 700/710?
  • voer auteursnamen in 1XX en 7XX-tags in onder authority control. Op die manier zorgen we ervoor dat in de bibliografische records steeds dezelfde naamsvorm (de hoofdvorm uit het authority record) wordt ingevoerd. Ook dat is natuurlijk essentieel voor de correcte werking van dedup en FRBR. Doe dit niet enkel bij records die je opstelt op basis van een template maar zeker ook bij records die je via copycat uit een externe catalogus in Alma opneemt.
  • Duplicate record is geweldig handig maar vraagt in deze context ook extra aandacht: denk er steeds aan om de 035-tags uit het gekopieerde record te verwijderen. Een ander punt waar het wel eens misgaat: vergeet niet om de datum van publicatie aan te passen, niet alleen in tag 264 $$c maar ook in tag 008. Het is immers die waarde die primair door dedup wordt gebruikt in de opbouw van de keys.
  • Bijzonder voor bibliotheken waar i.f.v. acquisitie gewerkt wordt met zogenaamde PRECAT-records: voorlopige bib records die worden aangemaakt om een nieuwe publicatie via Alma te kunnen bestellen. Deze PRECAT-records zijn vaak nog onvolledig en het is dus mogelijk dat de indeling in FRBR/dedup-groepen bij opslaan van dit voorlopige record niet helemaal juist gaat. Deze records worden dan na levering van de nieuwe aanwinst catalografisch op punt gesteld maar deze wijzigingen in het Alma-record triggeren dus niet automatisch een herberekening van de FRBR- en dedup-indeling. Het wordt daarom aangeraden om na de afwerking manueel een Recalculate op te starten: je kan het NZ MMS ID eenvoudig kopiëren uit de tag 001 en met enkele clicks de Test Utility opstarten, het MMS ID plakken en de knop Recalculate FRBR and dedup groups aanklikken.

Colofon

Laatst gewijzigd op 28.02.2023