Boost og ranking

Er der nogen, der kan henvise til sider, hvor man kan læse noget grundlæggende omkring boost og ranking i forhold til søgeresultater i bibliotekets base?

Vi er i gang med at implementere vores nye hjemmeside, men vi er ikke helt tilfredse med søgeresultaterne, når der søges i basen.

 

Trine Vandsted

Slagelse Bibliotekerne

Grupper:

Kommentarer

Search result boost

 

Boost anvendes til at definere vægtningen af udvalgte felter.

Når brugerens søgeterm matcher med et felt med en defineret vægt (fx forfatter) vil det afspejles i søgeresultatet ved at poster, hvor søgetermen findes i forfatterfeltet, vises først.

F. eks. forfatter + rowling + boost = bedre rankering til materialer hvor forfatteren hedder rowling

  1. Log ind som Drupal lokaladministrator

  2. Åben Configuration

    [Hjemmesidens adresse]/admin/config

  3. Åben Search result boost

    [Hjemmesidens adresse]/admin/config/boost

  4. Vælg Field name

    Field name dækker over et udvalg af de facetgruppe du er vant til at se i facetbrowseren i søgeresultatet fra brønden.

    1. Kilde, Forfatter, Year of publish, Sprog, Material type, ISBN number, 

  5. Indtast Value
    Value angives forskelligt alt efter hvilken Field name du vælger og hvilke kilder der er aktiveret. Du kan finde alle values for det valgte Field name ved at foretage en *=* søgning på hjemmesiden og se hvilke facetter der findes i den facetgruppe der svarer til det valgte Field name.

    1. [Hjemmesidens adresse]da/search/ting/%2A%3D%2A

    2. Tryk på linket “Vis flere” under den facetgruppe du ønsker at se facetværdierne for.

    3. F. eks. under facetgruppen kilder hvor du kan se bla. Bibliotekets materialer eller Ebrary

  6.  Indtast Weight
    Ved Search result boost skal Weight typisk sættes omkring 50 for at give en synlig effekt, men man er nødt til at prøve sig frem til man opnår den ønskede effekt og teste eventuelle sideeffekter på forskellige materialer.

    1. Tryk på knappen ”Add another boost value” hvis du ønsker at booste flere Field names.

    2. Tryk på knappen ”Save changes” nederst på siden for at gemme de nye boost værdier.

    3. Foretag en søgning og se effekten i søgeresultatet.

Sådan ser du hvorfor søgeresultatet rankeres som det gør

  1. Vælg den opensearch version I benytter på biblioteket under http://opensearch.addi.dk/

  2. Indtast følgende med kopier/indsæt, skift værdierne for query, agency og profile og foretag de ændringer du ønker i boost og rankering:

    <?xml version="1.0" encoding="UTF-8"?>
    <SOAP-ENV:Envelope xmlns:SOAP-ENV="http://schemas.xmlsoap.org/soap/envelope/" xmlns:ns1="http://oss.dbc.dk/ns/opensearch"><SOAP-ENV:Body> <ns1:searchRequest>
     <ns1:query>*** SØGNING ***</ns1:query>
     <ns1:agency>*** AGENCYNUMMER ***</ns1:agency>
     <ns1:profile>*** BRØNDPROFIL ***</ns1:profile>  <ns1:collectionType>manifestation</ns1:collectionType>
     <ns1:start>1</ns1:start>
     <ns1:stepValue>10</ns1:stepValue>
     <ns1:userDefinedBoost>
      <ns1:userDefinedRanking>
       <ns1:tieValue>0.1</ns1:tieValue>
        <ns1:rankField>
         <ns1:fieldName>dc.title</ns1:fieldName>
         <ns1:fieldType>word</ns1:fieldType>
         <ns1:weight>4</ns1:weight>
        </ns1:rankField>
        <ns1:rankField>
         <ns1:fieldName>dc.title</ns1:fieldName>
         <ns1:fieldType>phrase</ns1:fieldType>
         <ns1:weight>8</ns1:weight>
        </ns1:rankField>
      </ns1:userDefinedRanking>
      <ns1:boostField>
       <ns1:fieldName>dc.type</ns1:fieldName>
       <ns1:fieldValue>cd</ns1:fieldValue>
       <ns1:weight>20</ns1:weight>
      </ns1:boostField>
     </ns1:userDefinedBoost>
    <queryDebug>true</queryDebug>
    </ns1:searchRequest>
    </SOAP-ENV:Body></SOAP-ENV:Envelope>

  1. Tilpas felterne så det matcher din aktuelle konfiguration

    1. *** AGENCYNUMMER *** = biblioteksnummer

    2. *** BRØNDPROFIL *** = Brøndprofil som du finder i VIP basen. (Typisk = "opac")

  2. Tryk på knappen “Try me”

  3. Du kan nu for hver post i resultatet se <queryResultExplanation> hvor du kan læse hvilke værdier de enkelte felter tildeles ud fra den aktuelle rankering.

Search result ranking

 

Når brugerens søgetermer matcher de Field names, der er sat rankering op for, påvirkes søgeresultatet i forhold til hvor høj en værdi der er indsat i weight for de pågældende Field names (fx forfatter el. titel).

F. eks. Forfatter + Boost = bedre rankering til materialer hvor brugerens søgning matcher forfatter feltet.

  1. Log ind som Drupal lokaladministrator

  2. Åben Configuration

    [Hjemmesidens adresse]/admin/config

  3. Åben Search result boost

    [Hjemmesidens adresse]admin/config/ranking

  4. Vælg Word eller Phrase

    Word = Enkeltordsindeks Phrase = Fraseindeks

a. Der skal sættes rankering op for begge for at opnå den ønskede effekt.

  1. Vælg Field name

    Field name dækker over de facetgrupper som du ser i facetbrowseren i søgeresultatet for brønden.

  2. Indtast Weight
    Search result ranking giver mulighed for et antal forud definerede værdier fra 1-10 hvor 1 er den laveste og 10 er den højeste vægt man kan give. Man er nødt til at prøve sig frem til man opnår den ønskede effekt og teste eventuelle sideeffekter på forskellige materialer.

  1. Tryk på knappen ”Add another ranking field” hvis du ønsker at føje rankering på flere Field names.

  2. Tryk på knappen ”Save changes” nederst på siden for at gemme de nye værdier for rankering. Foretag en søgning og se effekten i søgeresultatet.

Sådan ser du hvorfor søgeresultatet rankeres som det gør

  1. Vælg den opensearch version I benytter på biblioteket under http://opensearch.addi.dk/

  2. Indtast følgende med kopier/indsæt:

    <?xml version="1.0" encoding="UTF-8"?>
    <SOAP-ENV:Envelope xmlns:SOAP-ENV="http://schemas.xmlsoap.org/soap/envelope/" xmlns:ns1="http://oss.dbc.dk/ns/opensearch"><SOAP-ENV:Body> <ns1:searchRequest>

    <ns1:query>*** SØGNING ***</ns1:query>
    <ns1:agency>*** AGENCYNUMMER ***</ns1:agency>
    <ns1:profile>*** BRØNDPROFIL ***</ns1:profile>
    <ns1:collectionType>manifestation</ns1:collectionType>
    <ns1:start>1</ns1:start>
    <ns1:stepValue>10</ns1:stepValue>
    <ns1:userDefinedBoost>
     <ns1:userDefinedRanking>
      <ns1:tieValue>0.1</ns1:tieValue>
      <ns1:rankField>
       <ns1:fieldName>dc.title</ns1:fieldName>
       <ns1:fieldType>word</ns1:fieldType>
       <ns1:weight>4</ns1:weight>
      </ns1:rankField>
      <ns1:rankField>
       <ns1:fieldName>dc.title</ns1:fieldName>
       <ns1:fieldType>phrase</ns1:fieldType>
       <ns1:weight>8</ns1:weight>
      </ns1:rankField>
     </ns1:userDefinedRanking>
    </ns1:userDefinedBoost>

<queryDebug>true</queryDebug> </ns1:searchRequest> </SOAP-ENV:Body></SOAP-ENV:Envelope>

  1. Tilpas felterne så det matcher din aktuelle konfiguration

    1. *** SØGNING *** = den søgning du gerne vil teste

    2. *** AGENCYNUMMER *** = biblioteksnummer

    3. *** BRØNDPROFIL *** = Brøndprofil som du finder i VIP basen. (Typisk = "opac")

  2. Tryk på knappen “Try me”

  3. Du kan nu for hver post i resultatet se <queryResultExplanation> hvor du kan læse hvilke værdier de enkelte felter tildeles ud fra den aktuelle rankering.

Test test test

Der er ikke nogen endelig formular på rankering, men rankering og boost er værktøjerne der gør at I kan foretage lokale tilpasninger.

Tænk jer rigtig godt om og test grundigt med mange forskellige materialetyper og kilder!

En ændring der foretages for at booste en materialetyper kan helt fjerne en anden fra søgeresultatet.

NB. rankering kan kun boostes positivt og ikke negativt.

Du kan også finde vejledning

Du kan også finde vejledning i easy.T!NGs Yammer netværk:

https://www.yammer.com/easyting/notes/296214
https://www.yammer.com/easyting/notes/296212

Men som Rolf så fint siger, skru lidt på de forskellige parametre og test jer frem til de indstillinger som passer jer :)

Rankering

Se endvidere DBC´s wiki om rankering i Open Search:

http://oss.dbc.dk/wiki/bin/view/Databroend/OpenSearchDocRanking

Materialetype cd+bog

Kan det passe at der mangler en materialetype i Brønden på cd+bog?

Når jeg sørger på titlerne i vores katalog, så kommer de med materialetype:undefined, men hvis jeg sørger dem i bibliotek.dk

kommer de med materialetype cd+bog.

 

Eks: Jørn Jensen: den sorte gravsted

 

Trine Vandsted

Slagelse Bibliotekerne

Materialetype

Vi (DBC) er på trapperne med en ændring i vores dannelse af poster til brønden, således at vi får udryddet materialetypen "undefined" og samtidig gerne skulle få mere korrekte materialetypebetegnelser. 

Vi er på nippet til at opdatere i drift - men ændringen slår kun igennem for de poster der efterfølgende sendes til brønden, og ikke dem der ligger der i forvejen (med mindre man gensender posten).

Med venlig hilsen

Linda Schwartz Karlsen
DBC

Materialetype

Nu er vores script der danner materialetype (dc:type) opdateret i drift. Det betyder, at poster sendt fra nu af, gerne skulle få mere præcise materialetypebetegnelser.

På denne side tilføjer vi når der sker ændringer i konverteringerne af poster: http://oss.dbc.dk/wiki/bin/view/Databroend/DkabmKonverteringsAendringer

/Linda

Comment viewing options

Select your preferred way to display the comments and click "Save settings" to activate your changes.