Bedre søk på din egen nettside med Solr

Einar Ryvarden

Einar Ryvarden, digitalsjef, Tidsskrift for Den norske legeforening deler sine beste tips for et godt internt søk på nettsider.

Av Einar Ryvarden, digitalsjef, Tidsskrift for Den norske legeforening, Tlf: 98 21 66 65

Jeg deler utfordringene og valgene vi i Tidsskriftet for Den norske legeforening har gjort med søket på Tidsskriftet.no, bygget med søketeknologien Solr. Internsøk er komplisert å sette opp. Vi lærte følgende etter hvert som interne og eksterne brukere gav innspill på et nytt internsøk i 2020. testings

Hovedutfordringen er at forskjellige interne og eksterne brukere har veldig forskjellig forventninger og ønsker: Både ansatte, forskere, praktiserende leger, pasienter og pårørende privatpersoner bruker søker for å finne kunnskap på forskjellige måter. Innspillene man får spriker derfor i mange retninger. 

Mange forventer at søket fungerer som Google. Hvorfor kan jeg ikke som på Google bare få en liste med relevante treff? Vel, Google sorterer noen milliarder treff og har gjort noen valg de også, det er bare ikke så lett å se dem. Ansatte leter kanskje om artikler de vet skal finnes eller mener burde komme opp på et søk, men på Google vet du ikke hva som blir utelatt. Og Google presenterer mange veldig gamle lenker.

Her er innstillingene vi har valgt.

  • Vi bruker ikke Solr-funksjonen stemming. Vi fant ut at stemming gav for mange uønskede treff, særlig med korte ord. Søkte man på «ord» fikk man artikler med «orden» og «ordfører». Ulempen er at et søk på «hjerte» ikke viser artikler hvor bare ordet «hjerter» forekommer. 
  1. Vi serverer i utgangspunktet treffene kronologisk, men man kan velge relevans. Vi tror kronologisk er viktigst når vi bare har 40.000 artikler. Og vi synes Google serverer for mye gammelt innhold.
  2. Vi gir brukerne en del valg rundt søket, f eks. søk bare i titler og ingresser/første avsnitt, velg år, forfatter og artikkeltype. Men putter man på for mange valg, blir det forvirrende og tar for mye plass på mobil.
  3. Tidsskriftet er et vitenskapelig publikasjon der artikler har referanser, men vi har ekskludert referansene i artiklene fra søket, både fordi de gir mange lite relevante treff og de ligger på bunnen av artiklene. Så vurder om det er noen faste biter av sidene dine du ikke vil skal være med i søket.
  4. Man kan også gjøre boosting (øke relevansen på utvalgte sider), legg til synonymer (søk etter ordet X viser også artikler med ordet Y), men ikke noe vi ser noe behov for. Kan være riktig for andre, særlig innen netthandel.
  5. Vi holder på med å få på plass Facets og Suggester, to Solr-funksjoner. Fasetter (Facets) gir navigering og sortering av søkeresultatene i stikkord du kan klikke på. På Tidsskriftet.no vil søkeresultatene øverst få en rad med artikkeltypene (fks. kommentar) og antall treff innen dem. Et klikk på "Kommentar" vil begrense søketreff-listen til Kommentar-artikler. Suggester gir som på Google en liste over søkeforslag mens du skriver inn det du vil søke etter. 

I tillegg er testing/kvalitetssikring av søk tidskrevende. Man må teste alle opsjoner, f.eks. et ord, flere ord, kombinasjoner og andre funksjoner som bare søk i titler. Det er komplisert å sjekke om alle riktige sider med i treffene og om man har fått servert falske treff. Ofte må man sammenligne med Google eller liste-sider og de kan ha feil. 

Så gjør noe valg, sjekk søketrafikken og bestem deg for hvor mye tid du skal bruke på internsøket.

Ønsker du å vite mer om muligheter for å lage et bedre søk på dine nettsider, enten med Drupals interne søk eller Solr. Ta kontakt med Stephan Zeidler for mer informasjon.

Latest news

Test intro

Vi er på jakt etter deg som liker både folk og teknologi, men ikke nødvendigvis har noen teknologiutdanning. 

Yngve W. Bergheim
Yngve W. Bergheim

let's get on with what Drupal 10 brings, a host of new features and improvements, making it the most powerful and flexible version of Drupal yet and how we can help you get there.

Sohail Lajevardi
Sohail Lajevardi