23 feb2009

Eduhub’s ontstaan: Informatie Architectuur van een vergelijkingssite

  • reageren (16)
  • bookmark
  • e-mail
  • afdrukken
X
X
  • Plaatsen/stemmen op NUjij
  • Geef kudos

Er gebeurt vrij veel in mijn online marketing leventje, maar zoals je merkt helaas even niet op Usarchy. De reden zal voor veel lezers zo onderhand bekend zijn. Nu is het tijd mijn twee kinderen weer eens samen te laten spelen in deze serie over het onstaan van Eduhub.

We kijken naar een cruciale stap in het ontwerp van elke website: de structurering van de informatie, oftewel de Informatie Architectuur (IA). Deze stap komt na het bepalen van het concept en de doelgroep, en voor het interactie ontwerp, visueel ontwerp en het daadwerkelijk bouwen van de website.

Informatie architectuur als je niet zelf de inhoud bepaalt…

IA is een vakgebied dat qua aandacht en professionaliteit enorm is gegroeid de laatste jaren, in het kielzog van usability en het gegenwoordig hippere “user experience” in het algemeen. Er zijn steeds grotere conferenties op het gebied. En er is al jaren een “IA (tegenwoordig UX) cocktail hour” in Amsterdam, waar informatie architecten samenkomen om ervaringen te delen.

IA gaat gaat simpel gezegd om het logisch structureren en “labelen” (naamgeven) van informatie. Zoals een architect het fundament en de bouwtekeningen maakt, maakt de informatie architect de structuur die een website nodig heeft om niet in te storten op het moment dat hij gebouwd, gevuld en gebruikt moet worden. De bekendste “deliverable” van IA is een sitemap waarin je alle onderdelen van een website in relatie tot elkaar weergeeft. Ik raad van harte de weblogs van Ferry den Dopper, Peter Boersma, Peter Morville en Boxes & Arrows aan als je meer over IA wilt lezen. Verder is het goed om te realiseren dat IA een enorme invloed op zoekmachine optimalisatie heeft, waardoor je in dit stadium al gedwongen wordt zowel voor de gebruiker als voor Google te denken.  

Voor een vergelijkingssite als Eduhub is IA een grote uitdaging. Dat komt doordat de eigenaar van de site niet de eigenaar van de informatie is; de trainingen, cursussen en opleidingen worden immers door de aanbieders ervan aangeleverd. Nog erger: wij zijn geen experts op alle gebieden waarin wij opleidingen zullen tonen. Tegelijk zijn wij natuurlijk wel experts op zoekmachine optimalisatie en usabilitygebied, en daar snappen de aanbieders weer minder van.

De oplossing? Een combinatie van een rigide categorisering met daarbinnen een soort Folksonomy van onderwerpen. Huh?! Geen nood, ik leg het uit…

Eerste niveau: Categorieën

Homepage met daarop alle categorieën en slechts de belangrijkste onderwerpen.

Op Eduhub staan inmiddels 21 categorieën, ze zijn sinds het originele ontwerp een paar keer aangepast. Ze zijn voor een groot deel gebaseerd op zoekvolume in Google. Ik heb de categorieën van onze concullega’s op een rij gezet, en de conclusie was vrij snel dat die niet aansloot bij het zoekgedrag van internetgebruikers zoals je dat d.m.v. bijvoorbeeld Google Trends en Google’s Keyword Tool kunt zien. Verder heb ik nog naar een aantal werkgerelateerde sites gekeken, omdat werkende mensen voor Eduhub de belangrijkste doelgroep is. 

Tweede, derde, vierde niveau: Onderwerpen

Keuze van de hoofdcategorieën is dus relatief simpel. Maar wat onder elke categorie moet vallen is een stuk ingewikkelder. Hoort het onderwerp “online marketing” bij “Marketing” of bij “Internet & Media”? En is het eigenlijk wel “online marketing”, en niet “internetmarketing” of “digitale marketing”? Of zijn dat weer andere dingen?

En dat zijn dan nog onderwerpen waar ik toevallig zelf wat vanaf weet. Als het over Logistiek, Financiën of Zorg gaat kan ik inhoudelijk geen enkele beslissing nemen. Hierbij moeten de aanbieders, de inhoudelijke deskundigen, ons dus helpen. Maar als je iedereen zijn eigen onderwerpen laat kiezen, wordt het natuurlijk een zooitje. Het is wel de bedoeling dat de gebruiker van de website straks bij elk onderwerp ook echt een goed overzicht krijgt van wat daarbinnen valt. De oplossing die we uiteindelijk hebben gekozen is het beste in stappen te omschrijven. Ik noemde het al een Folksonomy; dat is een Taxonomie waarbij de gebruikers zelf de structuur bepalen. Vaak wordt dit geassocieerd met tagging systemen waar Flickr en Delicious op gebaseerd zijn.

  1. Voor zover mogelijk maakt Eduhub binnen een categorie een kleine lijst met onderwerpen aan, vooral gebaseerd op Google’s keyword tools. Simpelweg “logistieke opleiding” intikken geeft je al een aantal veelgezochte gerelateerde onderwerpen die je kunt gebruiken. Natuurlijk kijken we hierbij ook naar de sites van gespecialiseerde  aanbieders, die ook al een indeling hebben.N.B.: we begonnen hierdoor met ongeveer 150 onderwerpen binnen de 21 categorieën.
     
  2. De aanbieder die zijn training op Eduhub invoert, kiest 1 categorie om de training in te plaatsen. Dit is een harde restrictie, want veel trainingen passen in meerdere categorieen. De aanbieder wordt zo gedwongen echt de meest relevante te kiezen.Als Eduhub groot genoeg is, levert dit voor de gebruiker de beste resultaten. Bij een kleine site werkt dit niet goed, want er zullen niet veel trainingen vindbaar zijn in elke categorie. Dit betekent weer dat het business model (kosteloze plaatsing) belangrijk is: anders kun je nooit groot genoeg worden om overal echt relevante trainingen aan te bieden. 
     
  3. De aanbieder kiest per training 1 of meer onderwerpen binnen die categorie, maar wordt aangemoedigd er niet teveel te kiezen. Dit doen we door trainingen met meer onderwerpen op elk onderwerp een lagere relevantie waarde te geven dan trainingen met bijv. 1 onderwerp. Dit komt tot uiting in de zoekresultaten en lijsten op Eduhub. Hieronder zie je de onderwerp kiezer in de Eduhub Admin: 
     
  4. Categorie pagina met daarop alleen de belangrijkste onderwerpen.

    Categorie pagina met daarop alleen de belangrijkste onderwerpen.

    De aanbieder kan nieuwe onderwerpen aandragen die in de regel direct op Eduhub worden toegevoegd. Alleen als het een duplicaat is of als er in Google maar een tiental zoekresultaten voor zijn, wordt een onderwerp geweigerd.
     

  5. Bij een training is elk onderwerp dat is gekoppeld, zichtbaar. Maar niet elk onderwerp is ook een link naar een onderwerpspagina. Dit is belangrijk voor de zoekmachine optimalisatie, want een onderwerpspagina met maar 1 training heeft weinig waarde en haalt daarmee de linkwaarde tussen de gekoppelde pagina’s omlaag.
     
  6. Pas wanneer een onderwerp door 3 verschillende aanbieders is gekozen, wordt het onderwerp gelinked op Eduhub. Het is dan nog niet zichtbaar op de categorie overzichten, maar het wordt wel gelinked vanaf elke training. Hierdoor wordt het vindbaar voor Google, en natuurlijk voor gebruikers die de training bekijken en meer gerelateerde trainingen willen zien.
     
  7. Pas wanneer er veel gezocht wordt op een onderwerp (zowel in Google als op Eduhub) wordt het getoond op de categorie pagina. Dit voorkomt dat de gebruiker (en ook weer Google) overladen wordt met niet veel van elkaar verschillende onderwerpen. Echt belangrijke onderwerpen worden ook op de homepage getoond. Belangrijk betekent daar vooral dat er veel zoekvolume op zit. We maken dan alleen kans maken goed te scoren in Google als het onderwerp ook vanaf de sterkste pagina (met de hoogste autoriteit) wordt gelinkt. Hier maken we dan ook regelmatig aanpassingen in, vooral op basis van de verdiensten per onderwerp. Als een onderwerp wel veel zoekvolume heeft maar ons weinig oplevert, zullen we hem natuurlijk ook niet plaatsen.

De voordelen van dit systeem

Wat zijn nu de concrete voordelen van deze manier van indelen boven het bijvoorbeeld zelf bepalen, of helemaal vrij laten van de indeling?

  • De aanbieders voelen zich “in control” over hoe hun trainingen worden weergegeven. Dit is een van de belangrijkste factoren, want bepalend voor de usability van Eduhub als systeem en daarmee voor de goede band die we met aanbieders hebben. Die band is hard nodig om de compleetheid van ons aanbod, en daarmee de band met de gebruikers, te waarborgen.
  • Eduhub blijft altijd in control door de laatste hand te hebben in plaatsing en toewijzing. We hebben hiermee bovendien genoeg mogelijkheden om nuances aan te brengen in de presentatie van een onderwerp zonder dat er echt veel redactioneel handwerk bij komt kijken.
  • Onderwerpen blijven dynamisch (dus up to date) doordat aanbieders, wanneer er een nieuwe training of nieuwe ontwikkeling in het vakgebied is, nieuwe onderwerpen zullen toevoegen. 
  • Specialistische onderwerpen maken de site geen rommeltje. Onderwerpen die maar voor een kleine groep gebruikers interessant zijn, zijn vindbaar via Google, via onze zoekmachine en via trainingen over dat onderwerp. Deze “kleine” onderwerpen verstikken de website echter niet door op hetzelfde niveau zichtbaar te zijn als “grote” onderwerpen die vaker gezocht worden.

Het nadeel van dit systeem

De huidige onderwerpkiezer in de Eduhub Admin.

De huidige onderwerpkiezer in de Eduhub Admin.

Het grootste nadeel is de beheersbaarheid voor de aanbieders die de onderwerpen kiezen. Vooral voor nieuwe aanbieders is het moeilijk om snel te doorgronden welke onderwerpen er zijn en in welke categorie ze zitten. Daardoor is het voor ons weer veel werk om onhandig gekozen onderwerpen te corrigeren. We checken elke training voordat hij gepubliceerd wordt. Best een klus, want we zitten tegen de 8000 trainingen. Maar dit soort handwerk maakt het verschil tussen een goede en slechte informatie architectuur, en daarmee een usable of niet-usable site…

 

Om dit keuzeprobleem op te lossen wordt binnenkort een “suggest” feature in de onderwerpkiezer ingebouwd. Je kunt dan een paar letters ingeven die je zoekt, en terwijl je tikt verschijnen de eventueel relevante onderwerpen. Hopelijk maakt dit het wat makkelijker om de juiste uit alle onderwerpen te kiezen.

Het resultaat?

Dit systeem heeft tot nu toe geleid tot 1011 onderwerpen. Daarvan zijn er zo’n 800 gelinked vanaf de trainingspagina’s. Op de categorie pagina’s zijn er 393 zichtbaar. Binnenkort hebben we de mogelijkheid om onderwerpen onderling ook aan elkaar te linken, zodat we een soort 3e, 4e en … informatielaag kunnen creeëren van “sub”-onderwerpen die technisch gezien wel op hetzelfde niveau staan als andere onderwerpen, maar voor de gebruiker niet op het hogere niveau zichtbaar zijn. 

Categorie indeling die samen met mediapartner Logistiek.nl wordt bedacht.

Categorie indeling die samen met mediapartner Logistiek.nl wordt bedacht.

Uiteraard zit er ook nog veel extra handwerk en overleg in de keuze van onderwerpen. Hierover praat ik regelmatig met aanbieders, om ideeën op te doen en hun (vaak verschillende wensen) in lijn te brengen met het zoekgedrag van gebruikers. Andere belangrijke inpiut komt van onze mediapartners. Van de deskundige redactie van Logistiek.nl kregen we tips voor herindeling van onze logistieke onderwerpen, die zij ook weer gebruiken om onze content op hun website weer te geven. En met de mensen op Frankwaching kunnen we sparren over de beste indeling van Media, Marketing en Communicatie gerelateerde onderwerpen.

 

Ik hoop dat dit je wat inzicht en wellicht inspiratie geeft voor hoe je de structuur van een website kunt inrichten. Voor mij is de belangrijkste les dat je er in ieder geval rekening mee moet houden dat je de indeling continu kunt aanpassen. Ik hoor graag je feedback, vragen of natuurlijk suggesties ter verbetering van ons systeem!

Popularity: 62% [?]

Reacties (16)

Reageren
  • Hoi Ruben,

    Interessante weergave van wat er zoal komt kijken bij IA (ook goed dat je de link legt naar het business model en de invloed die dat kan hebben op je structuur, IA is letterlijk de basis) en vrij gedurfd dat je zo transparant bent over de weg naar launch van EduHub.

    Werd net echter ruw uit jouw relaas gerukt door het ontbreken van de tekst bij Punt 7:

    “…overladen wordt met niet veel van elkaar verschillende onderwerpen. Echt belangrijke onderwerpen worden”

    …en dan blijft het gissen naar wat je ons wilt vertellen, so bij deze: wat doe je met de echt belangrijke onderwerpen ;) ?

  • Ha, thanks voor de tip Anibal, het is aangevuld. Laat dat dan maar een bewijs zijn van hoe goed het met Eduhub gaat en hoe druk ik het heb ;)

  • @Ruben We’ll leave it at that ;)

  • Hey Ruben,

    Alles goed in Zwitserland?

    Interessant verhaal, heb vorige week een aantal uur op Eduhub doorgebracht en merkte al op dat in sommige categorieën opleidingen/cursussen staan die er niet horen. Zie:

    http://www.springest.nl/arbo-veiligheid/arbo

    Waar (in de algemene Arbo categorie binnen Arbo & Veiligheid) MVK, VCA VOL, Preventiemedewerker en HVK cursussen in staan, deze lijken te horen onder de “exact matches”  voor de categorieën.

    Het is dus inderdaad lastig om klanten zelf de geschikte categorie uit te laten kiezen. De medewerkers die de opleidingen aanmelden, lijken dus meerdere “relevante onderwerpen” toe te voegen..

    Is het technisch niet mogelijk om de titel en tekst binnen een cursus te scannen op keywords en bij onregelmatigheden te melden aan jou, de moderator?

  • Hey Lodewijk,

    Dat die trainingen daar staan is niet per se verkeerd, ze gaan tenslotte ook over “Arbo”, dat is nou eenmaal een breed onderwerp. Je suggestie zou onmogelijke hoeveelheden werk opleveren, al zouden we wel het maximaal aantal onderwerpen op 1 kunnen zetten.
    Echter, de trainingen zijn ook allemaal binnen die specifieke (MVK, VCA) onderwerpen te vinden, dus voor de gebruikers is het geen probleem. Wat we uiteraard wel doen, is trainngen rangschikken binnen het onderwerp op relevantie. Je zult een pure VCA cursus dus nooit bovenaan aantreffen bij Arbo.
    De trainingen die ook Arbo als onderwerp hebben, naast een specifieker onderwerp, zullen bij het specifieke onderwerp ook lager gaan scoren. Zo worden op langere termijn aanbieders vanzelf gedwongen / ontmoedigd om “verkeerde” onderwerpen te kiezen :) 
    En als het inderdaad een specifieke training is relatief veel aandacht voor een algemener onderwerp, moeten we ervoor zorgen dat de gebruiker daar straks ook op kan zoeken / filteren. Dat is wellicht niet eens heel moeilijk, door gewoon een filter te maken waar je op “trainingen met ook dit onderwerp” kunt filteren. Makes sense? :o

  • Eens, maar in dit geval betekent het dat de MVK cursus van Copla niet gevonden wordt in de MVK categorie. Klanten die op zoek zijn naar een MVK cursus vinden die van Copla dus alleen in de algemene Arbo categorie. De HVK cursus staat ook in de HVK categorie, echter staat hier ook weer de MVK cursus van Copla: http://www.eduhub.nl/arbo-veiligheid/hvk

  • Hey, dat is inderdaad wel een fout, die MVK van Copla moet natuurlijk wel in MVK staan… Heb hem meteen even gekoppeld :)

    Ik moet zeggen dat we, behalve handwerk, nog geen goed systeem hebben om dit op te lossen. Wat we nu sporadisch doen is eigenlijk wat jij ook doet; kijken of er geen betere onderwerpen voor een training zijn. Dat moeten we gaan automatiseren want ik denk dat er van die 8000 zo 2000 zijn die op die manier beter vindbaar gemaakt kunnen worden.

  • Hoi Ruben, mooie IA en SEO aanpak! En goed weer wat van je te lezen! Het brengt mij weer op de gedachte vaker over IA in cases te schrijven.

  • Even kort door de bocht… Fijn je weet te lezen. Goed voor inspiratie en enthousiasme :) Wie geht’s in die Schweiz? Schone Grusse Anouk

  • Hee Ruben,

    Met BoeZoe (http://www.boezoe.nl) zijn we met een vergelijkbare excersitie bezig geweest voor de kinderkleding verzamelsite. Die indeling is een stuk makkelijker en met de feedback die we nu gekregen hebben, zijn we nu aanpassingen in de selectieboxen aan het maken (bijv multiselect).

    Uit nieuwsgierigheid (en omdat het ‘m’n business’ is), hoe doen jullie je search? Wil je nog search filters op meta data toevoegen en hoe houden jullie de performance goed (8000 trainingen is al flink wat, maar ik neem aan dat je naar vele malen dat aantal wilt groeien)?

    Groet,
    Maarten

  • Maarten: filtering komt er een dezer dagen in, het draait al goed op de testserver, we zijn nog wat performance tweaks aan’t doen. We gebruiken als technisch framework CakePHP, en als zoekmachine Sphinx, die genereert ook de onderwerpspagina’s waardoor performance goed blijft. Ik wil zelf liefst dat elke pagina binnen 2 sec compleet geladen is, we testen dit continu met o.a. Pingdom.com).

    Let me know als je meer info wilt :)
  • Interessant artikel + comments!

    Zou goed als meer ‘startups’ inzage zouden geven in het hoe&wat… als ze nog tijd overhebben dan ;)

  • Ruben, als je wat feedback van me wilt op de zoekervaring zoals je die aan het testen bent, laat maar weten (altijd leuk om te doen).

    Als je je performance eisen hoog stelt, is mijn ervaring dat frameworks (zoals CakePHP of Joomla e.d.) niet de meest geschikte oplossingen zijn, maar juist de volledig custom development om te zware code voor de website te krijgen (dergelijke omgevingen hebben nu eenmaal meer overhead omdat ze meer flexibel ingezet moeten kunnen worden).

    Sphinx is  goede keuze, als je de laatste rc 099 gebruikt tenminste (werkt ook goed met de MVA).

    Ik heb zelf ook veel gebruik gemaakt van Jblitzpro50 om loadtests te doen (we halen op een single server nu 50 QPS).

  • […] den Dopper van Tam Tam 10 maart 2009 – 12:00 Ruben Timmerman lichtte onlangs het informatieontwerp van Eduhub toe. Een mooie case study, die navolging verdient. Daarom nu een kijkje in de keuken van het […]

  • Ruben,

    Het ontwikkelen van de informatie structuur voor een website waarbij vele onderwerpen moeten worden gecategoriseerd is natuurlijk altijd een mooie uitdaging.  

    Je vraagt de gebruiker een keus te maken op grond van een scenario, die je ongetwijfeld hebt uitgewerkt. Ga met gebruikers in gesprek (card-sorting etc.)

    Aan de andere kant hebben we de aanbieders van de cursussen/workshops. Vaak weten zij niet hoe een onderwerp in te delen. Door een veelfout aan keuzes wordt het ze niet makkelijker gemaakt. 

    Goed om door onderzoek enkele categorieën op niveaus vast te leggen. Zo maak je het de aanbieder eenvoudiger (verminder keuzestress). 

    Je zou ook suggesties kunnen voorleggen aan de hand van de titel en eventueel andere vragen die de aanbieder dient in te vullen, zodat je de keuze beperkt. Naderhand kun je een suggestie (die je zelf bepaalt o.a. aan de hand van zoekvolume) doen voor een categorienaam.  

    Wat ik als gebruiker nog mis is een uitgebreide zoekfunctie op basis van interesses e.d.

    Succes!

    Michèl

  • Rooseboom: thanks voor de tip. Pas wel op dat je CakePHP niet gelijk stelt aan Joomla!, want dat zijn heel andere niveaus (denk eigenlijk niet dat je Joomla! een framework kan noemen). Cake’s performance zal nooit zo snel zijn als wanneer je iets van scratch bouwt, maar je winst is veel groter aan de ontwikkelkostenkant dan je verlies in performance.

    Sphinx gebruiken we inderdaad die versie of wellicht al wat nieuwer, niet mijn pakkie an :) Maar draait als een zonnetje, inclusief filters.

    Ik meet performance gewoon in seconden voor complete pagina requests, d.m.v. Pingdom’s full page test. Als dat onder de 2 sec blijft voor alle templates op alle tijdstippen ben ik happy.

    Michel: Suggesties willen we inderdaad gaan geven. Een eerste stap in die richting is een ajax suggest ding waarmee je door enkele letters in te tikken direct kunt filteren in de onderwerpen. Dit gebruiken we nu al intern.

    Een “uitgebreide zoekfunctie op basis van interesses”… Klinkt interessant, maar ga eens eens een stap verder en probeer uit te werken wat interesses zijn, hoe je ze kunt structureren en hoe je daar een interface voor maakt?

    Tot nu toe is heel Eduhub eigenlijk gestructureerd rond “interesses” zou ik zeggen, maar wellicht bedoel je wat anders. Iets wat we wellicht ooit toevoegen is competenties, dat is nog redelijk “te doen” denk ik. Daarnaast komen er tzt filters voor branche/sector en voor functiegroepen.

Reageer

(zal niet zichtbaar zijn)