10 apr2007

Domeinnaam met of zonder www: 301, 302,… 404?

  • reageren (37)
  • bookmark
  • e-mail
  • afdrukken
X
X
  • Plaatsen/stemmen op NUjij
  • Geef kudos

NS doet het met en zonder www.To www, or not to www. That is the question. Wat is je website adres: Domein.nl of www.Domein.nl? Heb je daar wel eens over nagedacht? Dat zou wel moeten, want het kan een hoop bezoekers uit zoekmachines kosten. Wat nog belangrijker is dan de keuze voor met of zonder “www.” is de manier waarop je deze keuze technisch op je webserver inricht. Er is zelfs een website gewijd aan dit onderwerp, waarop het gebruik van www. wordt verafschuwd: no-www.org.

Waarom is dat dan belangrijk? Zoekmachines behandelen elke URL (elk webadres) als een uniek adres. Er is immers ook maar 1 adres + postcode combinatie voor elk huis in Nederland. Maar heel veel webpagina’s zijn op meerdere adressen bereikbaar. Zo kun je bijvoorbeeld naar Wehkamp.nl surfen, maar ook naar www.Wehkamp.nl. En naar http://ns.nl/pages/overns.html of http://www.ns.nl/pages/overns.html. Een op het oog klein verschil, maar met potentieel grote gevolgen.

Ik zal in dit artikel uitleggen waarom de www.-keuze veel bezoekers kan kosten, hoe 60% van de Nederlandse top 100 websites dit verkeerd aanpakken, en natuurlijk hoe ze het wel goed zouden kunnen doen.

Autoriteit moet je niet delen…

de variant zonder www. snoept een hoop autoriteit van de www. variant af…Rankings van zoekmachines zijn voor een groot deel gebaseerd op autoriteit: Hoe “belangrijk” is een bepaald webadres? Die autoriteit wordt bepaald door het aantal links dat naar een pagina wijst. En dat is waar het probleem met of zonder www. ontstaat. Door beide varianten te gebruiken, wordt de autoriteit over ook beiden verdeeld. Geen van beide bereikt dus zijn potentiële waarde. Ook is er een kleine straf die zoekmachines uitdelen voor “duplicate content”, wanneer verschillende pagina’s dezelfde content hebben, en dat is altijd het geval bij de twee varianten.

Als je zowel met als zonder www. bereikbare pagina’s hebt, zullen beide varianten dus ook in zoekmachines verschijnen. Dat komt doordat links die naar je pagina’s wijzen, soms met en soms zonder www. gemaakt zullen worden, waardoor beide varianten geïndexeerd worden door zoekmachines. Bij Wehkamp zijn er bijvoorbeeld in Google meer dan 300 pagina’s ook zonder www. geindexeerd (Yahoo! vindt er zelfs 1.300 en waarschijnlijk zijn het er nog meer). De homepage van NS.nl heeft met www. een PageRank van 7, en zonder www. een PageRank van 4. Daaruit kun je afleiden dat de variant zonder www. een hoop autoriteit van de www. variant afsnoept…

En het kan nog fouter: sommige websites werken zelfs niet zonder www. ervoor. Dit was tot enkele weken geleden nog het geval bij ABNAmro.nl, maar dat probleem is recent opgelost.

De oplossing: 301 is de enige juiste

De enige goede oplossing is om te kiezen voor een van beide varianten, en de pagina’s alleen beschikbaar te maken op die variant. Op die manier ben je ervan verzekerd dat elke webpagina slechts op 1 adres bereikbaar is, en dus de volle autoriteit scoort. Op Usarchy heb ik ooit gekozen voor www.Usarchy.com, dus als je naar Usarchy.com surft, wordt je doorverwezen naar www.Usarchy.com. Datzelfde gebeurt met alle andere URL’s op het domein, zodat links altijd de totale autoriteit scoren, zelfs als iemand een link naar een www.-loze URL aanmaakt.

Dat doorverwijzen mag maar op 1 manier gebeuren: met een “301 – Moved Permanently” redirect. Die 301 code wordt meegegeven wanneer een pagina wordt opgevraagd. Net zoals een 404 code betekent dat een pagina niet gevonden kan worden, en een 200 code dat de pagina juist wel gevonden is.

Als iemand dus op de “verkeerde” variant terecht komt, wordt hij door die 301 redirect doorverwezen naar de correcte. De zoekmachine ziet dat ook en slaat slechts de correcte URL op, met de bijbehorende autoriteit.

Wie doet het goed, wie niet?

Ik heb van de top 100 van Nederlandse websites (met dank aan de STIR) de HTTP response code gecontroleerd van de domeinnaam zonder www. Niet met de hand gelukkig, waarvoor ik collega Johan dank voor zijn scripting skills :) Dit is het resultaat:

HTTP responses van top 100 Nederlandse domeinnamen

De verschillende codes betekenen het volgende:

  • 301 - De groene websites zijn de enigen die het goed doen met een 301 redirect. Door deze 301 redirect zal de zoekmachine de autoriteit van de verwijzende URL overzetten naar de doorverwezen URL. Daarom kun je ook bij het veranderen van CMS je rankings behouden, je “migreert” met 301 redirects immers je URL’s en daarmee de autoriteit van je URL’s (iets wat de Rabobank dus was vergeten).
  • 302 - De oranje gemarkeerde websites maken de fout dat er een “302 – Moved Temporary” code wordt meegezonden. Dat betekent officieel dat de pagina slechts tijdelijk op een ander adres te bereiken is, terwijl het bij de www.-varianten natuurlijk een permanente verplaatsing betreft. De 302 wordt door zoekmachines niet hetzelfde behandeld als een 301, en geeft de waarde van de URL dus niet goed door.
  • 200 - De websites die dit hebben, zijn dus direct op het www-loze domein te benaderen. In sommige gevallen is dit overigens niet verkeerd. Tweakers.net geeft een 200 code terug, maar dat komt omdat zij kiezen voor de variant zonder www. Op http://www.tweakers.net word je keurig met een 301 doorgestuurd naar http://tweakers.net.
  • 404 - Dit betekent dat de opgevraagde URL niet gevonden kan worden. In bovenstaand overzicht doet alleen ABNAmro dit nog verkeerd. Op zich is het niet eens slecht om een 404 terug te geven bij een www-loos domein, want misschien is dat gewoon je keuze. Veel mensen gebruiken echter de URL zonder www uit gemak, en krijgen dan een foutmelding. Ook wordt in communicatie uitingen vaak de URL zonder www geroepen, dus dan kun je maar beter zorgen dat die ook werkt.
  • 0 – Geen bestaand domein. Ook consequent maar erg ongebruiksvriendelijk als mensen dit toevallig intypen.

Google.nl heeft een goede 301 redirect.In sommige gevallen is bovenstaande lijst trouwens niet helemaal eerlijk. De ANWB geeft wel een 301 terug, maar die verwijst helaas niet naar de correcte domeinvariant, maar naar een lange URL binnen het CMS. Daarbij zijn zowel de www. als de www.-loze variant beschikbaar. Dubbel fout van de ANWB dus, die hiermee laten zien bepaald niet voor zoekmachines geoptimaliseerd te zijn.

Bij Planet.nl is het ook een rommeltje. Daar zijn alle URL’s op beide varianten bereikbaar, maar worden de links in de website ook nog eens verkeerd weergegeven. Als je surft naar planet.nl, zie je dus alle nieuwsberichten op planet.nl/… staan, maar als je naar www.planet.nl surft, wijzen alle links ook naar www.planet.nl/… Hier wordt dus voor enorm veel URL’s de autoriteit gedeeld, waardoor Planet niet zo hoog in zoekmachines staat als mogelijk.

Dus, wat hebben we geleerd?

  1. Maak een keuze: gebruiken we www. of geen www.? Denk hierbij ook aan het feit dat je op dit moment waarschijnlijk het best scoort op www.domein.nl, dus dat is in de meeste gevallen de beste keuze.
  2. Check vervolgens wat er gebeurt als je je domein met of zonder www. intikt. Krijg je gewoon de website te zien, veranderd het webadres nog? Bedenk dat je hier eigenlijk altijd op exact hetzelfde webadres uitkomen.
  3. Check vervolgens met een HTTP header viewer welke HTTP code er wordt teruggegeven. Online kun je dat bijvoorbeeld bij Rex Swain doen. Firefox heeft er echter ook een plugin voor: LiveHTTPHeaders. Hier moet dus een 301 worden weergegeven als je naar de “verkeerde” variant gaat, waarna je wordt geredirect naar de correcte variant.
  4. Check dit vervolgens ook eens van diepere URL’s op de website. Idealiter verwijzen ook die allemaal naar de correcte variant.

Het aardige van dit hele verhaal is dat het eigenlijk common sense is. Natuurlijk is welke webpagina maar op 1 URL te bereiken. Natuurlijk weten wij welke URL de goede is. En natuurlijk gebruiken de webbouwer en webhoster de correcte standaarden om de wens van de opdrachtgever te implementeren. Maar in de praktijk gaat het dus in de meeste gevallen net verkeerd. Terwijl de correcte oplossing meestal een paar minuten werk vereist.

Online marketing kan zo simpel zijn… :)


Popularity: 21% [?]

Reacties (37)

Reageren
  • Misschien heb ik iets gemist maar wat is er mis met www? Op die gekke site no-www.org wordt mij dat niet helemaal duidelijk. M.a.w. waarom twee varianten waarvan een met een re-direct en niet gewoon enkel ?©?©n van beiden? Hebben twee varianten een voordeel met het oog op seo als je re-direct goed staat?

  • Willem: wat mij betreft niks, ik heb zelf ook juist voor www. gekozen omdat ik het netjes vind.

    Enkel een van beiden kiezen is dus goed, maar je zult wel altijd de een naar de ander moeten redirecten omdat mensen anders op een dood spoor komen.
    Twee varianten hebben geen voordeel op zich, maar je moet ze gewoon allebei beschikbaar hebben voor het geval iemand het zo intikt.

  • Ruben,
    Waarom heb je niet direct een voorbeeldje gegeven van een 301 pagina. Lijkt mij handig voor vele bezoekers van dit artikel :o)
    Dank je wel voor de verheldering.

  • Bijvoorbeeld http://www.web-portfolio.be/seo/301-redirect-none-www.php

  • Merci Ruben, laat morgen een paar dingen aanpassen op onze eigen website :)

  • Vind het een beetje raar dat je onder het kopje ‘Wie doet het goed, wie niet?’ Tweakers.net in het schema aanduidt als een site die het niet goed doet, terwijl ze dat dus wel doen. Maar daar kom ik dus pas achter als ik de legenda lees. Het wordt me echter niet duidelijk of er in het rijtje ‘slechterikken’ nog meer sites zitten die hun zaakjes stiekem wel op orde hebben. Hoe zit dat?

    Overigens, wat houdt ’0′ in?

    En Ruben, ai, je tekstuele content in een plaatje communiceren zonder goed alternatief…. Ik weet het: “don’t do as you do, do as you say”, maar dat houdt dus in dat alleen anderen moeten doen wat jij zegt 8\
    Hmmm….

  • Leuk verhaal.
    www probleem is nu dus opgelost.
    Blijft er volgens mij nog 1 over:
    http://www.mijndomein.nl pr6
    http://www.mijndomein.nl/index.php pr5

    Op usarchy komt index.php ook op http://www.usarchy.com/ uit echter ik weet niet hoe. (foutmelding in de online tool)

    / en index.php is volgens mij een zelfde probleem als met www?

  • Net artikel Ruben! Heb dit zelf ook een tijdje geleden door gekregen op mijn eigen website en het toen direct veranderd.
    Ik heb overigens ook gehoord dat het met een slash op het einde van de URI ook nog anders kan zijn dan zonder die slash, maar dat leek me een beetje vergezocht. Met /index.html (.php, etc.) komt het wel voor, maar aangezien mijn CMS dat niet gebruikt…

  • Inderdaad, naast index.php hebik ook pagina’s die (af en toe) zowel met als zonder slash in google staan. Met enige regelmaat staan ze zelfs tijdelijk onder elkaar…..

    Daar zou ik nog wel een een oplossing voor willen :-)

  • Interessant, dat overzicht van de Top 100 :)

    Ik kwam net zelf de linkpagina http://www.beginthier.nl/ tegen. De www-variant heeft een PR van 5, de non-www komt niet verder dan PR 2. Toch zonde.

  • Enkele oplossingen, ze werken alleen onder een Unix of Linux systeem, zijn te vinden in dit artikel op Naar Voren. Ook verwijzingen naar meer informatie.

  • Als je dan gekozen hebt voor de non www variant, dan kun je op deze manier de www er uit rewriten :)

  • Erno, thanks voor het voorbeeld. Ik had er zelf nog geen gegeven omdat elke server dat weer anders doet, en elke scripttaal het ook weer zelf kan.
    Hier nog twee voorbeelden voor mensen die geen Apache gebruiken en de redirect met IIS, Coldfusion, PHP, ASP, Java of CGI moeten maken:
    http://netters.nl/301-redirect-iis-404-pagina
    http://www.ulco.nl/40/search-engine-friendly-redirect

    Sander: yeah, you’re right uiteraard. Ik wilde eerst gewoon een tabel neergooien maar dit was sneller, ik was te lui om toegankelijk te zijn…

    sander: Ik gebruik voor mijn redirects ook nog de extra WordPress plugin Permalink redirect.

  • Bedankt. Wist niet dat er een plugin voor was.

    Ik zal het nogmaals proberen om de slash probleem op te lossen echter de laatste keer kwaqm ik volgens mij in een loop.

    Ik zal het resulaat nog wel postenj.

  • Plugin werkt perfect. Was precies wat ik nodig had maar nooit gezocht naar een plugin.

    Thanks

  • [...] Usarchy schrijft een zeer interessant artikel over de gevolgen van het niet goed inrichten van je server ten aanzien van het al dan niet goed gebruiken van www in je domein. De gevolgen voor je link populariteit in de zoekmachines blijken desastreus. Uit onderzoek van Usarchy blijkt dat zelfs de grootste sites in Nederland (oa Planet.nl) hun zaakjes niet op orde te hebben. Het artikel verwijst ook naar een speciaal ingerichte site die de strijd aanbindt met het www; http://no-www.org/. Ik ga bij thuiskomt gelijk mijn eigen server inrichten…. [...]

  • [...] Op de website Usarchy is te lezen wat de invloed hiervan is.¬† In het eerder genoemde voorbeeld blijkt dat http://www.ns.nl een PageRank van 7 heeft en de ns.nl variant (dus zonder www) het slechts moet doen met een PageRank van 4. [...]

  • misschien is dit artikel nog wel nuttig: http://www.onetomarket.nl/nieuws/artikelen/301-redirect-tutorial/

  • Een heel interessant artikel, ik ben het er in hoofdlijnen zeker mee eens.
    Het zoekmachine-gedeelte is hier inderdaad erg belangrijk.
    Er zijn nog wel wat kanttekeningen te plaatsen:

    * 2 records in de google-resultaten kan ook een voordeel zijn, helemaal als ze onder elkaar staan.
    Ook al is de pagerank per url minder, ze krijgen veel meer aandacht/ruimte op de pagina, en de site lijkt voor de bezoeker leading te zijn: “Waarom staan er anders 2 links?”

    * Zoekmachines zullen waarschijnlijk geen penalty uitdelen over ‘duplicate content’ als het alleen een variant tussen wel- en niet-www. betreft.
    Bij standaard-virtual-hosting staan beide opties meestal open, en zoekmachines proberen de dagelijkse realiteit zo goed mogelijk te interpreteren.

    * Als je huidige niet-www-site POST-requests ontvangt vanaf een ander domein, zoals via externe zoekformuliertjes of ajax-posts, gebruik dan geen 301. Zoals in de w3-specificaties staat: ” If the 301 status code is received in response to a request other than GET or HEAD, the user agent MUST NOT automatically redirect the request unless it can be confirmed by the user, since this might change the conditions under which the request was issued.”

  • Interessant punt over POST waarden, Paul. Maar gelukkig werk ik zelden tot nooit met andere domeinen voor ?©?©n en dezelfde website: ook een SEO iets. Maar het kan inderdaad zo zijn, waardoor je naar de juiste versie (diegene die geen 301 stuurt) zult moeten linken in je formulier.

  • Hi Paul,
    Thanks voor je aanvulling en welkom hier als reageerder :)

    * 2 records in de google-resultaten kan ook een voordeel zijn, helemaal als ze onder elkaar staan.
    Ook al is de pagerank per url minder, ze krijgen veel meer aandacht/ruimte op de pagina, en de site lijkt voor de bezoeker leading te zijn: “Waarom staan er anders 2 links?”

    In de praktijk zal dit niet voorkomen, juist omdat er gefilterd wordt op dubbele content. Twee keer hetzelfde resultaat in Google helpt je rankings zeker niet (alleen al door het verspreiden van autoriteit), dus dit argument gaat volgens mij niet op. Ben wel benieuwd of je misschien een voorbeeld hebt.

    Als je twee URL’s met bijna dezelfde content hebt (maar dus niet een met en een zonder www), gebeurt dit overigens wel. Zie bijvoorbeeld:
    http://www.google.nl/search?hl=nl&c2coff=1&q=terugblik+rabobank&btnG=Zoeken&meta=lr%3Dlang_nl
    Dat kan helpen, maar je moet een damn slimme SEO strategie hebben wil je hier niet meer schade dan voordeel van ondervinden.

    * Zoekmachines zullen waarschijnlijk geen penalty uitdelen over ‘duplicate content’ als het alleen een variant tussen wel- en niet-www. betreft.
    Bij standaard-virtual-hosting staan beide opties meestal open, en zoekmachines proberen de dagelijkse realiteit zo goed mogelijk te interpreteren.

    Er is sowieso geen duplicate content penalty, hooguit een soort filter. In de praktijk zie je dat duplicate content eigenlijk amper wordt bestraft, wat natuurlijk vreemd is. Ik denk dat dat best eens kan komen door wat je zegt: in de praktijk komt het veel voor, mensen beseffen niet dat ze iets fout doen en dus is het lastig om ze te bestraffen.
    Ik ben geen SEO guru, maar de mensen die het zouden moeten weten doen er over het algemeen alles aan om dubbele (of meer) URL’s te voorkomen. Ik denk dat dat altijd het beste is om te doen.

    Je laatste tip lijkt me een goeie, al weet ik niet helemaal zeker of ik de issue begrijp. Kun je hiervan een voorbeeld ter illustratie noemen? Ik neem aan dat als je je zaakjes goed op orde hebt, dit probleem niet kan voorkomen doordat iemand geen request kan triggeren vanaf een verkeerd domein omdat ‘ie dan al geredirect was naar de goede. Right?

    Thanks!

  • In de praktijk zal dit niet voorkomen, juist omdat er gefilterd wordt op dubbele content. Twee keer hetzelfde resultaat in Google helpt je rankings zeker niet (alleen al door het verspreiden van autoriteit), dus dit argument gaat volgens mij niet op. Ben wel benieuwd of je misschien een voorbeeld hebt.

    Ik heb meerdere voorbeelden.
    Zoek maar eens op “limewire” in google. Nummer 3 en 4 waren dezelfde pagina, met en zonder slash. Dit is nu opgelost door de plugin van Ruben.
    Dit zal dus tzt weer 1 pagina worden. (altijd met slash)

    Laat maar weten als dit resultaat in google niet meer klopt, ik heb een screenshot.

  • @Ruben: ^sander gaf dus al een voorbeeld, ook al kan ik dat voorbeeld niet zo 123 uit google tevoorschijn toveren. Ik kan zelf niet veel actuele voorbeelden geven, weet alleen uit mijn seo-tijd dat het zeker wel mogelijk is om zowel je www- als een ander subdomein (of zonder sub) onder elkaar in google te krijgen.
    Ik ben het eens met het artikel overigens, dat het gebruik van 1 (sub-)domeinnaam het beste is. Dat klopt gewoon.

    @ruben 2: klein voorbeeld van post-requests naar je site: als je content deelt met andere sites via xml, waarbij een authenticatie gebruikt wordt, kan het zijn dat het ophalen van de xml gebeurt via een body-post of gewone post. Als er dan ooit gecommuniceerd is dat ze het adres-zonder-www kunnen gebruiken (of hebben gemerkt dat dat ook werkt; scheelt 4 bytes per request), zal dat niet meer werken, want POST-requests kunnen niet worden omgeleid via een 301-redirect.
    Ander simpel voorbeeld: een zoekformuliertje op iemand’s site, die als target jouw site heeft, en als verzendmethode POST: “Zoek nu boeken op xxxx.com!”
    Ik moet er wel bij zeggen dat dit in de praktijk niet heel vaak voorkomt, maar als het voorkomt, heb je wel een tijdelijk probleem.

  • Sander & Paul, thanks voor de voorbeelden en uitleg, zeer nuttig. De voorbeelden zouden eigenlijk niet moeten kunnen maar komen kennelijk toch nog voor in de praktijk. Google noemt het voorkomen van dubbele URL’s die eigenlijk hetzelfde zijn “URL canonicalization”. Matt Cutts heeft er twee keer over geschreven:

    http://www.mattcutts.com/blog/seo-advice-url-canonicalization/
    http://www.mattcutts.com/blog/canonicalization-update/

    In het tweede artikel legt Cutts uit waarom Google niet simpelweg alle www en non-www domeinen op een hoop gooit.

    Sander: vind een screenie van je voorbeeld wel leuk als aanvulling op de discussie, zou je die hier nog neer willen zetten in de comments?

    En Paul: ik begrijp de POST requests voorbeelden nu, thanks a lot :)

  • @ ruben:
    http://pvmultimedia-seo-contest.blog-s.nl/files/limewire-google.jpg
    screenshot. Gaat dus om de slash.

    Na de wordpress plugin is deze pagina netjes vervangen door een andere url van hetzelfde domein :-)

  • Grappig, heb het nog nooit zo gezien. Raar ook dat Google een andere description maakte voor beide pagina’s, slaat eigenlijk nergens op natuurlijk…

    Overigens gebeuren er wel gekke dingen als ik naar je url’s surf, met en zonder www en met en zonder / :)

  • Owh. had de tekst al klaar dat het met de limewire pagina ok was.
    Je bedoelt zonder www kom je op een andere pagina?

    Zal dan nu maar eens gaan kijken naar de instellingen van die plugin :-)
    Was er nog niet van gekomen.

  • mm, die plugin heeft dus een probleem met mijn www redirect.
    RewriteCond %{HTTP_HOST} ^neerladen.nl [NC]
    RewriteRule ^(.*)$ http://www.neerladen.nl/ [L,R=301]

    met die plugin komt dus een url zonder www uit op de index. terwijl het natuurlijk dezelfde pagina moet zijn als met http://www…..

  • Ja, precies… Ik ben zelf nogal een kluns met htaccess en eigenlijk alles in server configs, scripting, etc, dus misschien dat iemand anders een idee heeft? :o

  • [...] Naar aanleiding van een artikel op Usarchy: domeinnaam met of zonder www heb ik bij een groot deel van mijn websites dit ook netjes geregeld. Overal heb ik gekozen voor de $#8216;met http://www.’; variant, gewoon omdat ik dit persoonlijk mooi vind. Maar dit was voor mij niet de voornaamste reden om dit te gaan doen. Veel websites waren onder verschillende domeinnamen te bereiken (eentje zelfs via 14 domeinnamen). Nu verspringen de andere domeinnamen netjes naar de ‘hoofdomeinnaam’. [...]

  • We gaan het oplossen. bedankt voor de tip!

  • Ik ga aan de slag met je aanbevelingen maar heb een vraag. Hoe doe je het met subdomeinen?

    http://www.google.com/search?hl=nl&q=site%3A9292ov.nl+-inurl%3Awww.9292ov.nl&lr=

    Ik wil routeplanner.9292ov.nl en sms.9292ov.nl wil laten indexeren….

  • Goede tip Ruben :-)

    Meteen doorgevoerd.

  • Maar bij de meeste cmssystemen zit dit toch al ingebouwd?

  • Maar bij de meeste cmssystemen zit dit toch al ingebouwd?

    Nee, vaak niet… helaas.

  • Hosting: in het geval van jullie CMS in ieder geval niet :) Let erop dat je dus niet op bijv hostingpower.nl EN http://www.hostingpower.nl terecht mag komen.

  • [...] ander interessant artikel waarin 301 redirect een rol speelt; Domeinnaam met of zonder www: 301, 302,‚Ķ404? [...]

Reageer

(zal niet zichtbaar zijn)