Statistikhjälp

imaster

Bah
Gick med
20 May 2005
Ort
Landskrona
Hoj
Tillsvidare hojlös
Jag håller på att sammanställa lite statistik men körde in i en vägg, typ. Skulle behöva lite braintrust här.

Bakgrund: jag sammanställer sambanden mellan olika typer av nyheter på en hemsida, hur olika typer av innehåll visas olika många gånger beroende på, ja, innehållet.

Problemet är att de gamla nyheterna ju är visade många fler gånger för att de legat uppe mycket längre. Det blir ju då svårt att jämföra och jag skulle behöva likrikta statistiken på något sätt. Är det nån som kan hjälpa mig lite här?

Den äldsta nyheten har legat uppe tre månader och har 1500 visningar, den nyaste är sedan igår och har 700 visningar. Antalet besökare har också ökat, från 100 besökare i veckan när första nyheten publicerades till 600 besökare i veckan i senaste räkningen.

Nån som har nån idé om hur jag kan göra för att försöka tolka resultatet på ett rättvist sätt?
 
Kan du inte se exempelvis hur många träffar det är första veckan så blir det nog svårt utan ett matematiskt genomsnitt/uppskattning. Alt om det går att dra någon slutsats med sidornas dagliga besökare men det känns lite vanskligt.
 
Du kan ju göra ett tämligen säkert antagande att antalet besök/dag inte är linjärt över tid. Så att bryta ned det per dag blir fel då (från ditt exempel) sidan med 1500 visningar kanske hade 800 första veckan och därmed mer än den nyare nyheten.

Du måste nog kunna "ta tempen" vid en förutbestämd tidpunkt för att få ett korrekt resultat.

Tyvärr...
 
Nån som har nån idé om hur jag kan göra för att försöka tolka resultatet på ett rättvist sätt?

Och vad skulle statistik ha med rättvisa att göra?

Vad är det du vill visa med statistiken?
Du måste ju naturligtvis anpassa beräkningsmetoderna så statistiken visar just det
du vill att den ska visa. Det är ju det statistik handlar om.
 
Dela upp det per dag och sedan förutsätta att kanske 70% av det totala antalet visningar sker första dagen?

Frågan är hur du ska komma fram till en bra procent på hur många av visningarna som sker första dagen eller vilket tidsperiod du nu söker.

(nej, jag är inget matte-geni, men det där känns inte helt wacko iallafall hehe)
 
Du måste nog kunna "ta tempen" vid en förutbestämd tidpunkt för att få ett korrekt resultat.

Jag kan få fram antalet besökare per dag (inte per nyhet), kan man göra nåt med det?

Vad är det du vill visa med statistiken?

Jag vill få reda på vilken typ av innehåll som besökarna tittar på mest och som man då också bör lägga lite mer fokus på. Jag ska inte visa statistiken för någon annan, därför är jag ute efter ett rättvisande resultat.

Dela upp det per dag och sedan förutsätta att kanske 70% av det totala antalet visningar sker första dagen?

Frågan är hur du ska komma fram till en bra procent på hur många av visningarna som sker första dagen eller vilket tidsperiod du nu söker.

(nej, jag är inget matte-geni, men det där känns inte helt wacko iallafall hehe)

Precis, jag är ju fullt medveten om att en majoritet av visningarna sker t.o.m. första 8h, inte bara första dagen, och sedan faller det ganska drastiskt. Problemet är att jag inte riktigt vet hur mycket det faller så det blir en mycket klurig ekvation här...
 
Jag kan få fram antalet besökare per dag (inte per nyhet), kan man göra nåt med det?


Det du kan göra är ju att ta fördelningen på totala nyheter så som du ville utan hänsyn till tiden. Och sen bryta ner diffarna i antal visningar per dag och få ut en extremt grov uppskattning på hur fördelning per dag/första dagarna/första veckan etc såg ut för respektive nyhet.

I studiesyfte kan det vara intressant om du inte har bättre grunddata att tillgå. Är det i ett akademisk ändamål har jag svårt att se hur en lärare skulle ta det som tillräckligt..
 
Spånar lite fritt.

Du får göra ett antagande för hur fördelningen av visningar över tiden ser ut och kompensera för hur länge nyheterna legat uppe med hjälp av den modellen när du sedan rankar nyheterna inbördes. Ta bara med nyheter som är några veckor gamla, så slipper du de förmodligen mest kaotiska första dagarna. Gissningsvis kommer det att vara mycket visningar i början för att sedan snabbt avta när nyhetsvärdet avklingar, för att därefter snabbt sjunka till en väldigt låg och mer eller mindre konstant nivå beroende på t ex sökmotorträffar.

Du lär springa in i problemet att plötsligt är någon gammal nyhet länkad i något forum och så får du en visningstopp på den långt efter publicering. Vissa nyheter lär också vara mer sökmotorvänliga och därmed hamna på en mycket högre "sistanivå" än andra nyheter. Tittar du bara på lite äldre nyheter och tittar lite över tiden kan du jämföra antalet visningar vid en tidpunkt med antalet visningar efter en vecka, två veckor, tre veckor, fyra veckor - så långt och så många mätningar som behövs för att se om de ligger på en jämn eller avtagande nivå och vad den nivån är.

Är nivån jämn så är det bara att räkna tillbaka till säg två månader efter publicering för alla nyheter och du bör få ett värde som är ganska rättvisande.

Är nivån inte jämn blir det knivigare. :)

Skall du vara seriös får du läsa på lite om statistiska metoder. Känns som att ANOVA borde kunna kompensera för tiden. Skall villigt erkänna att det är för länge sedan jag höll på med det för att jag skall minnas detaljerna.
 
Last edited:
Nyheter
Jonathan Rea avslutar sin racingkarriär

Efter nästan två decennier ...

Yamaha debuterar med V4 i MotoGP

Yamaha har meddelat att för...

Hojmys i Ugglans Park

Ända sedan början av 90-tal...

MC-mässan 2026

MC-Mässan är tillbaka 23–25...

Bike kör Stark Varg EX!

Under hösten kommer Bike gö...

Customhoj Bike Show 2026

Den 23 till 25 januari körs...

Racing på Kjula Dragway till helgen

Den kommande helgen (23-24 ...

Harley-Davidson och MotoGP lanserar Harley-Davidson Bagger World Cup

Harley-Davidson och MotoGP ...

BMW Motorrad International GS Trophy 2026 körs i Rumänien

Platsen för BMW Motorrad In...

Strängnäs Bike Show den 30/8

Sista lördagen i augusti är...

Back
Top