Kan man använda statistiska värderingar för att mäta försäljningsresultat?

#Kan-man-använda-statistiska-värderingar-för-att-mäta-försäljningsresultat?

I samband med att man ska sälja sin bostad dyker det ofta upp frågor kring hur man kan optimera sin försäljning för att få ett så bra resultat som möjligt. Det kan vara frågor som vilken mäklarbyrå man ska välja eller vilken arvodesmodell som är bäst.

För att med hjälp av statistik och dataanalys kunna svara på sådana frågor på ett tillfredställande sätt krävs ett kvantitativt mått på resultatet. Man kan titta på faktiska slutpriser eller ökning i budgivning för att försöka komma fram till ett sådant mått, men de siffrorna är beroende av många faktorer som är svåra att ta hänsyn till i en analys.

Vår hypotes är att vi kan använda Boolis statistiska värdeindikationer, och se avvikelsen från värderingen som ett mått på resultatet. Vi ska nu undersöka om det är en rimlig hypotes.

Vi laddar in data för ett helår, 2018-06-01 till 2019-06-01, och plottar den procentuella skillnaden mellan försäljningspris och värdeindikation som ett histogram.

Loading output library...
Loading output library...
Loading output library...

Vi kan se att medianstorleken på felet är ca 5,1 % och att vi har en fördelning som är centrerad kring 0 %. De flesta värderingar ligger inom +/- 10 % i avvikelse från slutpriset, men vi har ganska långa svansar med stora avvikelser. För att bli kvitt dem filtrerar vi bort outliers och tar en till titt.

Loading output library...
Loading output library...
Loading output library...

Vi har då kvar drygt 15 500 observationer och felkurvan ser någorlunda normalfördelad ut. Kurvan är centrerad kring 0 % med standardavvikelse 7,7 %. Medianstorleken på felet hamnar på 5,0 %.

Det innebär att ca 2/3 av alla värderingar ligger inom +/- 7,7 % från försäljningspriset och att ca 95 % av alla värderingar ligger inom +/- 15,4 % från försäljningspriset.

Nu vill vi undersöka om det finns några tydliga korrelationer mellan avvikelsen och t.ex. geografi eller typ av lägenhet. Vi börjar med att undersöka geografikomponenten visuellt.

Loading output library...
Loading output library...

I plotten ovan kan vi inte uttyda någon särskild geografisk klustring av små eller stora fel i värderingarna, utan det ser ut att vara ungefär samma fördelning i hela kommunen.

Vi fortsätter med att titta på om felet i procent har någon tydlig korrelation till övriga kvantitativa parametrar vi har om bostäderna, som t.ex. boarea och antal rum.

Loading output library...

Starkast samband ser vi mellan antal rum och avvikelsen samt byggår och avvikelsen, men det handlar om så pass svaga korrelationer att man inte kan dra några slutsatser från det.

Då vi har sett att det inte finns någon tydlig korrelation mellan varken geografi eller bostadskaraktäristiker och felet i värderingen kan vi känna oss trygga i att ett prestationsmått med värderingarna som utgångspunkt kommer vara rättvisande, givet av underlaget är stort nog. Vi formulerar det måttet som skillnaden mellan värderingen och köpeskillingen, vilket redan beräknat i vårt underlag som felet i värderingen enligt nedan:

1
2
3
error = estimatedPrice - soldPrice

error_percent = (estimatedPrice - soldPrice) / soldPrice

Den formuleringen av felet innebär att vi får en negativ siffra om slutpriset är större än värderingen.

Loading output library...
Loading output library...

Vi ser att medianfelet ligger på ca -7 500 SEK, eller -0,2 %, vilket innebär att sett till median av alla försäljningar har resultaten överträffat Boolis värdering med 7 500 SEK. Medelvärdet ligger på ca 14 400 över värderingen.

Test

#Test

Vi gör ett test av metoden genom att jämföra 2 populära mäklarbyråer, båda är aktiva i Stockholms kommun och har förmedlat över 900 lägenheter var i vårt underlag.

Loading output library...

Vi kan se att den ena mäklarbyrån sett till medianen brukar sälja för ca 27 000 SEK över Boolis statistiska värderingar, medan den andra säljer för ca 6 600 under värderingen. Vid första ögonkastet ser det alltså ut som att det finns en skillnad mellan de här två mäklarbyråerna, och att testet fallet ut till fördel för byrå 28.

För att försäkra oss om att vi inte drar för snabba slutsatser kan vi göra ett t-test.

Loading output library...

T-testet ger ett p-värde på ca 0,000075, vilket kan tolkas som att vi med 99,9925 % konfidens kan säga att det finns en skillnad mellan de två distributionerna. Det är alltså 0,0075 % sannolikhet att vi skulle se de här skillnaderna i utfall om det kunde antas att mäklarbyråerna inte hade någon påverkan.

Vi går vidare och undersöker om det finns några skillnader mellan bostäderna de olika byråerna säljer som kan påverka jämförelsen på ett orättvist sätt.

Loading output library...

Vid visuell inspektion av kartbilden ser det ut som att båda byråerna är aktiva i hela kommunen och på ungefär samma ställen. Man kan se att det finns vissa områden där den ena byrån har en större marknadsandel än den andra, t.ex. är byrå 34 mer aktiv i Årsta medan byrå 28 är mer aktiv på Hammarbyhöjden. Givet den tidigare kartbilden där vi undersökte hur felet i värderingen varierar geografiskt finns det dock ingen anledning att anta att detta skulle leda till en orättvis jämförelse.

Vi kollar vidare på om det finns skillnader i vilka typer av lägenheter de olika byråerna förmedlar.

Loading output library...

Här kan vi se att det finns en viss skillnad mellan typerna av bostäder de olika byråerna förmedlar. Byrå 34 verkar generellt sett sälja mindre bostäder än byrå 28. Men givet slutsatsen att felet bara korrelerar väldigt svagt till bostadskaraktäristiker som antal rum och boarea, och att de två parametrarna inte heller visade korrelation i samma riktning, finns det ingen anledning att anta att den skillnaden påverkar jämförelsen orättvist.

Testresultat

#Testresultat

Vi kan dra slutsatsen att byrå 28 generellt sett presterar bättre än byrå 34 sett till avvikelse från Boolis statistiska värderingar.

Underlagen av försäljningar är så pass stora, och spridningen av bostäder i de olika delmängderna så pass likartade, att det kan antas att den viktigaste åtskiljande faktorn är mäklarbyrån.

Slutsats och brasklapp

#Slutsats-och-brasklapp

Givet vissa förutsättningar verkar det vara oproblematiskt att använda Boolis värderingar som mått på försäljningsresultat för en given delmängd av försäljningarna. De förutsättningarna är:

  • underlaget av försäljningar i delmängden måste vara stort
  • outliers i underlaget måste tvättas bort
  • det måste kunna antas att försäljningarna i delmängden avser bostäder som inte på något signifikant sätt avviker från övriga populationen, med avseende på faktorer som inte viktas in i de statistiska värderingarna

Den sista punkten är det som kan riskera att ställa till det. Vill man t.ex. jämföra två mäklares prestation mot varandra måste man försäkra sig om att det inte blir en orättvis jämförelse p.g.a. faktorer som Boolis värderingar inte tar hänsyn till. Exempel på sådana parametrar är skick och utsikt. I Boolis statistiska värderingar har vi inte data om skicket i bostaden, eller om det kan finnas en sjöutsikt eller liknande som drar upp värdet jämfört med andra liknande bostäder.

Skulle det vara så att en mäklare endast säljer topprenoverade objekt med sjöutsikt, medan en annan mäklare endast säljer bostäder med renoveringsbehov utan utsikt, så riskerar jämförelsen bli orättvis.

Ett exempel på när sådana problem kan uppstå är t.ex. när man jämför mäklarbyråer som profilerar sig som lyxmäklare (Behrer & Partner, Residence, Skeppsholmen, Historiska Hem, Lagerlings, m.fl.) mot vanliga mäklarbyråer som Fastighetsbyrån eller Notar. Det blir en orättvis jämförelse p.g.a. att vi har en tendens att undervärdera lyxsegmentet medan vi ger rättvisande värderingar för vanliga bostäder. Anledningen till det är att lägenheterna i lyxsegmentet ofta har kvalitéer som är svåra att ta hänsyn till statistiskt (t.ex. 4 meters takhöjd, dubbla kakelugnar och slottsparkett).

För att kunna använda den här utvärderingsmetoden måste man känna till de svagheter som finns med statistisk värdering och kunna anta att värderingarna i de delmängder man vill jämföra har samma precision. När de förutsättningarna gäller är det ett väldigt användbart verktyg för att analysera hur olika faktorer kan påverka resultatet vid en försäljning.