Korrelasjon er ikke kausalitet

Opprinnelig publisert 13.februar på TheBoomBust.Blogspot.com

Alt for ofte kommer jeg over grafer som sammenligner dagens utvikling i finansmarkedene med tidligere episoder som hadde tilsvarende utvikling. Disse grafene gir leseren inntrykk av at siden utviklingen i dag er veldig identisk med hva som har skjedd tidligere, så vil utviklingen fremover bli som den ble den gang. Slike grafer er i mine øyne ofte bare vås.

Under er et eksempel på en graf som har gått sin runde på internett siden desember i fjor. Grafen sammenligner dagens utvikling i aksjemarkedet med årene frem til 1929 da aksjemarkedet krakket.

Her er en oppdatert versjon som viser hvordan utviklingen siden desember har sammenfalt med 1929-krakket.

Når man ser en slik graf vil man som regel umiddelbart tenke: Oi! Utviklingen er jo helt identisk med 1929! Nå kommer det garantert et nytt krakk i markedet!

Dette er derimot en tullete konklusjon å trekke. Feilen man gjør er å blande korrelasjon med kausalitet. (I tillegg skjønner man ikke forskjell på prosentvis endring og nominell indeksverdiendring. Hint: se på verdien på y-aksene i grafen. De er av helt ulike størrelsesorden.) Hva mener jeg med at korrelasjon ikke er kausalitet? Fra Wikipedia:

Korrelasjon medfører kausalitet, på latin cum hoc ergo propter hoc er en feilslutning som er vanlig i statistisk analyse. Feilen består i å forveksle korrelasjon med årsakssammenheng.

Sagt på godt norsk, så er det ikke slik at fordi utviklingen i aksjeprisene er veldig like, så vil det samme som skjedde i 1929 skje igjen. Problemet med denne tankegangen er at det er uendelig mange ting som var forskjellig den gang fra nå. At prisutviklingen er den samme betyr ikke at fremtiden blir den samme. Eller, lar du deg kanskje overbevise av denne korrelasjonen?

Den avdøde økonomen Ludwig von Mises forklarte denne feilslutningen på en bra måte i sin bok Theory and History:

Economics is not…»quantitative.» It is not quantitative and does not measure because there are no constants. Statistical figures referring to economic events are historical data. They tell us what happened in a nonrepeatable historical case. Physical events can be interpreted on the ground of our knowledge concerning constant relations established by experiments. Historical events are not open to such an interpretation

In the mathematical treatment of physics the distinction between constants and variables makes sense; it is essential in every instance of technological computation. In economics there are no constant relations between various magnitudes. Consequently all ascertainable data are variables, or what amounts to the same thing, historical data. The mathematical economists reiterate that the plight of mathematical economics consists in the fact that there are a great number of variables. The truth is that there are only variables and no constants. It is pointless to talk of variables where there are no invariables.

Så neste gang du ser slike grafer som viser korrelasjoner, tenk deg litt om før du trekker en slutning, og forviss deg om at du ikke forveksler kausalitet med korrelasjon.

TheBoomBust er en blogg skrevet av en som arbeider innen finansbransjen, som kommenterer nyheter og økonomien anonymt.