Koreliacijų problema yra tokia: jei išmatuoti pakankamai kintamųjų, galiausiai pasirodys, kad kai kurie iš jų koreliuoja. Kadangi vienas iš dvidešimties neišvengiamai bus laikomas reikšmingu be jokios tiesioginės koreliacijos. Atliktais tyrimais galima manipuliuoti (turint pakankamai duomenų), kad būtų įrodyta koreliacija, kurios nėra arba kuri nėra pakankamai reikšminga priežastiniam ryšiui įrodyti.
Norėdami toliau iliustruoti šį teiginį, tarkime, kad tyrimas nustatė sąryšį tarp automobilių avarijų skaičiaus padidėjimo Niujorko valstijoje birželio mėnesį (A) ir lokių atakų skaičiaus padidėjimo Niujorko valstijoje. birželio mėnesį (B).
Tai reiškia, kad greičiausiai bus šeši galimi paaiškinimai:
- Automobilių avarijos (A) sukelia lokių atakas (B)
- Lokių atakos (B) sukelia automobilių avarijas (A)
- Automobilių avarijos (A) ir lokių atakos (B) iš dalies sukelia vienas kitą
- Automobilių avarijas (A) ir lokių atakas (B) sukelia trečiasis veiksnys (C)
- Lokių atakas (B) sukelia trečiasis veiksnys (C), kuris koreliuoja su automobilių avarijomis (A)
- Koreliacija yra tik atsitiktinumas
Bet kuris protingas žmogus nesunkiai atpažintų, kad autoavarijos nesukelia lokių atakų. Tikėtina, kad kiekvieną iš jų lėmė trečiasis veiksnys, pavyzdžiui padidėjęs gyventojų mobilumas dėl turizmo sezono įkarščio birželio mėnesį. Būtų absurdiška sakyti, kad jie sukelia vienas kitą.....
Tačiau kaip dėl priežastinio ryšio? Kas, jei matuojami kintamieji būtų skirtingi? Kas, jei būtų patikimiau, pavyzdžiui, Alzheimerio liga ir senatvė? Akivaizdu, kad tarp šių dviejų dalykų yra ryšys, bet ar yra priežastinis ryšys? Daugelis klaidingai nuspręstų, kad taip, remdamiesi vien koreliacijos stiprumu. Reikia būti atsargiems, nes sąmoningai ar nesąmoningai statistiniuose tyrimuose ir toliau bus ieškoma koreliacija.
Visi gerai prisimena klasikinį paveikslą „piratų skaičiaus įtaka klimato atšilimui“. Klaidingos koreliacijos aptinkamos visur, net ir ten, kur autoriai to nepadarė savanaudiškais tikslais. Kaip sakyta ankščiau, statistika priežastinių ryšių neaprašo, todėl dažnai koreliacija tėra klaidingos priežastinio ryšio iliuzijos ir suklaidintos autorių ir skaitytojų vaizduotės vaisius. Kiekvieną kartą, kai egzistuoja dvi diagramos, kurios turi tą patį trendą, verta susimąstyti, ar yra trečiasis parametras, nuo kurio jie abu priklauso. Tokiu atveju, piratai tikrai nebus „ atsakingi“ už visuotinį atšilimą.
