Jazyk:

LINEÁRNÍ REGRESE

Víš jak funguje předpověď počasí?

Předpověď dnes počítají superpočítače pomocí složitých matematických modelů. Zjednodušeně je předpověď založena na tom, že meteorologové  vysledovali, že pokud v minulosti naměřili v atmosféře určité hodnoty (stalo se toto), počasí pak přišlo takové a makové (stalo se tamto)., . A předpokládají, že když naměří stejné hodnoty znovu, bude se vyvíjet počasí jako tehdy (stane se znovu tamto). Víceméně to tak opravdu funguje. Do hry ale vstupují další a další proměnné a předpověď tak nemusí být vždy úplně přesná.

 

Ale i když rosničky často kritizujeme, většinou to počasí předpovídají mnohem přesněji, než kdybychom ho tipovali bez nich.

Jednoduchou formou predikce je tzn. lineární regrese. Pomocí ní umíme předpovědět, že pokud člověk v naší hře hodí například v režimu MEDIUM počet míčků x (podmínka TOTO), tak z nich s velkou pravděpodobností trefí y planetek (důsledek TAMTO).

Jelikož se jedná o lineární regresi (line = přímka), tento vztah umíme zapsat rovnicí lineární funkce y=ax+b a nakreslit jako přímku v souřadnicové ose x, y.

Pokud bychom použili například vyjádření y = x/2 + 2, tak bychom předpovídali, že pokud člověk hodí 6 míčků (x = 6), s velkou pravděpodobností trefí 5 planetek (y = 6/2 + 2 = 5).

 

Ale jak najdeme právě tu správnou přímku, která nám dá nejpřesnější předpověď?

Uděláme to, co meteorologové. Podíváme se na předchozí situace, tzn. jak přesně házeli reální lidé, zakreslíme si to do grafu a tomu přizpůsobíme přímku, pomocí které umíme předpovídat budoucnost.

No dobře, zakreslíme body, ale jak víme, která přímka je lepší? Zda první, druhá, třetí nebo nějaká jiná?

Tady si už tak snadno nepomůžeme a musí nastoupit výpočetní technika. Počítač zkoušením různých možností měří vzdálenosti bodů od přímky po y-ové ose. Všechny tyto vzdálenosti sečte a výsledek porovná se součtem vzdáleností pro další přímku.

A takto stále dokola, dokud nenajde tu přímku, která je od bodů vzdálena nejméně. A podle ní dokážeme předpovídat budoucnost i my.

Pokud budeme počítat vzdálenost bodu na y-ové ose od přímky, tak pro body, které jsou pod ní, nám vyjdou záporná čísla. My však potřebujeme vzdálenosti od přímky sčítat, takže potřebujeme kladná čísla. Co s těmito rozdíly musím při výpočtu před sčítaním udělat?

 

VTIP:

Je to nelineární vzor s odlehlými hodnotami, ale z nějakého důvodu jsem s daty velmi spokojen.

Prejsť na odkaz