Рэгрэсійная аналіз узаемасувязяў паміж зменнымі
Рэгрэсійная ўяўляе сабой метад аналізу дадзеных выкарыстоўваецца для прагназавання дыяпазону лікавых значэнняў (таксама званых бесперапынных значэнняў), улічваючы канкрэтны набор дадзеных. Напрыклад, рэгрэсія можа быць выкарыстана для прагназавання кошту прадукту або паслуг, з улікам іншых зменных.
Рэгрэсія выкарыстоўваецца ў розных галінах для бізнесу і маркетынгавага планавання, фінансавага прагназавання, экалагічнага мадэлявання і аналізу тэндэнцый.
Рэгрэс Vs. класіфікацыя
Рэгрэсія і класіфікацыі з'яўляюцца метады здабычы дадзеных , якія выкарыстоўваюцца для вырашэння падобных задач, але яны часта блытаюць. Яны выкарыстоўваюцца ў аналізе прадказанні, але рэгрэсія выкарыстоўваюцца для прагназавання лікавага або бесперапыннага значэння ў той час класіфікацыя прызначае дадзеныя на асобныя катэгорыі.
Напрыклад, рэгрэсія будзе выкарыстоўвацца для прагназавання кошту жылля, грунтуючыся на сваім месцы, квадратныя футы, цана, калі апошні прадаў, кошт падобных дамоў, і іншых фактараў. Класіфікацыя будзе ў парадку, калі вы хочаце, каб замест таго, каб арганізаваць дома на катэгорыі, такія як Walkability, памеру партыі ці ўзровень злачыннасці.
Віды Рэгрэсійная метадаў
Самая простая і старая форма рэгрэсіі лінейная рэгрэсія выкарыстоўваецца для ацэнкі адносіны паміж дзвюма зменнымі. Гэты метад выкарыстоўвае матэматычную формулу прамой (у = х + Ь). Прасцей кажучы, гэта проста азначае, што, улічваючы графік з Y і X-восі, суадносіны паміж Х і Y ўяўляе сабой прамую лінію з невялікімі выкідамі. Напрыклад, можна меркаваць, што, улічваючы павелічэнне колькасці насельніцтва, вытворчасць прадуктаў харчавання будзе расці з той жа хуткасцю - гэта патрабуе моцнай, лінейная залежнасць паміж гэтымі двума лічбамі. Для таго, каб візуалізаваць гэта, разгледзім графік, на якім па восі Y, адсочвае павелічэнне папуляцыі, а па восі Х адсочвае вытворчасць харчовых прадуктаў. Па меры таго як узрастае значэнне Y, значэнне Х будзе павялічвацца з той жа хуткасцю, што робіць адносіны паміж імі па прамой лініі.
Ўдасканаленыя метады, такія як множныя рэгрэсія, прагназаваць адносіны паміж некалькімі зменнымі - напрыклад, існуе карэляцыя паміж узроўнем даходаў, адукацыяй і дзе адзін аддае перавагу жыць? Даданне большай колькасці зменных значна павышае складанасць прагназавання. Ёсць некалькі тыпаў метадаў множнага Рэгрэсійная аналізу, уключаючы стандартныя, іерархічнага, setwise і ступеніста, кожны са сваім уласным дадаткам.
На гэтым этапе важна зразумець , што мы спрабуем прадказаць (залежную або прагназуемы пераменны) і дадзеныя , якія мы выкарыстоўваем , каб зрабіць прадказанне (незалежнымі або прэдыктар). У нашым прыкладзе, мы хочам прадказаць месца , дзе адзін выбірае жыць (прагназуемая зменная) дадзены даход і адукацыя (абодва прэдыктар).
- Стандартны Рэгрэсійная разглядае ўсе прэдыктар адначасова. Да прыкладу 1) якая ўзаемасувязь паміж прыбыткам і адукацыяй (прэдыктар) і выбарам наваколляў (прагноз); і 2) у якой ступені кожны з асобных прэдыктар ўклад у гэтыя адносіны?
- Пакрокавая множная рэгрэсія адказвае зусім іншае пытанне. Алгарытм пакрокавай рэгрэсіі будзе аналізаваць, якія прэдыктар лепш за ўсё выкарыстоўваць для прагназавання выбару горада - гэта азначае, што прыступкавае мадэль ацэньвае парадак важнасці прэдыктар, а затым выбірае адпаведнае падмноства. Гэты тып Рэгрэсійная задачы выкарыстоўвае «крокі» для распрацоўкі раўнання рэгрэсіі. Улічваючы гэты тып рэгрэсіі, усе прадказальнікі не могуць нават з'явіцца ў канчатковым раўнанні рэгрэсіі.
- Іерархічная рэгрэсіі, як ступеніста, гэта паслядоўны працэс, але предикторные зменныя ўводзяцца ў мадэль у загадзя агавораным парадку , вызначаным загадзя, г.зн. алгарытм не ўтрымлівае ўбудаваны набор раўнанняў для вызначэння парадку , у якім увядзіце прадказальнік. Гэта часцей за ўсё, калі чалавек стварае раўнанне рэгрэсіі мае экспертныя веды ў галіне выкарыстання.
- Setwise рэгрэсіі таксама аналагічны ступеніста , але аналіз мноства зменных , а не асобных зменных.