Hvernig skýri ég muninn á RPCA og PCA?


svara 1:

Edit: Doh, ég tók bara eftir því að þú gætir verið að biðja um öfluga PCA en ekki Regression Component Regression (einnig þekkt sem Regression PCA). Hér er svar við því síðarnefnda fyrir það sem það er þess virði.

Stundum eru hópar aðlagabreytna (kovariata) kollínearir á meðan á aðhvarf stendur (sjá aðra spurningu um fjölkyrningafæð) Þetta þýðir að aðföng sem mjög spá hvort öðru felur í sér einhvers konar offramboð frá framleiðslusjónarmiði: ef þú getur spáð fyrir um þetta

yy

vel með

xx

, Þú þarft ekki annað eintak af

xx

.

Því miður, aðhvarf OLS sér þetta og reynir að bæta upp fyrir það með því að framselja svipaðar skyldur til aðlögunar aðlaganna. Í dæminu hér að ofan, hugsaðu um hversu mörg stig eru til sem eru næstum best (í skilningi minnstu reitanna).

Óendanlega, ekki satt? Hvaða flugvél sem fer í gegnum punkta, óháð snúningi um græna punkta: Ímyndaðu þér eins konar ás sem er festur í loftinu og liggur í gegnum græna punkta, og síðan er rauða planinu snúið á hann.

Til að gera illt verra geta endanlega aðhvarfsvægi, sem í raun stjórna halla flugvélarinnar, verið mjög mismunandi vegna loka truflunar gagnanna. Þetta bendir til þess að líkanið sé óstöðugt.

Svo hver er aðal leiðin til að sameina samsvarandi inntaksbreytur? Jæja, hér er það sem Regression PCA mun gera:

Í fyrsta lagi er PCA framkvæmt á aðföngunum (bláu punktunum), þ.e. blá lína er að finna í XZ planinu sem bláu punktunum er varpað á (svo að heildar vörpun fjarlægð sé lágmörkuð). Þessi lína virkar nú sem nýr ás - þú nefnir það

bb

,

og upprunalega afturför vandamálið er nú leyst innan viðmiðunarramma

byb-y

, línuleg breytu með breytu.

Á vissan hátt látum við PCA finna þessa hópa af svipuðum breytum frekar en að láta OLS vera með þá eðlislægu hættu á óstöðugleika sem lýst er hér að ofan.

Að lokum, til að endurskipuleggja afturför að upprunalegu

xzyx-z-y

Rýmið, óháð því hvaða aðhvarfsstuðull var gefin afleiddu breytunni b (hér er hún 0,5), er nokkuð skipt eftir vægi PCA-unnu ásins (þannig að endanlegar RPCA-þyngdir eru

(0.25,0.25)(0.25, 0.25)

).