Pagkiling ng aliging kinaltas

Sa estadistika, ang pagkiling ng aliging kinaltas (Ingles: omitted variable bias o OVB) ay nangyayari kapag kulang sa isang modelong estadistika ang isa o higit pang nauukol na aligin. Nagreresulta ang pagkiling sa pagpapahiwatig ng modelo ng epekto ng mga nawawalang aligin sa tinatantyang epekto ng mga kasama na aligin.

Mas partikular, ang OVB ay ang lumilitaw na pagkiling sa mga pagtatantya ng mga parametro sa isang regresyong analisis, kung hindi tama ang ipinapalagay na espesipikasyon sa pagkakaltas ng isang independiyenteng aligin na nauugnay sa dependiyenteng aligin at isa o higit pa sa mga kasamang independiyenteng aligin.

Sa linyar na balitugnay baguhin

Kawatasan baguhin

Ipagpalagay na ang tunay na kaugnayang sanhi-at-epekto ay ibinibigay ng

 

kung saan may mga parametrong a, b, c, dependiyenteng aliging y, mga independiyenteng aliging x at z, at takay ng mali na u. Nais nating malaman ang epekto ng x mismo sa y (ibig sabihin, nais nating kunin isang ang pagtatantya ng b).

Dapat totoo ang dalawang kondisyon para magkaroon ng pagkiling ng aliging kinaltas o OVB sa linyar na balitugnay:

  • ang kinaltas na aligin ay dapat na isang determinante ng dependiyenteng aligin (ibig sabihin, hindi dapat sero ang tunay na katuwang ng balitugnay); at
  • dapat magkakaugnay ang kinaltas na aligin sa isang independiyenteng aligin na tinukoy sa balitugnay (iyon ay, hindi dapat katumbas sa zero ang cov(z,x)).

Ipagpalagay natin na kinaltas ang z mula sa balitugnay, at ipagpalagay na ibinigay ang kaugnayan ng x at z ng

 

na may mga parametrong d, f at takay ng mali na e. Kung pinalitan ng pangalawang ekwasyon ang unang ekwasyon, makukuha ang

 

Kung isinasagawa ang isang balitugnay ng y sa x lamang, tinatantya ang huling ekwasyon na ito, at ang katuwang ng balitugnay sa x ay, sa katotohanan, isang pagtatantya ng (b + cf), na hindi lamang ibinibigay ang pagtatantya ng ninanais na direktang epekto ng x sa y (na kung saan ay b), kundi ang kabuuan nito at ang indirektang epekto (magparami ang epekto f ng x sa z ng epekto c ng z sa y). Kaya sa pamamagitan ng pagkaltas ng aliging z mula sa balitugnay, natantya natin ang sanghango (buong deribatibo) ng y tungod sa x sa halip na ang bahagihang hango tungod sa x. Naiiba ang mga ito kung parehong di-sero ang c at f.

Parehong nakapaloob ang direksyon at lawak ng pagkiling sa cf, dahil b ang epekto na hinahangad ngunit samantalang tinatanya ng balitugnay ang b + cf. Ang lawak ng pagkiling ay ang ganap na halaga ng cf, at pataas ang direksyon ng pagkiling (patungo sa mas positibo o mas kaunting negatibong halaga) kung cf > 0 (kung kapareho ang direksyon ng satugnay ng x at y sa direksyon ng x at z), at pababa kung hindi man.

Detalyadong pagsusuri baguhin

Bilang halimbawa, isaalang-alang ang isang modelong linyar ng anyo

 

kung saan

  • xi ang isang 1 × p na tuganong hilera ng p naindependiyenteng aligin na naobserbahan noong oras i o para sa ika-i na kalahok;
  • β ang isang p × 1 na tuganong tudling ng mga hindi maoobserbahang mga parametro (ang mga katuwang tugon ng dependiyenteng aligin sa bawat isa sa mga p na independiyenteng aligin sa xi) na tatantyahin;
  • zi ang isang bilangin at ang halaga ng isa pang independiyenteng aligin na naobserbahan noong oras i o para sa ika-i na kalahok;
  • δ ang isang bilangin at isang hindi maoobserbahang parametro (ang katuwang tugon ng dependiyenteng aligin sa zi) na tatantyahin;
  • ui ang hindi maoobserbahan na takay ng mali na nagaganap sa oras i o para sa ika-i na kalahok; ito ay isang di-maoobserbahang katuparan ng isang alisagang aligin na may halagang ekspektasyon na 0 (kundisyonal sa xi at zi);
  • yi ang obserbasyon ng dependiyenteng aligin noong oras i o para sa ika-i na kalahok.

Kinokolekta natin ang mga obserbasyon ng lahat ng mga aligin na sinubskribong i = 1, ..., n, at pinapatong ang mga ito isa sa ibaba ng isa pa, upang makuha ang baskagang X at ang mga tuganong Y, Z, at U:

 

at

 

Kung tinatanggal ang independiyenteng aligin z mula sa balitugnay, ibibigay ang mga tinantyang halaga ng mga parameterong tugon ng iba pang mga independiyenteng aligin ng karaniwang pagkalkula ng kababaang partirami,

 

(kung saan nangangahulugan ang "primong" notasyon ng paglipat ng isang baskagan at pagbabaligtad ng baskagan ang suberskribong -1).

Kung ipapalit ang Y batay sa ipinalagay na modelong linyar,

 

Sa pagkukuha ng ekspektasyon,sero ang kontribusyon ng huling takay; sumusunod ito sa palagay na hindi satugnay ang U sa mga balitugnaying X. Sa pagpapayak sa mga natitirang tayak:

 

Ang ikalawang takay pagkatapos ng tanda ng tumbas ay ang pagkiling ng aliging kinaltas sa kasong ito, na di-sero kung satugnay ang tinanggal na aliging z sa alinman sa mga kasamang aligin sa baskagang X (ibig sabihin, kung hindi katumbas ng X′Z ang isang tugano ng sero). Tandaan na "ipinapaliwanag" ng xi ang pagkiling na katumbas ng binigatang bahagi ng zi.

Epekto sa ordinaryong kababaang partirami baguhin

Nakasaad sa teoryang Gauss-Markov na nagkakaroon ang mga balitugnayang modelo na tumutupad sa mga palagay ng klasikong balitugnayang linyar ng pinaka matalab, linyar at walang pagkiling na tantyahin. Sa ordinaryong kababaang partirami (Ingles: ordinary least squares o OLS), ang may-katuturang palagay ng modelo ng klasikong balitugnayang linyar ay hindi satugnay ang takay ng mali sa mga balitugnayin.

Lumalabag ang pagkakaroon ng pagkiling ng aliging kinaltas sa partikular na palagay na ito. Nagiging sanhi ang paglabag ng tantyahin ng OLS na maging makiling at inkonsistente. Depende ang direksyon ng pagkiling sa mga tantyahin pati na rin ang kaalig ng mga balitugnayin at ang mga tinanggal na aligin. Hahantong ang isang positibong kaalig ng kinaltas na aligin na may parehong isang baligtugnayin at ang dependiyenteng aligin sa pagtatantya ng OLS ng nasamang katuwang ng mga balitugnayin na maging mas malaki kaysa sa tunay na halaga ng katuwang na iyon. Makikita ang epekto na ito sa pamamagitan ng pagkuha ng ekspektasyon ng parametro, tulad ng ipinapakita sa nakaraang seksyon.

Tingnan din baguhin

Mga sanggunian baguhin

  • Introductory Econometrics: Using Monte Carlo Simulation with Microsoft Excel. Cambridge University Press. 2006.
  • "The Phantom Menace: Omitted Variable Bias in Econometric Research". {{cite journal}}: Cite journal requires |journal= (tulong)
  • Econometric Analysis. Macmillan. 1993.
  • Introductory Econometrics: A Modern Approach. Cengage Learning. 2013.