Koepisyenteng korelasyon ni Pearson
Sa estadistika, ang Koepisyenteng Korelasyon ni Pearson (KKP), Koepisyenteng Pearson produkto-sandaling korelasyon (KPPSK),[1] o Pearson's r at karaniwang tinutukoy na r) ay isang sukat ng korelasyon (dependiyensiyang linyar) sa pagitan ng dalawang mga bariabulong X at Y na nagbibigay ng halaga sa pagitan ng +1 at -1 ng inklusibo. Ito ay malawak na ginagamit sa mga agham bilang isang sukat ng lakas ng dependiyensiyang linyar(pagsalalay) sa pagitan ng dalawang mga bariabulo. Ito ay binuo ni Karl Pearson mula sa katulad ngunit kaunting ibang ideya na ipinakilala ni Francis Galton noong mga 1880.[2][3]
Depinisyon
baguhinAng koepisyenteng korelasyon ni Pearson sa pagitan ng dalawang bariabulo ay inilalarawan bilang ang kobariansa ng dalawang mga baribulong hinati ng produkto ng mga pamantayang paglihis ng mga ito. Ang anyo ng depinisyon ay kinasasangkutan ng sandaling produkto na ang mean(unang sandali sa orihin) ng produkto ng isinaayos na mean na mga randomang bariabulo.
Para sa isang populasyon
baguhinAng koepisyenteng korelasyon ni Pearson kapag nilalapat sa isang populasyon ay karaniwang kinakatawan ng letrang Griyengong ρ (rho) at maaaring tukuyin bilang koepisyenteng korelasyon ng populasyon o koepisyenteng populasyong korelasyong Pearson. Ang pormula para sa ρ ay:
Para sa isang sampol
baguhinAng koepisyenteng korelasyon ni Pearson kapag nilalapat sa isang sampol ay karaniwang kinakatawan ng letrang r at maaaring tukuyin bilang koepisyenteng korelasyon ng sampol o ang koepisyenteng sampol na korelasyong Pearson. Maaaring makamit ang isang pormula para sa r sa pamamagitan ng paghahali ng mga pagtatantiya ng mga kobariansa at bariansa batay sa sampol na estadistikal sa pormula sa itaas. Ang pormula para sa r ay:
Ang isang katumbas na ekspresyon ay nagbibigay ng koepisyenteng korelasyon bilang mean ng mga produkto ng mga pamantayang iskor. Batay sa sampol na estadistikal ng pinares na datos (Xi, Yi), ang koepisyenteng korelasyon ng sampol ay
kung saan ang
ang respektibong pamantayang iskor, mean ng sampol at pamantayang paglihis ng sampol.
Mga sanggunian
baguhin- ↑ "The human disease network", Albert Barabasi et al., Plos.org
- ↑ J. L. Rodgers and W. A. Nicewander. Thirteen ways to look at the correlation coefficient. The American Statistician, 42(1):59–66, February 1988.
- ↑ Stigler, Stephen M. (1989). "Francis Galton's Account of the Invention of Correlation". Statistical Science. 4 (2): 73–79. doi:10.1214/ss/1177012580. JSTOR 2245329.
{{cite journal}}
: CS1 maint: date auto-translated (link)