ความแตกต่างระหว่างสหสัมพันธ์และการถดถอย
ทั้ง Correlation และ Regression เป็นเครื่องมือทางสถิติที่จัดการกับตัวแปรสองตัวหรือมากกว่า แม้ว่าทั้งสองจะเกี่ยวข้องกับหัวข้อเดียวกัน แต่ก็มีความแตกต่างระหว่างทั้งสอง ความแตกต่างระหว่างทั้งสองอธิบายไว้ด้านล่าง
ความหมาย
คำว่าสหสัมพันธ์กับการอ้างอิงถึงตัวแปรสองตัวขึ้นไปแสดงว่าตัวแปรมีความสัมพันธ์กันไม่ทางใดก็ทางหนึ่ง การวิเคราะห์สหสัมพันธ์กำหนดว่าความสัมพันธ์ระหว่างสองตัวแปรมีอยู่จริงหรือไม่และความแข็งแกร่งของความสัมพันธ์ หากตัวแปรสองตัว x (อิสระ) และ y (ขึ้นอยู่กับ) มีความสัมพันธ์กันมากจนเกิดการแปรผันของขนาดของตัวแปรอิสระโดยการแปรผันของขนาดของตัวแปรตามก็จะกล่าวว่าตัวแปรทั้งสองมีความสัมพันธ์กัน
ความสัมพันธ์สามารถเป็นเชิงเส้นหรือไม่เป็นเชิงเส้น ความสัมพันธ์เชิงเส้นคือตัวแปรที่มีความสัมพันธ์กันมากซึ่งการเปลี่ยนแปลงค่าของตัวแปรหนึ่งจะทำให้ค่าของตัวแปรอื่นเปลี่ยนแปลงอย่างสม่ำเสมอ ในความสัมพันธ์เชิงเส้นจุดที่กระจัดกระจายที่เกี่ยวข้องกับค่าตามลำดับของตัวแปรตามและตัวแปรอิสระจะรวมกลุ่มรอบ ๆ เส้นตรงที่ไม่ใช่แนวนอนแม้ว่าเส้นตรงแนวนอนจะบ่งบอกถึงความสัมพันธ์เชิงเส้นระหว่างตัวแปรหากเส้นตรงสามารถทำได้ เชื่อมต่อ จุดที่แสดงถึงตัวแปร
ในทางกลับกันการวิเคราะห์การถดถอยจะใช้ ข้อมูล เพื่อกำหนดความสัมพันธ์ทางคณิตศาสตร์ระหว่างตัวแปรที่สามารถใช้เพื่อกำหนดค่าของตัวแปรตามที่เกี่ยวข้องกับค่าใด ๆ ของตัวแปรอิสระ
การวางแนวทางสถิติ
ความสัมพันธ์เกี่ยวข้องกับการวัดความแข็งแกร่งของการเชื่อมโยงหรือความรุนแรงของความสัมพันธ์โดยที่ การถดถอย เกี่ยวข้องกับการทำนายค่าของตัวแปรตามที่สัมพันธ์กับค่าที่ทราบของตัวแปรอิสระ สามารถอธิบายได้ด้วยสูตรต่อไปนี้
ค่าสัมประสิทธิ์สหสัมพันธ์หรือสหสัมพันธ์สัมประสิทธิ์ (r) ระหว่าง x & y พบได้ด้วยสูตรต่อไปนี้
r = ความแปรปรวนร่วม (x, y) /σx.σy, cov (x, y) = Σxy / n - (Σx / n) (Σy / n), σx & σyคือค่าเบี่ยงเบนมาตรฐานของ x และ y ตามลำดับและ - 1< r 0, then correlation coefficient between x and y = correlation coefficient between u and v.
ค่าสัมประสิทธิ์สหสัมพันธ์ r เป็นจำนวนที่บริสุทธิ์และไม่ขึ้นกับหน่วยการวัด ดังนั้นถ้า x คือความสูง (นิ้ว) และ y คือน้ำหนัก (ปอนด์) ของคนในพื้นที่ใดพื้นที่หนึ่งดังนั้น r จะไม่เป็นนิ้วหรือเป็นปอนด์ แต่เป็นเพียงตัวเลข
สมการถดถอยพบได้ด้วยสูตรต่อไปนี้
สมการถดถอยของ y บน x (เพื่อหาค่าประมาณของ y) คือ y - y ′= byx (x-x‾), byx เรียกว่าสัมประสิทธิ์การถดถอยของ y บน x สมการถดถอยของ x บน y (เพื่อหาค่าประมาณของ x) คือ x - x ′= bxy (y-y‾) bxy เรียกว่าสัมประสิทธิ์การถดถอยของ x ต่อ y
การวิเคราะห์สหสัมพันธ์ไม่ถือว่าการพึ่งพาตัวแปรใด ๆ กับตัวแปรอื่นและไม่ได้พยายามหาความสัมพันธ์ระหว่างทั้งสอง เพียงแค่ประมาณระดับความสัมพันธ์ระหว่างตัวแปร กล่าวอีกนัยหนึ่งการวิเคราะห์สหสัมพันธ์จะทดสอบการพึ่งพาซึ่งกันและกันของตัวแปร ในทางกลับกันการวิเคราะห์การถดถอยอธิบายการพึ่งพาตัวแปรตามหรือ การตอบสนอง ตัวแปรในตัวแปรอิสระหรือตัวแปรอธิบาย / s การวิเคราะห์การถดถอยถือว่ามีความสัมพันธ์เชิงสาเหตุทางเดียวระหว่างตัวแปรอธิบายและตัวแปรตอบสนองและไม่ได้คำนึงถึงว่าความสัมพันธ์เชิงสาเหตุนั้นเป็นบวกหรือลบ สำหรับความสัมพันธ์ทั้งค่าของตัวแปรตามและตัวแปรอิสระเป็นแบบสุ่ม แต่สำหรับค่าการถดถอยของตัวแปรอิสระไม่จำเป็นต้องสุ่ม
สรุป
1. การวิเคราะห์สหสัมพันธ์เป็นการทดสอบการพึ่งพาระหว่างสองตัวแปร การวิเคราะห์การถดถอยให้สูตรทางคณิตศาสตร์เพื่อกำหนดค่าของตัวแปรตามที่เกี่ยวข้องกับค่าของตัวแปรอิสระ / s
2. ค่าสัมประสิทธิ์สหสัมพันธ์ไม่ขึ้นอยู่กับการเลือกแหล่งกำเนิดและมาตราส่วน แต่ค่าสัมประสิทธิ์การถดถอยไม่เป็นเช่นนั้น
สำหรับความสัมพันธ์ค่าของตัวแปรทั้งสองจะต้องเป็นแบบสุ่ม แต่ไม่เป็นเช่นนั้นสำหรับค่าสัมประสิทธิ์การถดถอย
บรรณานุกรม
1. Das, N. G. , (1998), วิธีการทางสถิติ, กัลกัตตา
2. Correlation & Regression ดูได้ที่ www.le.ac.uk/bl/gat/virtualfc/stats/regression
3. Regression & Correlation ดูได้ที่ www.abyss.uoregon.edu