ว่าด้วย -PLS-SEM กับปัญหาในการนำไปใช้ (1) โดย Fast Forward Statistics 18/6/2561
https://ppantip.com/topic/37782021
ขอนำข้อเขียนใน Facebook ของเจ้าของหน้า Fast Forward Statistics มาเผยแพร่ครับ ส่วนรูปประกอบเป็นของท่านผู้เขียน
==
สัญญากันไว้ว่าจะมาคุยกันเรื่องการใช้ Partial Least Square-SEM (PLS-SEM) ว่ามีปัญหาอะไรในการนำไปใช้ ถึงกับมี Editors ใน Journal ออกมาปฏิเสธบทความวิจัยนั้นทั้นที หรือ ที่เรียกว่า 'Desk Reject" เมื่อมีการใช้ PLS-SEM ในการวิเคราะห์
https://www.facebook.com/FastForwardStat/posts/176632366341108
Fast Forward Statistics
https://www.facebook.com/FastForwardStat/
Editor ของ Journal of Operations Management (JOM) ซึ่งเป็นวารสารระดับ A+ ทางด้าน Business /Management ได้เรียกวิธี PLS-SEM ว่า เป็น 'statistical and methodological myths and urban legends" หรือ ที่เรียกย่อๆ ว่า "SMMULs"
.
ปล: SMMULs หมายถึง หลักความเชื่อที่มีพื้นฐานมาจากหลักการทางสถิติ แต่เมื่อเวลาผ่านไป หลักการเหล่านั้นจะถูกลืมและกลืนด้วยแนวปฏิบัติที่สังคมได้ให้การยอมรับ บอกกล่าวกันต่อมา โดยการสอนต่อๆกันหรือการยอมรับในวงการวิชาการว่าทำได้
.
พูดง่ายๆ คือ เหมือนกับที่นักศึกษา PhD ถูกสอนหรือบอกว่าทำสิ่งนั้นได้ เป็นสิ่งที่ถูกต้องทั้งๆ ที่มันผิดและทำไม่ได้ สำหรับวิจัย อันนี้ครับ เราเรียกว่า "SMMULs" และ การใช้ PLS-SEM ก็จัดอยู่ในกลุ่มประเภทนี้เช่นเดียวกัน
.
ลองมาดูว่าวิธี PLS-SEM ทำไมถึงถูกปฏิเสธจาก Editors กัน อะไรที่ไม่ใช่
.
.
1) ปัญหา Optimality ของ PLS weights
.
ทางปฏิบัติ PLS-SEM จะมีการวิเคราะห์ 2 ขั้นตอน ดังนี้ คือ ตัวแปรสังเกตได้จะถูกนำมารวมกันเป็น Composite construct โดยวิธี Weighted sum และในขั้นตอนต่อไป Composite constructs ที่สร้างขึ้น ก็จะถูกนำไปวิเคราะห์ Regression โดยใช้วิธี Null hypothesis significance testing โดยเปรียบเทียบค่าของสัดส่วนสัมประสิทธิ์ กับ standard error ที่ได้จากการทำ Bootstrap กับค่า t-distribution
.
ประเด็น คือ การคำนวนค่าน้ำหนัก (Weight) ในการสร้าง Composite construct เหล่านั้นได้มาอย่างไร และวิธีการนี้ Valid หรือไม่ เมื่อเทียบกับวิธีปกติทีคุณภาพของโมเดลการวัด (Measurement model) จะดูจากการตรวจสอบค่า Correlations ระหว่าง Items กับ Composites construct ที่สร้างมาจาก Items ที่เกี่ยวข้อง โดยดูจากค่า Composite reliability (CR) และ Average variance explained (AVE)
.
จริงๆ แล้ววิธีในการ Weight ของ Items สร้างให้เป็น Composite construct มีหลายวิธีด้วยกัน คำถามในแง่ของหลักการทางสถิติจึงถูกหยิบยกขึ้นมาว่า PLS-SEM มีเป้าหมายในการ Weighting system ที่กำกวมมาก คำอธิบายที่ PLS-SEM พยายามอธิบายถึงวิธีในการ Weight Items บอกเพียงว่า เป็นการเลือกรูปแบบการ Weight ที่มีเป้าหมายหลัก คือ ทำให้ค่า R-square ในการวิเคราะห์ Regression ในโมเดลนั้นๆ มีค่าสูงสุด
.
แต่จะบอกได้หรือไม่ว่า ค่า R-square ที่สูงสุดนั้นเป็นการทำ Weighting system ที่เหมาะสมแล้ว ในความจริงก็ยังคงไม่สามารถอธิบายได้
.
มากกว่านั้นนักวิชาการด้านสถิติก็ได้แย้งว่า จริงๆ วิธีที่ PLS-SEM ใช้ในการ Weight นั้นก็อาจยังไม่ได้ค่าที่เหมาะสมที่สุดจริงๆ
.
มีการวิเคราะห์ Simulation และเปรียบเทียบกับ Optimal weighting ของ PLS ผลปรากฎว่าค่า R-square ที่ได้จากการทำ Simulation เทียบกับที่ได้จาก PLS-SEM แตกต่างกันถึง 118%
.
โดยสรุปแล้วการ weight ค่าน้ำหนักของ Items ใน PLS-SEM นั้นไม่ได้ทำให้ค่า Reliability มีค่ามากขึ้น ในทางตรงข้ามวิธีที่ PLS-SEM ที่ใช้ในการ Weight เมื่อพิจารณาจากข้อมูลเชิงประจักษ์ที่มีการทำซ้ำ พบว่าทำให้ค่านำ้หนักของ Items กับ Composite construct มีความไม่เสถียร ทำให้ค่า Correlation ระหว่าง Constructs มีค่ามากขึ้นเกินจริง ซึ่งไม่เป็นการสร้างข้อได้เปรียบใดใดของการใช้วิธี PLS-SEM
.
นี่คือปัญหา ของ PLS-SEM อันแรก คือ "Weighting" ที่ถูกนำมาพูดถึงและเป็นประเด็นที่มีความสำคัญมาก
.
สรุปวันนี้ที่เล่าสู่กันฟัง คือ ภาคแรกที่เกี่ยวข้องกับ Optimal Weighting system ใน PLS-SEM ยังมีอีกประเด็นที่สำคัญ คือ เรื่องของ Methodological problem ที่จะเก็บไว้เล่าต่อในวันพุธ แล้วพบกัน
..
..
Reference
.
Rönkkö, M., McIntosh, C. N., Antonakis, J., & Edwards, J. R. (2016). Partial least squares path modeling: Time for some serious second thoughts. Journal of Operations Management, 47, 9-27.
ว่าด้วย -PLS-SEM กับปัญหาในการนำไปใช้ (1) โดย Fast Forward Statistics 18/6/2561 สรายุทธ กันหลง
ว่าด้วย -PLS-SEM กับปัญหาในการนำไปใช้ (1) โดย Fast Forward Statistics 18/6/2561
https://ppantip.com/topic/37782021
ขอนำข้อเขียนใน Facebook ของเจ้าของหน้า Fast Forward Statistics มาเผยแพร่ครับ ส่วนรูปประกอบเป็นของท่านผู้เขียน
==
สัญญากันไว้ว่าจะมาคุยกันเรื่องการใช้ Partial Least Square-SEM (PLS-SEM) ว่ามีปัญหาอะไรในการนำไปใช้ ถึงกับมี Editors ใน Journal ออกมาปฏิเสธบทความวิจัยนั้นทั้นที หรือ ที่เรียกว่า 'Desk Reject" เมื่อมีการใช้ PLS-SEM ในการวิเคราะห์
https://www.facebook.com/FastForwardStat/posts/176632366341108
Fast Forward Statistics
https://www.facebook.com/FastForwardStat/
Editor ของ Journal of Operations Management (JOM) ซึ่งเป็นวารสารระดับ A+ ทางด้าน Business /Management ได้เรียกวิธี PLS-SEM ว่า เป็น 'statistical and methodological myths and urban legends" หรือ ที่เรียกย่อๆ ว่า "SMMULs"
.
ปล: SMMULs หมายถึง หลักความเชื่อที่มีพื้นฐานมาจากหลักการทางสถิติ แต่เมื่อเวลาผ่านไป หลักการเหล่านั้นจะถูกลืมและกลืนด้วยแนวปฏิบัติที่สังคมได้ให้การยอมรับ บอกกล่าวกันต่อมา โดยการสอนต่อๆกันหรือการยอมรับในวงการวิชาการว่าทำได้
.
พูดง่ายๆ คือ เหมือนกับที่นักศึกษา PhD ถูกสอนหรือบอกว่าทำสิ่งนั้นได้ เป็นสิ่งที่ถูกต้องทั้งๆ ที่มันผิดและทำไม่ได้ สำหรับวิจัย อันนี้ครับ เราเรียกว่า "SMMULs" และ การใช้ PLS-SEM ก็จัดอยู่ในกลุ่มประเภทนี้เช่นเดียวกัน
.
ลองมาดูว่าวิธี PLS-SEM ทำไมถึงถูกปฏิเสธจาก Editors กัน อะไรที่ไม่ใช่
.
.
1) ปัญหา Optimality ของ PLS weights
.
ทางปฏิบัติ PLS-SEM จะมีการวิเคราะห์ 2 ขั้นตอน ดังนี้ คือ ตัวแปรสังเกตได้จะถูกนำมารวมกันเป็น Composite construct โดยวิธี Weighted sum และในขั้นตอนต่อไป Composite constructs ที่สร้างขึ้น ก็จะถูกนำไปวิเคราะห์ Regression โดยใช้วิธี Null hypothesis significance testing โดยเปรียบเทียบค่าของสัดส่วนสัมประสิทธิ์ กับ standard error ที่ได้จากการทำ Bootstrap กับค่า t-distribution
.
ประเด็น คือ การคำนวนค่าน้ำหนัก (Weight) ในการสร้าง Composite construct เหล่านั้นได้มาอย่างไร และวิธีการนี้ Valid หรือไม่ เมื่อเทียบกับวิธีปกติทีคุณภาพของโมเดลการวัด (Measurement model) จะดูจากการตรวจสอบค่า Correlations ระหว่าง Items กับ Composites construct ที่สร้างมาจาก Items ที่เกี่ยวข้อง โดยดูจากค่า Composite reliability (CR) และ Average variance explained (AVE)
.
จริงๆ แล้ววิธีในการ Weight ของ Items สร้างให้เป็น Composite construct มีหลายวิธีด้วยกัน คำถามในแง่ของหลักการทางสถิติจึงถูกหยิบยกขึ้นมาว่า PLS-SEM มีเป้าหมายในการ Weighting system ที่กำกวมมาก คำอธิบายที่ PLS-SEM พยายามอธิบายถึงวิธีในการ Weight Items บอกเพียงว่า เป็นการเลือกรูปแบบการ Weight ที่มีเป้าหมายหลัก คือ ทำให้ค่า R-square ในการวิเคราะห์ Regression ในโมเดลนั้นๆ มีค่าสูงสุด
.
แต่จะบอกได้หรือไม่ว่า ค่า R-square ที่สูงสุดนั้นเป็นการทำ Weighting system ที่เหมาะสมแล้ว ในความจริงก็ยังคงไม่สามารถอธิบายได้
.
มากกว่านั้นนักวิชาการด้านสถิติก็ได้แย้งว่า จริงๆ วิธีที่ PLS-SEM ใช้ในการ Weight นั้นก็อาจยังไม่ได้ค่าที่เหมาะสมที่สุดจริงๆ
.
มีการวิเคราะห์ Simulation และเปรียบเทียบกับ Optimal weighting ของ PLS ผลปรากฎว่าค่า R-square ที่ได้จากการทำ Simulation เทียบกับที่ได้จาก PLS-SEM แตกต่างกันถึง 118%
.
โดยสรุปแล้วการ weight ค่าน้ำหนักของ Items ใน PLS-SEM นั้นไม่ได้ทำให้ค่า Reliability มีค่ามากขึ้น ในทางตรงข้ามวิธีที่ PLS-SEM ที่ใช้ในการ Weight เมื่อพิจารณาจากข้อมูลเชิงประจักษ์ที่มีการทำซ้ำ พบว่าทำให้ค่านำ้หนักของ Items กับ Composite construct มีความไม่เสถียร ทำให้ค่า Correlation ระหว่าง Constructs มีค่ามากขึ้นเกินจริง ซึ่งไม่เป็นการสร้างข้อได้เปรียบใดใดของการใช้วิธี PLS-SEM
.
นี่คือปัญหา ของ PLS-SEM อันแรก คือ "Weighting" ที่ถูกนำมาพูดถึงและเป็นประเด็นที่มีความสำคัญมาก
.
สรุปวันนี้ที่เล่าสู่กันฟัง คือ ภาคแรกที่เกี่ยวข้องกับ Optimal Weighting system ใน PLS-SEM ยังมีอีกประเด็นที่สำคัญ คือ เรื่องของ Methodological problem ที่จะเก็บไว้เล่าต่อในวันพุธ แล้วพบกัน
..
..
Reference
.
Rönkkö, M., McIntosh, C. N., Antonakis, J., & Edwards, J. R. (2016). Partial least squares path modeling: Time for some serious second thoughts. Journal of Operations Management, 47, 9-27.