ต้องการสร้างโมเดลหาความสัมพันธ์ระหว่างอัตราผลตอบแทนกับปริมาณการซื้อขาย แต่ติดปัญหา Perfect Multicollinearity

สวัสดีครับ

ตามชื่อกระทู้ คือ ผมต้องการสร้างโมเดลวิเคราะห์ความสัมพันธ์ระหว่างอัตราผลตอบแทนกับปริมาณการซื้อขายของนักลงทุนแต่ละประเภท เพื่อทดสอบว่า ปริมาณการซื้อขายของนักลงทุนแต่ละประเภทส่งผลต่ออัตราผลตอบแทนหรือไม่

โมเดลที่คิดไว้คร่าวๆ ประมาณนี้

Return = a + ar(1) + (x1)I + (x2)F + (x3)L + (x4)P + e
a = ค่าคงที่
ar = auto regressive lag 1
x1-x4 = ค่าพารามิเตอร์
I = นักลงทุนสถาบัน
F = นักลงทุนต่างชาติ
L = นักลงทุนในประเทศ
P = บัญชีบริษัทหลักทรัพย์
e = ค่าคาดเคลื่อน

แต่จากที่ไปสำรวจข้อมูลมา ผมขอแสดงตัวอย่างจากเว็บ set นะครับ
>> https://marketdata.set.or.th/mkt/investortype.do?language=th&country=TH

จะเห็นว่าปริมาณการซื้อขายสุทธิมันมีผลรวมเท่ากับ 0 หรือ มองอีกแง่คือ มันรวมเป็น 100%

ซึ่งตามทฤษฎีถ้าเราเอาตัวแปรทั้งหมดใส่เข้าไปในโมเดล มันจะทำให้เกิดปัญหา Perfect Multicollinearity ส่งผลให้ประมาณค่าพาริเตอร์ไม่ได้

วิธีที่ผมพอจะนึกออก คือ แยก Run ทีละตัว แต่ใจจริงผมอยากรันเป็น Multiple Regression

จึงอยากถามว่า

1. พอจะมีวิธีแก้ปัญหาเรื่องนี้นอกจากต้องตัดตัวแปรบางตัวออกหรือไม่ครับ

2. ผมไปศึกษาเปเปอร์ต่างประเทศ เค้าบอกว่า ข้อมูลปริมาณการซื้อขายสุทธิมันไม่ stationary (เค้าใช้ปริมาณการซื้อขายสุทธิรวม ไม่ได้แยกประเภทนักลงทุน) เค้าเลยแก้ด้วยการแปลงปริมาณการซื้อขายสุทธิ จาก Net Vol = (Vol Buy - Vol Sell)  เป็น Net Vol = (Vol Buy - Vol Sell) / (Vol Buy + Vol Sell)  ถ้าผมคำนวณ Vol แบบนี้ ก็จะทำให้ผลรวมมันไม่เท่ากับ 0  ผมจะใช้วิธีนี้ในการแก้ปัญหา Perfect Multicollinearity ได้รึเปล่าครับ

ขอบคุณล่วงหน้าสำหรับคำชี้แนะครับ

/ปล. ขออนุญาติแท็กเศรษฐศาสตร์และการเงินเพิ่มเข้าไป เผื่อมีนักวิจัยที่มีความเชี่ยวชาญด้านการทำวิจัยผ่านมาเห็นครับ
แสดงความคิดเห็น
โปรดศึกษาและยอมรับนโยบายข้อมูลส่วนบุคคลก่อนเริ่มใช้งาน อ่านเพิ่มเติมได้ที่นี่