สวัสดีครับ
ตามชื่อกระทู้ คือ ผมต้องการสร้างโมเดลวิเคราะห์ความสัมพันธ์ระหว่างอัตราผลตอบแทนกับปริมาณการซื้อขายของนักลงทุนแต่ละประเภท เพื่อทดสอบว่า ปริมาณการซื้อขายของนักลงทุนแต่ละประเภทส่งผลต่ออัตราผลตอบแทนหรือไม่
โมเดลที่คิดไว้คร่าวๆ ประมาณนี้
Return = a + ar(1) + (x
1)I + (x
2)F + (x
3)L + (x
4)P + e
a = ค่าคงที่
ar = auto regressive lag 1
x1-x4 = ค่าพารามิเตอร์
I = นักลงทุนสถาบัน
F = นักลงทุนต่างชาติ
L = นักลงทุนในประเทศ
P = บัญชีบริษัทหลักทรัพย์
e = ค่าคาดเคลื่อน
แต่จากที่ไปสำรวจข้อมูลมา ผมขอแสดงตัวอย่างจากเว็บ set นะครับ
>>
https://marketdata.set.or.th/mkt/investortype.do?language=th&country=TH
จะเห็นว่าปริมาณการซื้อขายสุทธิมันมีผลรวมเท่ากับ 0 หรือ มองอีกแง่คือ มันรวมเป็น 100%
ซึ่งตามทฤษฎีถ้าเราเอาตัวแปรทั้งหมดใส่เข้าไปในโมเดล มันจะทำให้เกิดปัญหา Perfect Multicollinearity ส่งผลให้ประมาณค่าพาริเตอร์ไม่ได้
วิธีที่ผมพอจะนึกออก คือ แยก Run ทีละตัว แต่ใจจริงผมอยากรันเป็น Multiple Regression
จึงอยากถามว่า
1. พอจะมีวิธีแก้ปัญหาเรื่องนี้นอกจากต้องตัดตัวแปรบางตัวออกหรือไม่ครับ
2. ผมไปศึกษาเปเปอร์ต่างประเทศ เค้าบอกว่า ข้อมูลปริมาณการซื้อขายสุทธิมันไม่ stationary (เค้าใช้ปริมาณการซื้อขายสุทธิรวม ไม่ได้แยกประเภทนักลงทุน) เค้าเลยแก้ด้วยการแปลงปริมาณการซื้อขายสุทธิ จาก Net Vol = (Vol Buy - Vol Sell) เป็น Net Vol = (Vol Buy - Vol Sell) / (Vol Buy + Vol Sell) ถ้าผมคำนวณ Vol แบบนี้ ก็จะทำให้ผลรวมมันไม่เท่ากับ 0 ผมจะใช้วิธีนี้ในการแก้ปัญหา Perfect Multicollinearity ได้รึเปล่าครับ
ขอบคุณล่วงหน้าสำหรับคำชี้แนะครับ
/ปล. ขออนุญาติแท็กเศรษฐศาสตร์และการเงินเพิ่มเข้าไป เผื่อมีนักวิจัยที่มีความเชี่ยวชาญด้านการทำวิจัยผ่านมาเห็นครับ
ต้องการสร้างโมเดลหาความสัมพันธ์ระหว่างอัตราผลตอบแทนกับปริมาณการซื้อขาย แต่ติดปัญหา Perfect Multicollinearity
ตามชื่อกระทู้ คือ ผมต้องการสร้างโมเดลวิเคราะห์ความสัมพันธ์ระหว่างอัตราผลตอบแทนกับปริมาณการซื้อขายของนักลงทุนแต่ละประเภท เพื่อทดสอบว่า ปริมาณการซื้อขายของนักลงทุนแต่ละประเภทส่งผลต่ออัตราผลตอบแทนหรือไม่
โมเดลที่คิดไว้คร่าวๆ ประมาณนี้
Return = a + ar(1) + (x1)I + (x2)F + (x3)L + (x4)P + e
a = ค่าคงที่
ar = auto regressive lag 1
x1-x4 = ค่าพารามิเตอร์
I = นักลงทุนสถาบัน
F = นักลงทุนต่างชาติ
L = นักลงทุนในประเทศ
P = บัญชีบริษัทหลักทรัพย์
e = ค่าคาดเคลื่อน
แต่จากที่ไปสำรวจข้อมูลมา ผมขอแสดงตัวอย่างจากเว็บ set นะครับ
>> https://marketdata.set.or.th/mkt/investortype.do?language=th&country=TH
จะเห็นว่าปริมาณการซื้อขายสุทธิมันมีผลรวมเท่ากับ 0 หรือ มองอีกแง่คือ มันรวมเป็น 100%
ซึ่งตามทฤษฎีถ้าเราเอาตัวแปรทั้งหมดใส่เข้าไปในโมเดล มันจะทำให้เกิดปัญหา Perfect Multicollinearity ส่งผลให้ประมาณค่าพาริเตอร์ไม่ได้
วิธีที่ผมพอจะนึกออก คือ แยก Run ทีละตัว แต่ใจจริงผมอยากรันเป็น Multiple Regression
จึงอยากถามว่า
1. พอจะมีวิธีแก้ปัญหาเรื่องนี้นอกจากต้องตัดตัวแปรบางตัวออกหรือไม่ครับ
2. ผมไปศึกษาเปเปอร์ต่างประเทศ เค้าบอกว่า ข้อมูลปริมาณการซื้อขายสุทธิมันไม่ stationary (เค้าใช้ปริมาณการซื้อขายสุทธิรวม ไม่ได้แยกประเภทนักลงทุน) เค้าเลยแก้ด้วยการแปลงปริมาณการซื้อขายสุทธิ จาก Net Vol = (Vol Buy - Vol Sell) เป็น Net Vol = (Vol Buy - Vol Sell) / (Vol Buy + Vol Sell) ถ้าผมคำนวณ Vol แบบนี้ ก็จะทำให้ผลรวมมันไม่เท่ากับ 0 ผมจะใช้วิธีนี้ในการแก้ปัญหา Perfect Multicollinearity ได้รึเปล่าครับ
ขอบคุณล่วงหน้าสำหรับคำชี้แนะครับ
/ปล. ขออนุญาติแท็กเศรษฐศาสตร์และการเงินเพิ่มเข้าไป เผื่อมีนักวิจัยที่มีความเชี่ยวชาญด้านการทำวิจัยผ่านมาเห็นครับ