เมื่อผมลองเอา Machine Learning ทำนายผลสลากกินแบ่ง



ขอ เน้น ย้ำๆ ก่อน

สลากกินแบ่ง เป็นการพนัน
เลขหวย เป็นเลขสุ่ม ไม่สามารถทำนายได้
เคยมีหลายเคส ที่มีการใช้ ML ทำนาย Lotto และสรุปว่ามันสุ่มจริง (หวยไทยไม่รู้)



ขอตรง ว้าวๆ ก่อน
1. เอาเลขไปเลย งวด 1 ธ.ค. 66 ML บอกผมว่า ออก 743951 ครับ
2. เลขนี้ ผมรันออกมาตั้งแต่วันที่ 17 แต่ในแอพเป๋าตังค์ ไม่มีเลขนี้ให้ซื้อแล้ว #เสียใจ



เครื่องมือ ที่ผมใช้
- ภาษา Python
- แพคเกจ ScikitLearn
- ใช้ 14 Algorithm มาลองเปรียบเทียบกัน
- เลขที่พิมพ์ เป็นเลขที่ได้จากวิธีที่ให้ Error น้อยที่สุด แต่ก็ Error เป็น 100%
- ข้อมูลเลขสลากย้อนหลัง ใช้ 33 ปี จากเว็บ myhora 



อ่ะ เนื้อหายาวๆ ละครับ
ผมอยู่ว่าง ไม่มีอะไรทำ จะซื้อหวยเล่นมั่วๆ ซั่วๆ ตามเลขขูดจากต้นไม้ก็ขัดกับความเป็นนักวิทยาศาสตร์
ก็เลย เอาวะ ลองเล่นๆ ดู เน้นนะครับ ลองเล่นๆ
ผมรีวิวดูละ มีเปเปอร์ที่เคยรัน แล้ว มี 2 เคส
1. รันแล้ว ได้ข้อสรุปว่า Lotto เป็น เลขสุ่มจริงๆ รันยังไงก็ไม่มี Pattern
2. รันแล้ว พยายามจำกัดขอบเขต ว่าต้องซื้อกี่ใบ จะมีโอกาสได้กำไรสูงสุด ซึ่ง คนลองเค้าโชคดี หวังรางวัลที่ 2 แต่ได้รางวัลที่ 1 แต่ซื้อเป็นล้านนะครับถึงถูก

อ่ะ เนื่องจาก ผมก็เล่นกับ ML อยู่
ก็เลยลอง เอามารัน แบบง่ายๆ โง่ๆ เลย
เอา วันที่ เดือน ปี แล้วก็ เลขงวด 
วันที่ เดือน ปี นี่คงเป็นเรื่องปกติ
ส่วนเลขงวดนี่ คือ นับ 1 คืองวดวันที่ 16 เดือน 10 ปี 2533
แล้วนับต่อมาเรื่อยๆ ครับ งวดล่าสุดคือ 792

เอาจริงๆ ข้อมูลมันไม่มีความเกี่ยวข้องอะไรกันเลยแหละ แต่อยากเล่นเฉยๆ (ผมย้ำบ่อยมาก ผลผิดนะ)

ใช้ Supervised Machine Learning เป็นวิธีมาตรฐานในการรัน แบ่งข้อมูลเป็น 90% - 10% (Train - Test)
Algorithm ที่เลือก ก็จะเป็นพวก Regression ที่ไม่ได้เขียนเองนะครับ สำเร็จรูป ดึงมาจาก scikitlearn เลย
- Nearest Neighbors
- Gaussian Process
- Naive-Bayes
- Random Forest
- Decision Tree
รันแล้ว ดู Error จาก MAPE เป็นหลัก

วิธีที่ให้ Error น้อยสุด คือกลุ่มพวก Naive-Bayes ซึ่ง Error อยู่แถวๆ 100% นะครับ
วิธีอื่น Error เป็น 100ล้าน%

ตัวเลขที่วิธีกลุ่ม Naive-Bayes ดีดออกมา คือ 743951
บางวิธีดีดตัวเลขติดลบออกมา
บางวิธีใส่ Int ดันให้ผลเป็น Float

ผล จากวิธีอื่นๆ ผล (Error, ชื่อวิธี)
001864 (98%, BNB)
316056 (544%, BR)
743951 (26-81%, NB)
625700 (286%, GB)
061063 (14%, GP)
653059 (200%, KNN)
219880 (154%, MLP)
212646 (540%, PLS)
567132 (129%, RF)
394384 (200 ล้าน%, SGD)
559529 (355%, SVM)

ก็ ...ขอสรุป ตามนั้นครับ
มา ลุ้น กัน
แก้ไขข้อความเมื่อ
แสดงความคิดเห็น
โปรดศึกษาและยอมรับนโยบายข้อมูลส่วนบุคคลก่อนเริ่มใช้งาน อ่านเพิ่มเติมได้ที่นี่