สวัสดีค่ะ เพื่อนๆ สมาชิก ppantip.com ชื่อ “แป้ง” นะคะ จากครั้งก่อนที่แป้งได้เขียนกระทู้เรื่องราวเกี่ยวกับงานของแป้ง ที่เป็น Data Scientist ตาม link นี้เลยค่ะ >>>
https://ppantip.com/topic/36702940
ซึ่งจากกระแส Big Data ที่กำลังมาแรง บวกกับเทคโนโลยี Artificial Intelligence (AI) และ Machine Learning (ML) กำลังเข้ามามีบทบาทในการใช้ชีวิตของเรานั้น วันนี้แป้งจะมาแชร์ประสบการณ์การทำงานกับ Big Data ของแป้งนะคะ และมี Real Case ที่แป้งได้ไปดูงาน Big Data & Analytics Innovation Summit ณ เมือง Shanghai ประเทศจีน เมื่อวันที่ 6-7 กันยายน ที่ผ่านมา นำมาเล่าสู่กันฟังค่ะ
ก่อนอื่น เนื่องจากลักษณะงานของแป้งจะเป็นเชิงธุรกิจ และแป้งต้องการเขียนให้ทุกคนสามารถเข้าในมุมมองการใช้งาน Big Data และ Data Science ได้ง่ายๆ แป้งจะซ้อนเทคนิคไว้แบบนี้ (เทคนิคค่ะ
[Spoil] คลิกเพื่อดูข้อความที่ซ่อนไว้ แบบนี้ ) ในงานสัมมนานี้ จะมีผู้เชี่ยวชาญจากหลายๆ บริษัท มาอธิบายว่าเขาใช้ Big Data เข้ามาเป็นกลยุทธในการดำเนินธุรกิจอย่างไรบ้าง ซึ่งในการเขียนกระทู้นี้ จะเป็นมุมมองที่แป้งมอง ผ่านประสบการณ์การเป็น Data Scientist และแปลออกมาเป็นขั้นตอน และวิเคราะห์ Algorithm ที่เขาใช้ให้อ่านกันคร่าวๆ นะคะ
AI คือ อะไร แท้จริงแล้ว มันก็คือเครื่องมือเครื่องนึง จากชุดคำสั่งที่เราใส่เข้าไป ตัวของมันเอง ไม่มีได้มีรูปแบบแน่ชัดว่าจะเป็นหุ่นยนต์ รถ หรือคอมพิวเตอร์ แท้จริงแล้ว มันคือ “การกระทำ” ค่ะ เช่น อ่านเสียง แปลอักษร วิเคราะห์ลายนิ้วมือ เข้าใจภาษามนุษย์ แนะนำสินค้า เกมส์ หรือแม้กระทั่งประมวลผลกฎหมาย
พอพูดเรื่อง AI ทีไร ทุกคนจะนึกไปถึง IT หรือ คอมพิวเตอร์ทุกทีเลย ซึ่งจริงๆ แล้วนะ สมองของ AI คือ Machine Learning ค่ะ โดยเจ้า ML นี้ คิด การออกแบบชุดคำสั่ง เพื่อเรียนรู้ข้อมูล ดังนั้น การจะสร้าง ML จึงต้องมีข้อมูลให้เรียนรู้ ส่วนที่เขาชอบพูดถึง Deep Learning กันนั้น แท้จริงมัน คือ การประมวลผล หรือ Algorithm ประเภทหนึ่ง ของ ML ค่ะ จริงๆ แล้ว มันมีหลาย Algorithm มากๆ นะ แล้วแต่กรณีว่าเราจะเลือกใช้อันไหน ซึ่งเจ้า ML เนี้ย มันสามารถนำมาใช้งานได้หลากหลายรูปแบบเลย ตราบใดก็ตามที่เรามีข้อมูลให้เล่น ไม่ว่าจะเป็นธุรกิจประเภทไหนก็ตาม และไม่จำเป็นต้องสร้างเป็นอุปกรณ์เทคนิค หรือหุ่นยนต์ใดๆ ก็ได้
หากท่านใดอยากเข้าใจ Algorithm ต่างๆ หรือวิธีแก้ปัญหาโดยใช้ Machine Learning เบื้องต้น สามารถไปอ่านได้จากบทความนี้ค่ะ
https://www.coraline.co.th/single-post/2017/09/01/5-Algorithms
มาทำความเข้าใจการลำดับการใช้งาน Big Data กันเถิด มันไม่ใช่แค่ว่าเราเก็บข้อมูลเยอะๆ นะคะ Big Data ที่แท้จริง คือ เจ้า 4 Vs นี้
1. Volume หมายถึงขนาดใหญ่ เช่น ระยะเวลาในการเก็บข้อมูลนาน 3 ปี เป็นต้น
2. Velocity หมายถึงความเร็วในการใช้งาน เพราะเรากำลังใช้ข้อมูลมาเป็นกลยุทธในธุรกิจ มันจึงจำเป็นต้องประมวลผลออกมาให้รวดเร็ว
3. Variety หมายถึงความหลากหลาย ในการวิเคราะห์ปัญหาหนึ่ง อาจต้องใช้ข้อมูลจากหลายแหล่ง เช่น อินเตอร์เน็ต ข้อมูลจดบันทึก ข้อมูลทางบัญชี หรือข้อมูลจากถังข้อมูลเก่า เป็นต้น
4. Veracity หมายถึงความไม่แน่นอนของข้อมูล เนื่องจากขนาดใหญ่ และมีแหล่งที่มาจากหลายที่ จึงจำเป็นต้องมีการคัดกรองข้อมูล ซึ่งเป็นขั้นตอนที่ละเอียด และนานที่สุดของการทำ Data Analysis
การจะพัฒนา Big Data ให้ครบทุกองค์ประกอบ จึงต้องอาศัย Data Science and Analysis เข้ามาเกี่ยวข้อง โดยขั้นตอนต่างๆ มีดังนี้ค่ะ
1. Business Understanding คือ การเข้าใจปัญหาภายในองค์กร และระบุเป้าหมายของทำ Big Data ให้ได้
2. Data Understanding คือ ระบุข้อมูลที่เกี่ยวข้องกับปัญหา
3. Data Preparation คือ การคัดกรอง หรือ Clean ข้อมูลให้เรียบร้อย รวมไปถึงเข้าใจที่มาที่ไปของข้อมูล
4. Modeling คือ การเลือกใช้สมการ วิธีการแก้ปัญหา หรือ Machine Learning Algorithm ให้เหมาะสมกับงาน
5. Evaluate คือ การเลือก Model ที่เหมาะสมที่สุด โดยอาจดูจากความแม่นยำ เวลาในการใช้งาน Model หรือความยากของการใช้งาน
6. Deployment คือ การนำ Model ที่ถูกเลือก ไปใช้งานจริงในระบบ และมีการ Track หรือ รายงานผลตลอดเพื่อวิเคราะห์ และ Monitor ความเปลี่ยนแปลงของระบบ ว่าเป็นไปตามที่ Business ตั้งไว้ตั้งแต่ต้นหรือไม่
สำหรับ ปัญหาที่ทำให้การพัฒนา Big Data ไม่สำเร็จนั้น ส่วนใหญ่มากจากความไม่เข้าใจในกลไกลกันทำงานค่ะ 5 สาเหตุหลักๆ ได้แก่
1. ยังไม่เห็นถึงประโยชน์ของการใช้ Big Data
2. ไม่สามารถระบุ Target ของโปรเจคได้ จึงทำให้ไม่สามารถตัดสินใจ และเข้าใจแนวทางในการวิเคราะห์ได้
3. มีข้อมูล และมีแนวคิดจะใช้ข้อมูล แต่ยังไม่รู้จักวิธีการวิเคราะห์ หรือไม่สามารถออกแบบวิธีการใช้ Machine Learning ได้
4. มองว่าเรื่อง Big Data คือ กลุ่ม IT
5. รับสมัครพนักงานในตำแหน่ง Data Scientist และ Data Analyst มาแล้ว แต่ไม่รู้จะใช้งานอย่างไร
อ่านเพิ่มเติมได้ที่นี้เลยค่ะ >>>
https://m.facebook.com/story.php?story_fbid=295521407613349&id=220981965067294
(((มี Real Cases ต่อด้านล่างนะคะ)))
ขอฝาก เพจเกี่ยวกับ Big Data and Data Science for Business เอาไว้ด้วยนะคะ สามารถติดตามข่าวสาร และอ่านบทความต่างๆ ได้ค่ะ
https://www.facebook.com/coralineltd/
มาดูกันสิ ว่าต่างชาติเขาใช้ Big Data ทำอะไร
ซึ่งจากกระแส Big Data ที่กำลังมาแรง บวกกับเทคโนโลยี Artificial Intelligence (AI) และ Machine Learning (ML) กำลังเข้ามามีบทบาทในการใช้ชีวิตของเรานั้น วันนี้แป้งจะมาแชร์ประสบการณ์การทำงานกับ Big Data ของแป้งนะคะ และมี Real Case ที่แป้งได้ไปดูงาน Big Data & Analytics Innovation Summit ณ เมือง Shanghai ประเทศจีน เมื่อวันที่ 6-7 กันยายน ที่ผ่านมา นำมาเล่าสู่กันฟังค่ะ
ก่อนอื่น เนื่องจากลักษณะงานของแป้งจะเป็นเชิงธุรกิจ และแป้งต้องการเขียนให้ทุกคนสามารถเข้าในมุมมองการใช้งาน Big Data และ Data Science ได้ง่ายๆ แป้งจะซ้อนเทคนิคไว้แบบนี้ (เทคนิคค่ะ [Spoil] คลิกเพื่อดูข้อความที่ซ่อนไว้ ) ในงานสัมมนานี้ จะมีผู้เชี่ยวชาญจากหลายๆ บริษัท มาอธิบายว่าเขาใช้ Big Data เข้ามาเป็นกลยุทธในการดำเนินธุรกิจอย่างไรบ้าง ซึ่งในการเขียนกระทู้นี้ จะเป็นมุมมองที่แป้งมอง ผ่านประสบการณ์การเป็น Data Scientist และแปลออกมาเป็นขั้นตอน และวิเคราะห์ Algorithm ที่เขาใช้ให้อ่านกันคร่าวๆ นะคะ
AI คือ อะไร แท้จริงแล้ว มันก็คือเครื่องมือเครื่องนึง จากชุดคำสั่งที่เราใส่เข้าไป ตัวของมันเอง ไม่มีได้มีรูปแบบแน่ชัดว่าจะเป็นหุ่นยนต์ รถ หรือคอมพิวเตอร์ แท้จริงแล้ว มันคือ “การกระทำ” ค่ะ เช่น อ่านเสียง แปลอักษร วิเคราะห์ลายนิ้วมือ เข้าใจภาษามนุษย์ แนะนำสินค้า เกมส์ หรือแม้กระทั่งประมวลผลกฎหมาย
พอพูดเรื่อง AI ทีไร ทุกคนจะนึกไปถึง IT หรือ คอมพิวเตอร์ทุกทีเลย ซึ่งจริงๆ แล้วนะ สมองของ AI คือ Machine Learning ค่ะ โดยเจ้า ML นี้ คิด การออกแบบชุดคำสั่ง เพื่อเรียนรู้ข้อมูล ดังนั้น การจะสร้าง ML จึงต้องมีข้อมูลให้เรียนรู้ ส่วนที่เขาชอบพูดถึง Deep Learning กันนั้น แท้จริงมัน คือ การประมวลผล หรือ Algorithm ประเภทหนึ่ง ของ ML ค่ะ จริงๆ แล้ว มันมีหลาย Algorithm มากๆ นะ แล้วแต่กรณีว่าเราจะเลือกใช้อันไหน ซึ่งเจ้า ML เนี้ย มันสามารถนำมาใช้งานได้หลากหลายรูปแบบเลย ตราบใดก็ตามที่เรามีข้อมูลให้เล่น ไม่ว่าจะเป็นธุรกิจประเภทไหนก็ตาม และไม่จำเป็นต้องสร้างเป็นอุปกรณ์เทคนิค หรือหุ่นยนต์ใดๆ ก็ได้
หากท่านใดอยากเข้าใจ Algorithm ต่างๆ หรือวิธีแก้ปัญหาโดยใช้ Machine Learning เบื้องต้น สามารถไปอ่านได้จากบทความนี้ค่ะ
https://www.coraline.co.th/single-post/2017/09/01/5-Algorithms
มาทำความเข้าใจการลำดับการใช้งาน Big Data กันเถิด มันไม่ใช่แค่ว่าเราเก็บข้อมูลเยอะๆ นะคะ Big Data ที่แท้จริง คือ เจ้า 4 Vs นี้
1. Volume หมายถึงขนาดใหญ่ เช่น ระยะเวลาในการเก็บข้อมูลนาน 3 ปี เป็นต้น
2. Velocity หมายถึงความเร็วในการใช้งาน เพราะเรากำลังใช้ข้อมูลมาเป็นกลยุทธในธุรกิจ มันจึงจำเป็นต้องประมวลผลออกมาให้รวดเร็ว
3. Variety หมายถึงความหลากหลาย ในการวิเคราะห์ปัญหาหนึ่ง อาจต้องใช้ข้อมูลจากหลายแหล่ง เช่น อินเตอร์เน็ต ข้อมูลจดบันทึก ข้อมูลทางบัญชี หรือข้อมูลจากถังข้อมูลเก่า เป็นต้น
4. Veracity หมายถึงความไม่แน่นอนของข้อมูล เนื่องจากขนาดใหญ่ และมีแหล่งที่มาจากหลายที่ จึงจำเป็นต้องมีการคัดกรองข้อมูล ซึ่งเป็นขั้นตอนที่ละเอียด และนานที่สุดของการทำ Data Analysis
การจะพัฒนา Big Data ให้ครบทุกองค์ประกอบ จึงต้องอาศัย Data Science and Analysis เข้ามาเกี่ยวข้อง โดยขั้นตอนต่างๆ มีดังนี้ค่ะ
1. Business Understanding คือ การเข้าใจปัญหาภายในองค์กร และระบุเป้าหมายของทำ Big Data ให้ได้
2. Data Understanding คือ ระบุข้อมูลที่เกี่ยวข้องกับปัญหา
3. Data Preparation คือ การคัดกรอง หรือ Clean ข้อมูลให้เรียบร้อย รวมไปถึงเข้าใจที่มาที่ไปของข้อมูล
4. Modeling คือ การเลือกใช้สมการ วิธีการแก้ปัญหา หรือ Machine Learning Algorithm ให้เหมาะสมกับงาน
5. Evaluate คือ การเลือก Model ที่เหมาะสมที่สุด โดยอาจดูจากความแม่นยำ เวลาในการใช้งาน Model หรือความยากของการใช้งาน
6. Deployment คือ การนำ Model ที่ถูกเลือก ไปใช้งานจริงในระบบ และมีการ Track หรือ รายงานผลตลอดเพื่อวิเคราะห์ และ Monitor ความเปลี่ยนแปลงของระบบ ว่าเป็นไปตามที่ Business ตั้งไว้ตั้งแต่ต้นหรือไม่
สำหรับ ปัญหาที่ทำให้การพัฒนา Big Data ไม่สำเร็จนั้น ส่วนใหญ่มากจากความไม่เข้าใจในกลไกลกันทำงานค่ะ 5 สาเหตุหลักๆ ได้แก่
1. ยังไม่เห็นถึงประโยชน์ของการใช้ Big Data
2. ไม่สามารถระบุ Target ของโปรเจคได้ จึงทำให้ไม่สามารถตัดสินใจ และเข้าใจแนวทางในการวิเคราะห์ได้
3. มีข้อมูล และมีแนวคิดจะใช้ข้อมูล แต่ยังไม่รู้จักวิธีการวิเคราะห์ หรือไม่สามารถออกแบบวิธีการใช้ Machine Learning ได้
4. มองว่าเรื่อง Big Data คือ กลุ่ม IT
5. รับสมัครพนักงานในตำแหน่ง Data Scientist และ Data Analyst มาแล้ว แต่ไม่รู้จะใช้งานอย่างไร
อ่านเพิ่มเติมได้ที่นี้เลยค่ะ >>> https://m.facebook.com/story.php?story_fbid=295521407613349&id=220981965067294
(((มี Real Cases ต่อด้านล่างนะคะ)))
ขอฝาก เพจเกี่ยวกับ Big Data and Data Science for Business เอาไว้ด้วยนะคะ สามารถติดตามข่าวสาร และอ่านบทความต่างๆ ได้ค่ะ https://www.facebook.com/coralineltd/