ตอนแรก :
http://ppantip.com/topic/34907795
เกิดอะไรขึ้นกับอัลฟ่าโกะ
ปัญหาที่กวนใจคนดูคือ มันเกิดอะไรขึ้น?
หัวหน้าทีมพัฒนาอัลฟ่าโกะ เดวิด ซิลเวอร์ อยู่ในงานแถลงข่าวหลังจบเกมด้วย แต่เขาไม่ได้อธิบายว่าปัญหาเกิดจากอะไร
ซิลเวอร์ และฮัสซาบิสบอกว่า เขาไม่มีคำตอบจนกว่าพวกเขาจะกลับไปยังสำนักงานในอังกฤษเพื่อวิเคราะห์รายละเอียด ดังนั้นพวกเราก็ต้องรอเช่นกัน
การเดาที่อาจจะเข้าเค้า
เราไม่แน่ใจว่าเกิดอะไรขึ้น แต่เราพอจะทดลองเดาดูได้ เราเคยเห็นการเดินหมากแบบนี้มาก่อน จากโปรแกรมโกะอื่นๆ เหมือนว่ามันเป็น ข้อบกพร่องโดยพื้นฐานของ AI ที่ใช้ Monte Carlo Tree Search
อัลฟ่าโกะนั้นเหนือกว่า AI อื่นๆอย่างทาบไม่ติด แต่มันยังใช้ Monte Carlo ในบางส่วนของการวิเคราะห์หมาก
ทฤษฏีของเราก็คือเมื่อมันเจอตาเดินที่ยอดเยี่ยม เช่น W78 ซึ่งแค่ "พอใช้ได้" มันทำให้คอมพิวเตอร์มองข้ามมันไป สาเหตุเป็นเพราะในบางครั้งมันมีแค่การเดินรูปแบบเดียวเท่านั้นที่ทำให้ เทะสึจินี้ได้ผล และการเดินในรูปแบบอื่นๆทั้งหมดล้วนล้มเหลว
เว้นแต่การเดินหมากทุกรูปแบบจะโดนนำมาวิเคราะห์ มันเป็นไปได้ที่คอมพิวเตอร์(หรือมนุษย์)จะมองข้ามมันไป
นั่นหมายถึงเทคนิคโดยประมาณที่คอมพิวเตอร์ใช้(และได้ผลเกือบทุกครั้ง) จะเห็นหนทางมากมายที่มันจะชนะ แต่ไม่เห็นเข็มในกองหญ้าที่จะนำมันไม่สู่ความพ่ายแพ้
เป็นบ้า
เราได้เห็นพฤติกรรมแบบนี้บ่อยครั้งเมื่อเล่นกับ AI ที่ใช้ Monte Carlo
เมื่อเราเล่น เทะสึจิที่คอมพิวเตอร์ขาดไม่ถึง มันเริ่มต้นเดินแบบประหลาดๆ และทำเกมพัง มันไม่เกิดขั้นทุกครั้ง แต่บ่อยพอที่เราจะสรุปได้ว่ามันเป็นบ้า เราไม่รู้ว่ามันทำไมเกิดขึ้นและหวังว่าทีมอัลฟ่าโกะหรือผู้อ่านที่คุ้นเคยกับกรณีนี้จะนำเสนอความคิด
[หมายเหตุผู้แปล : ในช่องคอมเมนต์มีการถกเถียงกรณีนี้ค่อนข้างกว้างขวาง ผมจะสรุปการถกเถียงนี้ในตอนท้าย]
ชนะน้อยๆ หรือ แพ้หนักๆ
อย่างที่ได้อภิปรายไป สิ่งที่คอมพิวเตอร์พยายามทำคือการพยายามสร้างโอกาสชนะสูงสุด ชนะขาดหรือแพ้ขาดนั้นไม่อยู่ในการพิจารณา
นี่นำไปสู่พฤติกรรมที่คอมพิวเตอร์มัก "ชนะน้อยๆ หรือแพ้หนักๆ" เมื่อมันตามอยู่ มันจะเล่นเสี่ยงขึ้นเพื่อไล่ให้ทัน บางครั้งเสี่ยงแบบบ้าคลั่งซึ่งมากพอจะทำให้มันแพ้กลางกระดานไปเลย สำหรับกรณีทั่วไป นี่เป็นสิ่งที่เราต้องการ คอมพิวเตอร์จะไปยอมแพ้ไปแบบเงียบๆอย่างที่มนุษย์ทำ
ส่วนการเดินแย่ๆ เป็นไปได้ที่จะเกิดจากปรากฏการณ์ขอบฟ้า (Horizon Effect)
เมื่อโอกาสในการชนะของคอมพิวเตอร์ลดลงอย่างเฉียบพลัน หลังจากคู่ต่อสู้เดินหมากที่มันคาดไม่ถึง มันก็ไม่เหลือหนทางใดๆที่เชื่อถือได้อีกว่ามันจะชนะ เมื่อ AI ที่ใช้ Monte Carlo เจอสถานการณ์แบบนี้ มันจะเริ่มเดินหมากที่ไม่ช่วยอะไร หรือหมากที่จะช่วยให้มันชนะถ้าฝ่ายตรงข้ามรับพลาด
ทฤษฏีนี้อาจจะผิดหมดก็ได้ แต่มันอิงบนประสบการณ์จาก AI โกะตัวอื่นๆ
ผมไม่แน่ใจว่านี่ใช้กับ อัลฟ่าโกะได้หรือไม่ ถ้าคุณมีคำอธิบายที่ดีกว่า โปรดนำเสนอมันออกมา
ลีเซดอลจะทำได้อีกครั้งหรือไม่?
แน่นอนว่าเป็นไปได้ แต่ยากมาก
เราต้องการสถานการณ์จำเพาะ เพื่อสร้างเงื่อนไขแบบนี้ขึ้นอีกครั้ง และสถานการณ์ลักษณะนี้ ไม่ได้ปรากฏขึ้นทุกเกม
อัลฟ่าโกะ อาจทนต่อปัญหาลักษณะนี้ได้ดีกว่าเอไอเก่าๆ เพราะมันใช้ Policy Network ในการตัดสินใจด้วย แต่ต้องไม่ลืมว่า Policy Network พลาดในการประเมินคุณค่าของขาว 78 อาจจะเพราะมันเป็นการเดินที่ไม่ปกตินัก เราต้องรอดูว่าอะไรจะเกิดขึ้นในวันอังคาร ถ้าจะมีใครที่สร้างปรากฏการณ์นี้ซ้ำได้ มันก็ต้องเป็นลี เซดอล
[บทวิเคราะห์จากผู้อ่าน(รวมๆ)]
Monte Carlo (MC) พยายามเลือกตาเดินที่มีโอกาสชนะสูงสุด เมื่อโอกาสชนะมันต่ำลงฮวบฮาบ มันจะเริ่มเล่นเสี่ยงขึ้น โดย "ฝันหวาน" ว่าฝ่ายตรงข้ามจะพลาด การเล่นเสี่ยงๆแบบนี้ทำให้พฤติกรรมการเดินออกไปในทางที่มั่ว เช่นในตาที่ 177 ถ้ามนุษย์เดินที่จุดอื่น มันจะจับขาวกินแล้วพลิกเป็นฝ่ายชนะ ในสายตามนุษย์ หมากที่ 178 นั้นชัดเสียจนตาที่ 177 ไม่เข้าท่าเอาเสียเลย แต่ในสายตาของคอมพิวเตอร์ มันคาดหวังโอกาสที่มนุษย์จะพลาด มากกว่าความจำเป็นที่จะเก็บ "จุดขู่" ไว้เล่น โคะในภายหลัง
กรณีหมากที่ 78 นั้น เนื่องจากโกะมีความเป็นไปได้ว่าหมากที่ดูเหมือนแย่ๆ แต่ตามด้วยชุดหมากที่ดี สามารถเปลี่ยนดุลของอำนาจได้ นั่นคือสิ่งที่หมาก 78 ทำ หมาก 78 นั้นโดนอัลฟ่าโกะมองข้าม คัดทิ้งไม่พิจารณา จนกระทั่งความน่าจะเป็นพลิกข้ามมาฝั่งลีแล้วนั่นแหละ เมื่ออัลฟ่าโกะหันกลับมาพิจารณามันอย่างจริงจัง ตอนนั้นดุลของเกมก็พลิกไปแล้ว
เมื่อสิ่งนี้เกิดขึ้นอย่างฉับพลัน ความสามารถในการพยากรณ์ของมันก็ตกฮวบฮาบ ความแม่นยำในการเลือกตาเดินถัดไปกลายเป็นเชื่อไม่ได้ เพราะสถานการณ์ในกระดานเริ่ม "ไม่มั่นคง" กระบวนการเลือกหมากของมันจึงเริ่มตัดสินใจไม่ได้ จนเริ่มเลือกหมากต่างๆแบบสุ่ม จนกระทั่งลีคุมสถานการณ์ไว้หมดแล้วนั่นแหละ สภาพกระดานจึงเริ่มนิ่ง จนกลไกพยากรณ์กลับมาทำงานได้อีกครั้ง แต่ตอนนั้นมันก็ถลำลึกจนแก้ไม่ตกเสียแล้ว
แปลจาก
https://gogameguru.com/lee-sedol-defeats-alphago-masterful-comeback-game-4/
การกลับมาของลีเซดอล(2)
เกิดอะไรขึ้นกับอัลฟ่าโกะ
ปัญหาที่กวนใจคนดูคือ มันเกิดอะไรขึ้น?
หัวหน้าทีมพัฒนาอัลฟ่าโกะ เดวิด ซิลเวอร์ อยู่ในงานแถลงข่าวหลังจบเกมด้วย แต่เขาไม่ได้อธิบายว่าปัญหาเกิดจากอะไร
ซิลเวอร์ และฮัสซาบิสบอกว่า เขาไม่มีคำตอบจนกว่าพวกเขาจะกลับไปยังสำนักงานในอังกฤษเพื่อวิเคราะห์รายละเอียด ดังนั้นพวกเราก็ต้องรอเช่นกัน
การเดาที่อาจจะเข้าเค้า
เราไม่แน่ใจว่าเกิดอะไรขึ้น แต่เราพอจะทดลองเดาดูได้ เราเคยเห็นการเดินหมากแบบนี้มาก่อน จากโปรแกรมโกะอื่นๆ เหมือนว่ามันเป็น ข้อบกพร่องโดยพื้นฐานของ AI ที่ใช้ Monte Carlo Tree Search
อัลฟ่าโกะนั้นเหนือกว่า AI อื่นๆอย่างทาบไม่ติด แต่มันยังใช้ Monte Carlo ในบางส่วนของการวิเคราะห์หมาก
ทฤษฏีของเราก็คือเมื่อมันเจอตาเดินที่ยอดเยี่ยม เช่น W78 ซึ่งแค่ "พอใช้ได้" มันทำให้คอมพิวเตอร์มองข้ามมันไป สาเหตุเป็นเพราะในบางครั้งมันมีแค่การเดินรูปแบบเดียวเท่านั้นที่ทำให้ เทะสึจินี้ได้ผล และการเดินในรูปแบบอื่นๆทั้งหมดล้วนล้มเหลว
เว้นแต่การเดินหมากทุกรูปแบบจะโดนนำมาวิเคราะห์ มันเป็นไปได้ที่คอมพิวเตอร์(หรือมนุษย์)จะมองข้ามมันไป
นั่นหมายถึงเทคนิคโดยประมาณที่คอมพิวเตอร์ใช้(และได้ผลเกือบทุกครั้ง) จะเห็นหนทางมากมายที่มันจะชนะ แต่ไม่เห็นเข็มในกองหญ้าที่จะนำมันไม่สู่ความพ่ายแพ้
เป็นบ้า
เราได้เห็นพฤติกรรมแบบนี้บ่อยครั้งเมื่อเล่นกับ AI ที่ใช้ Monte Carlo
เมื่อเราเล่น เทะสึจิที่คอมพิวเตอร์ขาดไม่ถึง มันเริ่มต้นเดินแบบประหลาดๆ และทำเกมพัง มันไม่เกิดขั้นทุกครั้ง แต่บ่อยพอที่เราจะสรุปได้ว่ามันเป็นบ้า เราไม่รู้ว่ามันทำไมเกิดขึ้นและหวังว่าทีมอัลฟ่าโกะหรือผู้อ่านที่คุ้นเคยกับกรณีนี้จะนำเสนอความคิด
[หมายเหตุผู้แปล : ในช่องคอมเมนต์มีการถกเถียงกรณีนี้ค่อนข้างกว้างขวาง ผมจะสรุปการถกเถียงนี้ในตอนท้าย]
ชนะน้อยๆ หรือ แพ้หนักๆ
อย่างที่ได้อภิปรายไป สิ่งที่คอมพิวเตอร์พยายามทำคือการพยายามสร้างโอกาสชนะสูงสุด ชนะขาดหรือแพ้ขาดนั้นไม่อยู่ในการพิจารณา
นี่นำไปสู่พฤติกรรมที่คอมพิวเตอร์มัก "ชนะน้อยๆ หรือแพ้หนักๆ" เมื่อมันตามอยู่ มันจะเล่นเสี่ยงขึ้นเพื่อไล่ให้ทัน บางครั้งเสี่ยงแบบบ้าคลั่งซึ่งมากพอจะทำให้มันแพ้กลางกระดานไปเลย สำหรับกรณีทั่วไป นี่เป็นสิ่งที่เราต้องการ คอมพิวเตอร์จะไปยอมแพ้ไปแบบเงียบๆอย่างที่มนุษย์ทำ
ส่วนการเดินแย่ๆ เป็นไปได้ที่จะเกิดจากปรากฏการณ์ขอบฟ้า (Horizon Effect)
เมื่อโอกาสในการชนะของคอมพิวเตอร์ลดลงอย่างเฉียบพลัน หลังจากคู่ต่อสู้เดินหมากที่มันคาดไม่ถึง มันก็ไม่เหลือหนทางใดๆที่เชื่อถือได้อีกว่ามันจะชนะ เมื่อ AI ที่ใช้ Monte Carlo เจอสถานการณ์แบบนี้ มันจะเริ่มเดินหมากที่ไม่ช่วยอะไร หรือหมากที่จะช่วยให้มันชนะถ้าฝ่ายตรงข้ามรับพลาด
ทฤษฏีนี้อาจจะผิดหมดก็ได้ แต่มันอิงบนประสบการณ์จาก AI โกะตัวอื่นๆ
ผมไม่แน่ใจว่านี่ใช้กับ อัลฟ่าโกะได้หรือไม่ ถ้าคุณมีคำอธิบายที่ดีกว่า โปรดนำเสนอมันออกมา
ลีเซดอลจะทำได้อีกครั้งหรือไม่?
แน่นอนว่าเป็นไปได้ แต่ยากมาก
เราต้องการสถานการณ์จำเพาะ เพื่อสร้างเงื่อนไขแบบนี้ขึ้นอีกครั้ง และสถานการณ์ลักษณะนี้ ไม่ได้ปรากฏขึ้นทุกเกม
อัลฟ่าโกะ อาจทนต่อปัญหาลักษณะนี้ได้ดีกว่าเอไอเก่าๆ เพราะมันใช้ Policy Network ในการตัดสินใจด้วย แต่ต้องไม่ลืมว่า Policy Network พลาดในการประเมินคุณค่าของขาว 78 อาจจะเพราะมันเป็นการเดินที่ไม่ปกตินัก เราต้องรอดูว่าอะไรจะเกิดขึ้นในวันอังคาร ถ้าจะมีใครที่สร้างปรากฏการณ์นี้ซ้ำได้ มันก็ต้องเป็นลี เซดอล
[บทวิเคราะห์จากผู้อ่าน(รวมๆ)]
Monte Carlo (MC) พยายามเลือกตาเดินที่มีโอกาสชนะสูงสุด เมื่อโอกาสชนะมันต่ำลงฮวบฮาบ มันจะเริ่มเล่นเสี่ยงขึ้น โดย "ฝันหวาน" ว่าฝ่ายตรงข้ามจะพลาด การเล่นเสี่ยงๆแบบนี้ทำให้พฤติกรรมการเดินออกไปในทางที่มั่ว เช่นในตาที่ 177 ถ้ามนุษย์เดินที่จุดอื่น มันจะจับขาวกินแล้วพลิกเป็นฝ่ายชนะ ในสายตามนุษย์ หมากที่ 178 นั้นชัดเสียจนตาที่ 177 ไม่เข้าท่าเอาเสียเลย แต่ในสายตาของคอมพิวเตอร์ มันคาดหวังโอกาสที่มนุษย์จะพลาด มากกว่าความจำเป็นที่จะเก็บ "จุดขู่" ไว้เล่น โคะในภายหลัง
กรณีหมากที่ 78 นั้น เนื่องจากโกะมีความเป็นไปได้ว่าหมากที่ดูเหมือนแย่ๆ แต่ตามด้วยชุดหมากที่ดี สามารถเปลี่ยนดุลของอำนาจได้ นั่นคือสิ่งที่หมาก 78 ทำ หมาก 78 นั้นโดนอัลฟ่าโกะมองข้าม คัดทิ้งไม่พิจารณา จนกระทั่งความน่าจะเป็นพลิกข้ามมาฝั่งลีแล้วนั่นแหละ เมื่ออัลฟ่าโกะหันกลับมาพิจารณามันอย่างจริงจัง ตอนนั้นดุลของเกมก็พลิกไปแล้ว
เมื่อสิ่งนี้เกิดขึ้นอย่างฉับพลัน ความสามารถในการพยากรณ์ของมันก็ตกฮวบฮาบ ความแม่นยำในการเลือกตาเดินถัดไปกลายเป็นเชื่อไม่ได้ เพราะสถานการณ์ในกระดานเริ่ม "ไม่มั่นคง" กระบวนการเลือกหมากของมันจึงเริ่มตัดสินใจไม่ได้ จนเริ่มเลือกหมากต่างๆแบบสุ่ม จนกระทั่งลีคุมสถานการณ์ไว้หมดแล้วนั่นแหละ สภาพกระดานจึงเริ่มนิ่ง จนกลไกพยากรณ์กลับมาทำงานได้อีกครั้ง แต่ตอนนั้นมันก็ถลำลึกจนแก้ไม่ตกเสียแล้ว
แปลจาก https://gogameguru.com/lee-sedol-defeats-alphago-masterful-comeback-game-4/