[Data Mining] ทำไมการคำนวณ Entropy สำหรับการหา Purity ของ Node ถึงกำหนดให้ 0*log(0) = 0 ครับ

log(0) มันไม่ควรจะมีค่าไม่ใช่เหรอครับ หรือถ้ามีค่าก็ควรจะเป็น -infinity
ซึ่ง 0*infinity ก็เป็น indeterminate form
ทำไม Textbook Data Mining หลายๆเล่มที่ใช้ Entropy ถึงกำหนดให้ 0*log(0) = 0 อะครับ

อันนี้เอามาจาก Slide Textbook ของ Michael Steinbach, Pang-Ning Tan, Vipin Kumar


ผมก็นึกว่าหาก Node มี Maximum Purity มันไม่ควรจะวัดได้โดยใช้ Entropy ควรจะใช้ measurement อื่นๆเช่น GINI Index แทน
แต่ดันใช้ Entropy วัดได้เฉยเลย
แสดงความคิดเห็น
โปรดศึกษาและยอมรับนโยบายข้อมูลส่วนบุคคลก่อนเริ่มใช้งาน อ่านเพิ่มเติมได้ที่นี่