ตอนนี้กำลังทำงานวิจัยเกี่ยวกับเวลาที่ใช้การพบแพทย์ค่ะ ได้ทำการเก็บข้อมูลมามีตัวอย่าง 345 ตัวอย่าง
และได้ทำการหาการแจกแจงโดยใช้ Input analyzer ของ Arena ได้ผลการแจกแจงออกมาดังนี้ค่ะ
Distribution Summary
Distribution: Lognormal
Expression: -0.5 + LOGN(9.86, 8.21)
Square Error: 0.036794
Chi Square Test
Number of intervals = 18
Degrees of freedom = 15
Test Statistic = 184
Corresponding p-value < 0.005
Data Summary
Number of Data Points = 345
Min Data Value = 0
Max Data Value = 44
Sample Mean = 9.15
Sample Std Dev = 7.11
Histogram Summary
Histogram Range = -0.5 to 44.5
Number of Intervals = 45
จากที่เห็น มี mean และ std อยู่สองชุดคือ
Expression: -0.5 + LOGN(9.86 <<<mean, 8.21<<<SD)
กับ
Sample Mean = 9.15
Sample Std Dev = 7.11
ไม่แน่ใจว่าต้องใช้ ตัวไหนระหว่างในวงเล็บหรือ Sample Mean,std
มีข้อสงสัยดังนี้ค่ะ -0.5 ข้างหน้าเราต้องเอาไปทำอะไรต่อหรือเปล่าค่ะ หรือว่าเป็นการทำให้จุดเริ่มของสมการเริ่มที่ 0 ?
จากแนวทางดำเนินการงานวิจัยที่ตั้งเอาไว้คือ หา CDF ของการแจกแจงชุดนี้ เพื่อสร้างตารางความน่าจะเป็นเวลาที่ใช้ในการพบแพทย์
เพื่อจำลองเวลาพบแพทย์ ค่ะโดยใช้ฟังก์ชั่นแรนด้อมของ Excel เช่นว่า Random ออกมาได้ที่ 0.8 จะนำไปเทียบกับตาราง CDF จะได้เวลาเป็นนาทีมา
แต่เรื่องของ lognormal ค่อนข้างหายาก (และอ่านแล้วไม่ค่อยเข้าใจเท่าไหร่ มืดแปดด้านมาก) ดูสูตร CDF แล้วแทนค่าไม่ถูกเลยค่ะ ไม่รู้จะไปยังไงต่อแล้ว หางานวิจัยที่ใช้เป็นตัวอย่างไม่ค่อยเจอเลย บางอันบอกให้ปรับเป็น normal dis แต่ว่าข้อมูลที่เราเก็บได้มาส่วนใหญ่เป็นเพียงเลข 1-2 หลัก บางอันก็เป็น 0 ทั้งที่ log normal มีค่ามากกว่า 0 เป็นบวกเท่านั้น แสดงว่าข้อมูลที่เป็น 0 ควรจะเอาออกไปหรือไม่คะ?
รบกวนขอคำแนะนำด้วยค่ะ
ขอความช่วยเหลือเรื่อง lognormal distribution
และได้ทำการหาการแจกแจงโดยใช้ Input analyzer ของ Arena ได้ผลการแจกแจงออกมาดังนี้ค่ะ
Distribution Summary
Distribution: Lognormal
Expression: -0.5 + LOGN(9.86, 8.21)
Square Error: 0.036794
Chi Square Test
Number of intervals = 18
Degrees of freedom = 15
Test Statistic = 184
Corresponding p-value < 0.005
Data Summary
Number of Data Points = 345
Min Data Value = 0
Max Data Value = 44
Sample Mean = 9.15
Sample Std Dev = 7.11
Histogram Summary
Histogram Range = -0.5 to 44.5
Number of Intervals = 45
จากที่เห็น มี mean และ std อยู่สองชุดคือ
Expression: -0.5 + LOGN(9.86 <<<mean, 8.21<<<SD)
กับ
Sample Mean = 9.15
Sample Std Dev = 7.11
ไม่แน่ใจว่าต้องใช้ ตัวไหนระหว่างในวงเล็บหรือ Sample Mean,std
มีข้อสงสัยดังนี้ค่ะ -0.5 ข้างหน้าเราต้องเอาไปทำอะไรต่อหรือเปล่าค่ะ หรือว่าเป็นการทำให้จุดเริ่มของสมการเริ่มที่ 0 ?
จากแนวทางดำเนินการงานวิจัยที่ตั้งเอาไว้คือ หา CDF ของการแจกแจงชุดนี้ เพื่อสร้างตารางความน่าจะเป็นเวลาที่ใช้ในการพบแพทย์
เพื่อจำลองเวลาพบแพทย์ ค่ะโดยใช้ฟังก์ชั่นแรนด้อมของ Excel เช่นว่า Random ออกมาได้ที่ 0.8 จะนำไปเทียบกับตาราง CDF จะได้เวลาเป็นนาทีมา
แต่เรื่องของ lognormal ค่อนข้างหายาก (และอ่านแล้วไม่ค่อยเข้าใจเท่าไหร่ มืดแปดด้านมาก) ดูสูตร CDF แล้วแทนค่าไม่ถูกเลยค่ะ ไม่รู้จะไปยังไงต่อแล้ว หางานวิจัยที่ใช้เป็นตัวอย่างไม่ค่อยเจอเลย บางอันบอกให้ปรับเป็น normal dis แต่ว่าข้อมูลที่เราเก็บได้มาส่วนใหญ่เป็นเพียงเลข 1-2 หลัก บางอันก็เป็น 0 ทั้งที่ log normal มีค่ามากกว่า 0 เป็นบวกเท่านั้น แสดงว่าข้อมูลที่เป็น 0 ควรจะเอาออกไปหรือไม่คะ?
รบกวนขอคำแนะนำด้วยค่ะ