1️⃣ จากโพสต์ที่แล้วได้สรุปถึงแนวคิด และ ขั้นตอนในการสำรวจข้อมูลที่เป็นตัวเลข ทั้งค่าตัวเลข ค่าว่าง และ คำสั่งที่จำเป็นต้องใช้ นอกจากนี้ จะทำการสำรวจข้อมูลที่เป็นตัวเลขด้วยหลักการทางสถิติเพื่อเข้าใจข้อมูลเหล่านั้น
2️⃣ สำหรับโพสต์นี้จะเป็นการสำรวจข้อมูลที่เป็นข้อความ หรือ ตัวอักษร กลุ่มคำ ซึ่งข้อมูลเหล่านี้ เป้าหมายในการสำรวจ จะนำไปหาความหมายด้วยหลักการทางสถิติเช่นเดียวกัน แต่ว่ามันไม่ใช่ตัวเลข จะทำวิธีการทางสถิติทันทีเลยไม่ได้ ก่อนอื่นไปจะต้องไปทำความเข้าใจในการจัดการข้อมูลข้อความด้วย SQL กันก่อน
3️⃣ ปกติการเก็บข้อมูลจะต้องมีการกำหนดประเภทให้กับข้อมูลเพื่อให้คอมพิวเตอร์รู้ว่าข้อมูลที่เก็บเอาไว้นี้เป็นข้อมูลประเภทอะไร เพื่อจองพื้นที่ในการเก็บข้อมูล โดยมีผลต่อพื้นที่ Hardware หรือ harddisk ของคอมพิวเตอร์ ซึ่งได้กล่าวไปในโพสต์ผ่านบ้างแล้ว
4️⃣ ข้อมูลที่เป็นประเภทข้อความหรือตัวอักษรในภาษา SQL สามารถเก็บข้อมูลประเภทนี้ได้ 3 ประเภท ได้แก่
character หรือ ตัวย่อ CHAR :: เป็นประเภทตัวอักษรความยาวคงที่ เช่น character(20) หมายความว่า จะสามารถเก็บข้อมูลเป็นประเภทตัวอักษรความยาวสูงสุด 20 ตัวอักษร กรณีที่ป้อนไม่ถึง 20 ตัวระบบจะทำการเพิ่มช่องว่างเข้าไปให้จนครบ 20 ตัวอักษร
character varying หรือ VARCHAR :: เป็นประเภทตัวอักษรความยาวเปลี่ยนแปลงได้ เช่น VARCHAR(50) หมายความว่า สามารถระบุความยาวของตัวอักษรได้ 50 ตัว กรณีที่มีการเก็บตัวอักษรมากกว่าที่กำหนดไว้ จะทำการเก็บไว้ให้เฉพาะ 50 ตัวอักษรแรกเท่านั้น
text :: เป็นประเภทตัวอักษรความยาวไม่จำกัด สามารถเก็บข้อความที่มีความยาวเท่าไรก็ได้
5️⃣ นอกจากนี้ ชนิดของ text ยังแบ่งออกเป็น ชนิดข้อความแบบหมวดหมู่ และ ชนิดข้อความแบบไม่มีโครงสร้าง ชนิดแบบหมวดหมู่เป็นอย่างไร ก็คือ กลุ่มคำ ในประเภทเดียวกัน เช่น
Tues, Tuesday, MON, TH
shirts, shoes, hats, pants
081-123-4567
สรุปขั้นตอนการสำรวจข้อมูลเพื่อความเข้าใจในข้อมูลตัวอักษรหรือข้อความที่ซ่อนอยู่ ด้วย SQL ตอนที่ 3
2️⃣ สำหรับโพสต์นี้จะเป็นการสำรวจข้อมูลที่เป็นข้อความ หรือ ตัวอักษร กลุ่มคำ ซึ่งข้อมูลเหล่านี้ เป้าหมายในการสำรวจ จะนำไปหาความหมายด้วยหลักการทางสถิติเช่นเดียวกัน แต่ว่ามันไม่ใช่ตัวเลข จะทำวิธีการทางสถิติทันทีเลยไม่ได้ ก่อนอื่นไปจะต้องไปทำความเข้าใจในการจัดการข้อมูลข้อความด้วย SQL กันก่อน
3️⃣ ปกติการเก็บข้อมูลจะต้องมีการกำหนดประเภทให้กับข้อมูลเพื่อให้คอมพิวเตอร์รู้ว่าข้อมูลที่เก็บเอาไว้นี้เป็นข้อมูลประเภทอะไร เพื่อจองพื้นที่ในการเก็บข้อมูล โดยมีผลต่อพื้นที่ Hardware หรือ harddisk ของคอมพิวเตอร์ ซึ่งได้กล่าวไปในโพสต์ผ่านบ้างแล้ว
4️⃣ ข้อมูลที่เป็นประเภทข้อความหรือตัวอักษรในภาษา SQL สามารถเก็บข้อมูลประเภทนี้ได้ 3 ประเภท ได้แก่
character หรือ ตัวย่อ CHAR :: เป็นประเภทตัวอักษรความยาวคงที่ เช่น character(20) หมายความว่า จะสามารถเก็บข้อมูลเป็นประเภทตัวอักษรความยาวสูงสุด 20 ตัวอักษร กรณีที่ป้อนไม่ถึง 20 ตัวระบบจะทำการเพิ่มช่องว่างเข้าไปให้จนครบ 20 ตัวอักษร
character varying หรือ VARCHAR :: เป็นประเภทตัวอักษรความยาวเปลี่ยนแปลงได้ เช่น VARCHAR(50) หมายความว่า สามารถระบุความยาวของตัวอักษรได้ 50 ตัว กรณีที่มีการเก็บตัวอักษรมากกว่าที่กำหนดไว้ จะทำการเก็บไว้ให้เฉพาะ 50 ตัวอักษรแรกเท่านั้น
text :: เป็นประเภทตัวอักษรความยาวไม่จำกัด สามารถเก็บข้อความที่มีความยาวเท่าไรก็ได้
5️⃣ นอกจากนี้ ชนิดของ text ยังแบ่งออกเป็น ชนิดข้อความแบบหมวดหมู่ และ ชนิดข้อความแบบไม่มีโครงสร้าง ชนิดแบบหมวดหมู่เป็นอย่างไร ก็คือ กลุ่มคำ ในประเภทเดียวกัน เช่น
Tues, Tuesday, MON, TH
shirts, shoes, hats, pants
081-123-4567