กราบละ เลิกใช้ Select * สักที !

เมื่อหลายวันก่อน เรามานั่งอ่าน Code ชุดนึง แล้วทำให้นึกขึ้นมาได้แบบ จัง ๆ อ่านแล้วกำหมัด แต่ก็นะ เมื่อก่อนเราก็ทำเหมือนกัน คือการใช้ * หรือ Star ตอนที่เรา Select ข้อมูลผ่าน SQL Command เราจะบอกว่า เลิกเถอะนะ ทำไมเราลองไปดูเหตุผลกัน

Select Command

เริ่มจากพื้นฐานกันก่อนละกัน คำสั่งที่เราใช้ในการดึงข้อมูล หรือ Query ข้อมูลออกจากพวก Relational Database ทั้งหลาย เราจะใช้ SELECT Command กัน ซึ่ง Syntax ของมันง่ายมาก ๆ

SELECT [Fields] FROM [Table Name];

คือ เราใช้ Select แล้วตามด้วย Field ที่เราต้องการดึง ถ้าเราอยากได้ทุกช่องเลย เราก็จะใส่เป็น Star เข้าไป แล้วตามด้วย From กับชื่อ Table ที่เราต้องการดึงมา

เราอาจจะใส่เป็น Where เข้าไปต่อ เพื่อสร้างเงื่อนไขในการดึง หรืออาจจะใช้ Join เพื่อจับคู่กับ Table อื่น ๆ ได้อีก อันนี้ลองเข้าไปอ่านในพวก DML Command ใน SQL ได้

Star ผิดตรงไหน ?

อย่างที่เราบอกว่า Star คือการที่เราจะเอาทุก Column ของ Table มาหมดเลย เราโอเคนะ ถ้าเกิดเราดึงมาทุก Column แล้วเรามีการเรียกใช้ทั้งหมด แต่ถ้าเราบอกว่า เราดึงออกมา 10 Field แล้วเราใช้อยู่แล้ว 2 Field แบบนี้แหละที่เราว่า ชิบหายแน่นอน

ก่อนที่เราจะไปถึง Level ของ Database นะ เราเอา Level ของโปรแกรมเราก่อน ถ้าเราล่อ 10 Field นั่นออกมา หลังจาก Database โยนกลับไปให้โปรแกรมเราแล้ว มันก็จะต้องเก็บลงไปในตัวแปร และแน่นอนว่า มันก็จะต้องเก็บลง Memory เราแน่นอน ดังนั้น โปรแกรมของเราจะกิน Memory ทั้ง ๆ ที่มันไม่จำเป็นเลย โดยเฉพาะในอุปกรณ์เล็ก ๆ ที่มี Memory ขนาดเล็ก

ยังไม่นับว่า ถ้า Database Server กับ Consumer อยู่คนละที่กัน แล้วข้อมูลจาก Database จะต้องโยนไปที่ Consumer ก็จะทำให้เสียเวลา และ เสีย Data เยอะเข้าไปอีก เช่น เราบอกว่า เราเขียน App บน Mobile ให้ไป Query Database ออกมาสักตัวนึง เราใช้อยู่ไม่กี่อันเช่น เราใช้ข้อมูลอยู่นับเป็นสัก 2 kB แต่เราโหลดมาจริง 2 MB เรียกว่าหลายเท่าเลยนะ

อ่านดูแล้วก็แค่โปรแกรมเราใช้ Memory เยอะ งั้นเรามาฝั่งที่สนุกกันบ้าง นั่นคือฝั่ง Database Server อันนี้แหละ พีค เพราะถ้าเราดึงส่วนที่เราไม่ได้ใช้งานออกมาเยอะ นั่นแปลว่า ตอนที่เรา Query เครื่องมันจะต้องดึงข้อมูลเยอะกว่าที่เราจะต้องใช้เยอะมาก ยังไม่นับว่า Table ที่เรา Query มันมี ข้อมูลมหาศาลมาก ๆ หลายล้าน Record พวกนี้ ถ้าเครื่องไม่แรง แล้วเราล่อแบบนี้ก็คือ อาจจะใช้เวลาในการ Query ที่นานกว่าที่ควรจะเป็น จนไปถึงเครื่องเอาไม่อยู่แล้วแตกได้เลย

ไหน ๆ เราพูดถึง Join แล้ว อันนี้แหละ อร่อยเข้าไปอีก เช่นเราบอกว่า เรามี 2 Table ที่มี Field สัก 20 Fields กับอีก Table มีสัก 30 Fields เรา Join กันทำให้เราจะมีทั้งหมด 49 Fields ด้วยกัน เรียกได้ว่า มันสร้างภาระให้กับเครื่อง Database Server หนักกว่าที่ควรจะเป็นมาก ๆ

เมื่อไหร่ที่เราควรใช้ Star ?

พูดมาขนาดนี้ ก็อาจจะทำให้หลาย ๆ คนถามว่า อ้าว แล้วถ้ามันไม่โอเคขนาดนี้ ทำไม SQL ถึงมี Star มาเป็น Shorthand ให้เราใช้ได้ นั่นก็เพราะบางครั้ง มันจะมีเคสที่เราจะต้องใช้ทุก Columns ของ Table แน่นอน พวกนี้แหละ ทำให้เราสามารถเขียนคำสั่งได้ง่ายขึ้น ไม่ต้องยืดยาวมาก

ถ้าเราใช้ทุก Columns นั่นแปลว่า ไม่ว่าเราจะใช้ Star หรือ เราจะเขียนชื่อ Field ทั้งหมดของ Table ยังไง ๆ ค่ามันก็เท่ากันอยู่ดี แค่นั้นเลย

สรุป

การใช้งาน Star ในคำสั่ง Select เอาจริง ๆ มันก็ไม่ได้ผิด ถ้าเราต้องการทุก Column มาใช้งานจริง ๆ แต่ ถ้าเราบอกว่า เราไม่ต้องการใช้ทั้งหมด เราแนะนำให้ทำการใส่ไปบอกมันเลยว่า เราต้องการ Field ไหนบ้าง เพื่อที่ Database Server จะได้เอาออกมาให้แค่เท่าที่เราใช้ ลดโหลดที่จะเกิดขึ้นกับ Database Server และ Client เองด้วย พร้อมทั้ง ถ้าข้อมูลไม่วิ่งออกมานั่นหมายถึงความปลอดภัยที่ดีขึ้น เอาเฉพาะที่ใช้กันมาพอเนอะ

แถม : หัดใช้ Limit ด้วยเด้อ

เมื่อครู่ เราพูดถึงด้าน Column โดยการให้เราใส่ Field ที่เราใช้เข้าไป แทนที่จะกดทั้งหมดเลย แต่ตารางมันมี 2 ด้าน โดยเฉพาะด้าน Row นี่แหละ สนุก เพราะมันเพิ่มได้เยอะขึ้นเรื่อย ๆ เลย บาง Table อาจจะประกอบด้วยหลายล้าน Row ได้เลย

ถ้าเรา Query ขึ้นมาตรง ๆ เลย มันพยายามที่จะเอาทั้งหมดหลายล้านขึ้นมาเลยนะ แน่นอนว่า ใหญ่อลังการงานสร้างแน่นอน และ เอาจริง ๆ เราอาจจะไม่ได้ใช้เยอะขนาดนั้นด้วย ทำให้ถ้าเราอยากจะดูข้อมูลเฉย ๆ ก็ใส่ Limit ไว้ด้วยจะดีมาก หรือ ถ้าเราต้องการข้อมูลมา Process อะไรบ้างอย่าง เช่นการนับ การหาค่า Max, Min อะไรพวกนั้น เราก็สามารถทำใน SQL เลยก็ได้ อันนี้ขึ้นกับงาน และ การออกแบบของเราเลยนะ เราอาจจะยอม Query ทั้งหมดแล้วเอามา Process ใน Server ก็ได้ หรือ เราจะผลักภาระให้ Database Server จัดการไปก็ได้เหมือนกัน หรือ ถ้าเรารู้ว่า เรามีการ Query ข้อมูลพวกนี้เยอะ เราก็อาจจะทำ View ขึ้นมาไว้เลยก็ได้ หรือ เราจะหาวิธีการ Cache อะไรก็ว่ากันไป จะได้ง่าย ๆ

กราบละ เลิกใช้ Select * สักที !

Select Command

Star ผิดตรงไหน ?

เมื่อไหร่ที่เราควรใช้ Star ?

สรุป

แถม : หัดใช้ Limit ด้วยเด้อ

Read Next...

เสริมความ"แข็งแกร่ง" ให้ SSH ด้วย fail2ban

5 วิธีการทำให้ SSH ของคุณ "แข็ง(แกร่ง) อึด ทน"

สร้าง Book Tracking Library ด้วย Obsidian

Garbage Collector บน Python ทำงานอย่างไร