Technology

ไฟล์เพลงความละเอียดสูง คืออะไร ได้มาจากไหน ?

By Arnon Puitrakul - 19 July 2020 - 2 min read min(s)

ไฟล์เพลงความละเอียดสูง คืออะไร ได้มาจากไหน ?

ของอีกอย่างที่มีความสำคัญไม่แพ้เครื่องเสียงเลย เราว่าหลาย ๆ คนทั่ว ๆ ไป อาจจะไม่ได้ให้ความสำคัญมากเท่ากับอุปกรณ์ฟังมาก แต่วันนี้เราจะมาเล่าว่า เอ๊ะ จากเสียงที่ห้องอัด มันแปลงไปเป็นไฟล์เสียงได้ยังไง ผ่านกระบวนการอะไรบ้าง และ ไฟล์เสียงมันมีกี่แบบอะไรบ้าง น่าจะเป็นประโยชน์สำหรับผู้ที่ พึ่งเริ่มเข้าวงการ (ที่ออกไม่ได้ 😂)

เสียงคืออะไร ?

ไฟล์เพลงความละเอียดสูง คืออะไร ได้มาจากไหน ?

เสียง เกิดจาก การสั่นสะเทือนของวัตถุ จนทำให้เกิดการ หด และ ขยายตัวของคลื่น แล้วก็ส่งผ่านตัวกลาง เช่น อากาศ และ สายนำสัญญาณต่าง ๆ เหมือนกับที่เราตะโกนออกไป เสียงก็ออกจากกล่องเสียงของเรา ผ่านตัวกลางที่เป็นอากาศ หรือเหตุผลที่อวกาศเป็นดินแดนที่ไร้เสียง ก็เพราะว่า ในอวกาศมันไม่มีอากาศนั่นเอง ทำให้แรงสั่นสะเทือนมันผ่านไม่ได้นั่นเอง

อีกความสนุกคือ เมื่อชนิดของตัวกลางเปลี่ยน และ อุณหภูมิเปลี่ยน ก็จะส่งผลต่อควาามเร็วในการเลื่อนที่อีกด้วย ตัวอย่างเช่น ถ้าเราให้เสียงผ่านอากาศที่ 0 องศาเซลเซียส และ 20 องศาเซลเซียส ความเร็วจะอยู่ที่ 331 และ 343 เมตรต่อวินาที ตามลำดับ หรือถ้าเราเปลี่ยนตัวกลางเป็นแร่ที่โคตรแพง อย่าง เพชร มันสามารถทำความเร็วได้ถึง 12,000 เมตรต่อวินาทีเลย ลองคิดดูว่า ถ้าเราส่งข้อมูลผ่านเพชร มันจะเร็วแค่ไหน

ปล. เรื่องนี้ถูกนำไปใช้ในหลาย ๆ ด้านนอกจากจะเป็นเรื่องเสียง อีกหนึ่งเรื่องที่ใช้กันเยอะมากคือ การสื่อสาร

ไฟล์เพลงความละเอียดสูง คืออะไร ได้มาจากไหน ?

เมื่อเราพูดถึง เสียง จริง ๆ ในทางฟิสิกส์ เราอธิบายด้วยสมบัติของคลื่น อธิบายให้ง่ายด้วยกราฟที่ Plot Amplitude กับเวลา โดยที่ Amplitude นิยามว่า เป็นค่าความแกว่งในคลื่น ถ้าเราพูดถีงเรื่องเสียง มันก็จะพูดถึงความดัง ความเบาของเสียง มีหน่วยเป็น Decibel (dB) เหมือนที่เราอาจจะเคยได้ยินมาว่า เสียงดังกี่ dB จะทำให้หูเรามีปัญหาโน่นนี่นั่น มันคือตรงนี้แหละ

พอมันมีเวลาเข้ามาเกี่ยว มันเลยต้องมีอีกหน่วยมาช่วยกำกับคือ ความถี่ (Frequency) พูดง่าย ๆ ก็คือ จำนวนคลื่นที่วิ่งใน 1 วินาที เอาง่าย ๆ แค่นี้ละกัน เพื่อให้เข้าใจง่าย ๆ นิยามอาจจะไม่ Accurate มาก อย่าเอาไปอ้างอิงที่ไหนกันละ

ก่อนจะเป็นระบบ Digital

ก่อนหน้าที่เราจะใช้ระบบ Digital ในการฟังเพลงกัน เราใช้อีกประเภทคือระบบ Analog เป็นหลักกัน อุปกรณ์ที่ใช้งานระบบ Analog ที่ยังมีการใช้งาน และ เราน่าจะเคยได้ยินกันมาบ้างคือ แผ่นเสียง

เราอาจจะเคยได้เห็นจากรูป หรือของจริงกันมาบ้างแล้ว หน้าตาของแผ่นเสียง มันจะเป็นแผ่นกลม ๆ เหมือนแผ่น CD ขนาดใหญ่ ถ้ามองถึงเข้าไปหน่อย เราจะเห็นว่าที่แผ่นมันประกอบด้วยร่อง ๆ เยอะมากวางเป็นวงกลมไปตามแผ่นไปเรื่อย ๆ

มันจะดูเฉย ๆ มาก แต่ถ้าเราลองใช้พวกกล้องที่มีกำลังขยายสูง ๆ เข้าไปดูที่ร่องเหล่านั้น เราจะเห็นเลยว่า ร่อง มันไม่ได้เรียบเลย มันมีขยักไปมาเต็มไปหมด นั่นแหละ คือ เสียงที่บันทึกลงไป

หลักการง่าย ๆ ของการบันทึกคือ การรับเสียงเข้ามา แล้วทำให้หัวเขียนขยับตามเสียงที่รับมันสั่นขึ้นลงเล็กน้อย เหมือนเป็นการบากร่องเล็ก ๆ ลงไปบนแผ่น เพื่อบันทึกความถี่ตอนนั้นลงไป พอเวลาเราจะอ่าน เราก็เอาหัวอ่านมาเลื่อนผ่านร่องที่เราบากไว้ แล้วเครื่องอ่านจะแปลงกลับไปเป็นสัญญาณไฟฟ้า ผ่าน Amplifier และออกมาเป็นเสียงที่เราได้ยินจากเครื่องกัน

ด้วยหลักการที่เราเล่าไปทำให้เรายังคงเสียงที่คล้ายกับเสียงที่อัดจริง ๆ อยู่มาก เพราะเราแทบไม่ได้เสียข้อมูลอะไรเลย แต่ปัญหาคือ Copy นั้นทำได้ยากมาก ถ้าเราจะทำขายแบบ Mass Produce แบบที่ขายเพลงกันได้ในปัจจุบัน ถ้าอยากรู้เพิ่มเติมว่าเขาทำยังไง ลองไปหาอ่านดูพวกเรื่องของการผลิตแผ่นเสียง

นอกจากนั้น แผ่นเสียง มันยังแอบใช้งานยากอยู่พอตัว ทั้งเรื่องที่มันไม่มี Index ที่ทำให้เราสามารถเปลี่ยนเพลงไปมา หรือ การปรับการตั้งค่าต่าง ๆ ถือว่าทำได้ยาก จนมันมีเครื่องอ่านแผ่นเสียงที่เป็น Auto มา ก็พอช่วยได้อยู่บ้าง แต่ก็ยังยากกับมือใหม่อยู่ดี ทำให้หลังจากนั้นมีระบบที่เป็น Digital ออกมาให้เราใช้งานกัน

Digitisation

การที่เราจะใช้ระบบ Digital ได้ เราจะต้องแปลงข้อมูล หรือในที่นี้ก็คือ คลื่นเสียงนั่นเอง การแปลงข้อมูลเป็นระบบ Digital เราเรียกมันว่า การทำ Digitisation

สำหรับไฟล์เสียง การทำ Digitisation นั้นแบ่งออกเป็น 2 ขั้นตอนใหญ่ ๆ คือ Sampling และ Quantisation

ต้องเข้าใจก่อนว่า ระบบ Digital เราแทนข้อมูลด้วยเพียง 0 และ 1 เท่านั้น หรือก็คือ มันเป็นข้อมูลที่ไม่ต่อเนื่อง ในขณะที่ระบบ Analog มันเป็นอะไรที่ต่อเนื่อง ทำให้การจะแปลงข้อมูล เราจะต้องทำให้มันไม่ต่อเนื่องด้วยการทำ Sampling

ไฟล์เพลงความละเอียดสูง คืออะไร ได้มาจากไหน ?

มันเป็นการเลือกเฉพาะบางช่วงเวลาออกมา เช่นเราบอกว่า Sampling Rate ที่ 4 Sample/s ก็คือ ใน 1 วินาที เราจะเลือกมาแค่ 4 ช่วงเท่านั้น ถ้าดูจากในรูป เราจะเห็นว่า กราฟแท่งมันไม่ดูคล้ายกับคลื่นเสียงที่เป็น Analog เลย ซึ่งหน่วยของ Sampling Rate คือ Hertz (Hz)

ยิ่งเยอะ ก็ยิ่งทำให้เหมือนคลื่นเสียงต้นฉบับมากขึ้น แต่ข้อมูลก็ต้องมีปริมาณมากขี้นตามไปด้วย ถามว่าแล้วเราจะต้องใช้ Sampling Rate น้อยที่สุดเท่าไหร่ถึงจะทำให้ข้อมูลของเรามันคล้ายกับของจริงมากที่สุด

คำตอบอยู่ที่ Nyquist Rate มันมีสูตรอยู่ แต่สั้น ๆ คือ Sampling Rate จะต้องไม่ต่ำกว่า 2 เท่าของ ความถี่สูงสุดที่เราต้องการจะแปลง ถ้าพูดถึงเสียงเพลง มันคือเสียงที่ให้มนุษย์ฟัง ซึ่งเรารู้กันอยู่แล้วว่า ความถี่ที่มนุษย์สามารถได้ยินคือ 20 ถึง 20 KHz ไปเลย ทำให้ Sampling Rate ที่ควรจะเป็น 40 kHz บวกไปอีกนิดก็คือ 40.1 kHz หรือก็คือ CD Quality นั่นเอง

หรืออย่างพวก Hi-Res Audio Format เช่น FLAC ที่เรารู้จักกัน Sampling Rate สูงสุดที่ทำได้คือ 384 kHz หรือไฟล์โคตร Hi-Res อย่าง DSD ไปได้ถึง 45.2 MHz เลยทีเดียว ถ้าใครที่เคยใช้ไฟล์เหล่านี้คือ ไฟล์ใหญ่มาก ๆ ใช่ม่ะ

ไฟล์เพลงความละเอียดสูง คืออะไร ได้มาจากไหน ?

เมื่อกี้ เราเปลี่ยนเวลาที่มันต่อเนื่องให้มันไม่ต่อเนื่องด้วยการทำ Sampling ไปแล้ว และอีกแกนละ คือ Amplitude เราจะทำยังไงดี เรารู้ว่า ในระบบ Digital เราใช้ 0 และ 1 ในการแทนค่าระดับของเสียง นั่นแปลว่า ถ้าเราแทนค่าได้แค่ 2 ระดับ น่าจะเป็น เปร่งเสียง และ เงียบ แต่เรารู้ว่า เพลงมันไม่เป็นแบบนั้นแน่ ๆ ทำยังไงดีละ

วิธีง่าย ๆ คือ เราก็เติมจำนวน Bit เข้าไปสิ เช่นถ้าเราใช้ 8-Bits แปลว่าเราจะแทนค่าเสียงได้ 128 ระดับ น่าจะสร้างความแตกต่างได้ดีกว่าเงียบ และ เปร่งเสียงเยอะ ถ้านึกเสียงที่แทนด้วย 8 bits ไม่ออก นึกถึงพวกเสียงจากเกม Mario ในอดีต นั่นแหละ ที่เขาเรียกว่าเกม 8-bits เพราะ ทั้งสี และ เสียง มันแทนค่าด้วย 8 bits เท่านั้น นี่แหละ เราเรียกว่าการทำ Quantisation หรือก็คือการซอยระดับของเสียงออกมาเพื่อให้เป็นระบบ Digital นั่นเอง

ยิ่งเราใช้จำนวน Bits ในการทำ Quantisation มาก (Bit Depth) เท่าไหร่ เสียงของเราก็จะยิ่ง Smooth เหมือนของจริงมากขึ้นเท่านั้น เพราะการเพิ่ม หรือลด 1 ระดับ มันมีผลกับเสียงน้อยมาก นั่นเอง แต่ข้อเสียก็คือ เราเติม Bits เยอะ ขนาดของไฟล์ก็จะใหญ่ขึ้นเรื่อย เพราะจำนวน Bit/Sample ก็จะสูงขึ้น นั่นเอง

การแปลงเสียงเป็นระบบ Digital ถือว่าแก้ไขเรื่องของการทำซ้ำได้ยากไปเลย จากเดิมที่แผ่นเสียงมันจะต้องมีการปั้มแผ่นที่ยากมาก ๆ ถูกแทนที่ด้วยการแค่สักเขียนลงไปในที่เก็บข้อมูลในระบบ Digital เท่านั้น เช่น แผ่นซีดีในสมัยก่อน ยันการเก็บเป็นไฟล์ และ Music Streaming ในปัจจุบัน แต่ปัญหาคือ มันใหญ่มาก ๆ ถึงแม้ว่า เราจะลด Sampling Rate และ Quantisation Rate แล้ว แต่การลดค่าตรงนี้ มันก็มีขีดจำกัดอยู่ ทำให้เราต้องทำอีกอย่างในการเก็บข้อมูลคือ การบีบอัด (Compression)

Compression

การบีบอีด (Compression) พูดง่าย ๆ มันก็คือการที่เราจะลดจำนวน Bit ที่ใช้ในการแสดงข้อมูลนั้น ๆ ลง ซึ่งสามารถแบ่งออกได้เป็น 2 ประเภทใหญ่ ๆ ด้วยกันนั่นคือ Lossless Compression และ Lossy Compression

Lossless Compression มันเป็นรูปแบบการบีบอัดประเภทนึง ที่เราจะไม่เสียข้อมูลเลย พูดอีกนัยคือ เมื่อเราคลายข้อมูลออกมา เราจะยังคงได้ข้อมูลที่เหมือนต้นฉบับอยู่นั่นเอง นั่นน่าจะเป็นข้อดี ส่วนข้อเสียคือ ขนาดของไฟล์ที่บีบอัด อาจจะเล็กลงจริง ตัวอย่างเช่น พวก Lossless Format อย่าง FLAC และ ALAC ก็ใช้วิธีการบีบอัดคล้ายกับ ZIP ในการบีบอัดข้อมูลทั่ว ๆ ไป  แต่ข้อเสียคือ ขนาดไฟล์ เพราะยังเล็กสู้อีกประเภทไม่ได้อยู่ดี ทำให้นำไปสู่ Lossy Compression

Lossy Compression ตรงข้ามกับ Lossless ไปเลย เพราะข้อมูลที่ผ่านการทำ Lossy Compression จะไม่สามารถแทนค่ากลับมาเป็นข้อมูลต้นฉบับได้ แต่ข้อดีคือการได้ข้อมูลที่มีขนาดเล็กลงมาก จนทำให้เราสามารถส่ง และ พกพาได้ง่ายขึ้นนั่นเอง ตัวอย่างเช่น AAC วิธีในการ Compression คือ การเอาเสียงที่มนุษย์ไม่ได้ยินออกไป  พร้อมกับแปลงเสียงที่ต่ำมาก ๆ ไปเป็น Mono เพื่อให้ลดขนาดของไฟล์ลง จากตัวอย่างของ AAC แปลว่า มีถึงเราจะทำยังไง เสียงที่ออกมาจะไม่เหมือนกับต้นฉบับแน่นอน

เราจะรู้ได้ยังไงว่า นี่คือไฟล์ความละเอียดสูง ?

นิยามของ Hi-Res Audio ตาม RIAA บอกว่า เป็นไฟล์ที่มี Sampling Rate ตั้งแต่ 48 kHz ขึ้นไป และมี Bit Depth มากกว่า 20 Bits ขึ้นไป หรือเป็นไปตามที่เจ้าของเพลงกำหนดมา ก็จะถือว่าเป็น Hi-Res Audio ละ แล้วเราจะรู้ได้ยังไงว่า ไฟล์ที่เราได้มามี Sampling Rate และ Bit Depth เท่าไหร่

Hi-Res Music จาก VLC

วิธีนึงที่เราใช้เช็คคือ เราใช้โปรแกรม VLC ในการเช็ค วิธีคือเราเปิดไฟล์ขึ้นมา ไปที่ Window > Media Infomation และเลือก Tab Codec Details มันก็จะแสดงค่าออกมา จากตัวอย่างด้านซ้ายเป็น Lossless Format คือ FLAC ที่มี Sampling Rate ที่ 96 kHz และ Bit Depth ที่ 32 Bits และด้านขวาเป็น Lossy Format แบบ MPEG4 ที่ 48kHz และ 32 Bits

เราจะหาไฟล์เพลงความละเอียดสูงมาจากไหน ?

Tidal Review

ไฟล์เพลงความละเอียดสูงพวกนี้ เราสามารถหาได้จาก Store สำหรับพวกนี้โดยเฉพาะ อาจจะยากไปสำหรับการเข้าถึงเบื้องต้น แต่อีกที่ ๆ เราแนะนำคือ Tidal ที่เป็น Music Streaming ให้บริการไฟล์เพลงความละเอียดสูง จนไปถึง MQA ที่เป็นไฟล์เพลงแบบโคตรละเอียด แนะนำให้ลองไปฟังกัน เราเคยเขียนรีวิวไว้แล้ว รีวิว Tidal บริการ Music Steaming เสียงเทพ

BONUS: Upscaling Technology

เรามาเล่าเพิ่มเติมนิดหน่อย บางทีเราอาจจะมีไฟล์เก่า ๆ แล้วเราอยากให้มันกลับมามีชีวิตชีวาอีกครั้ง เหมือนกับไฟล์ภาพที่ถ่ายด้วยกล้องเก่า ๆ ที่ความละเอียดต่ำมาก แล้วเราอยากจะเอาไปปริ้นเป็นภาพขนาดใหญ่ใส่กรอบรูปอีกครั้ง เราสามารถทำได้เหมือนกับกับเสียงเลย จริง ๆ แล้ววิธีคล้าย ๆ กับภาพเลย

วิธีที่ง่ายที่สุด เท่าที่เราคิดได้ น่าจะเป็นการทำ Interpolate เพราะไฟล์ที่เรามี มองว่ามันเป็นจุดในแต่ละช่วงเวลา ถ้าเราอยากทำให้มันละเอียดขึ้น เราก็แค่ หาค่าตรงกลางของมันมาแปะ ก็ทำให้เรามีข้อมูลที่ละเอียดขึ้นได้เหมือนกัน หรือบางวิธีที่ Cutting-Edge มาก ๆ ก็อาจจะมีการใช้พวก Deep Learning เข้ามาช่วย ทำให้เสียงที่ได้ออกมามีความเนียนมากขึ้นก็มีเหมือนกัน ลองไปหาอ่านได้ตามพวก Paper งานวิจัย