ในรูปแบบไหนดีกว่าที่จะฟังเพลง ปลาวาฬสามตัวสูญเสีย
ในรูปแบบไหนดีกว่าที่จะฟังเพลง ปลาวาฬสามตัวสูญเสีย
Anonim

การทำความเข้าใจรูปแบบเสียงดิจิทัลไม่ใช่เรื่องง่ายเลย เป็นการยากที่จะสรุปให้ชัดเจนว่ารูปแบบใดดีกว่าที่จะฟังเพลง หากคุณดูตารางเปรียบเทียบรูปแบบเสียงใน Wikipedia ดวงตาของคุณจะเริ่มระลอกคลื่นด้วยคอลัมน์ตัวเลขเงียบ ลองหาว่ามีอะไรอยู่เบื้องหลังสิ่งนี้

ในรูปแบบไหนดีกว่าที่จะฟังเพลง ปลาวาฬสามตัวสูญเสีย
ในรูปแบบไหนดีกว่าที่จะฟังเพลง ปลาวาฬสามตัวสูญเสีย

มาจองกันเลยดีกว่าว่าบทความพูดถึงลักษณะทั่วไปเท่านั้นและจะไม่รวมรายละเอียดบางอย่าง ในอนาคต Lifehacker จะทำการวิจัยอย่างเป็นกลางของเธอเอง และวันนี้เราจะพยายามสรุปประสบการณ์ที่ทราบอยู่แล้วไม่ทางใดก็ทางหนึ่ง

มีอะนาล็อกและตัวเลข

อะนาล็อกนั้นดีแต่อายุสั้นและไม่สะดวก ดังนั้นสื่ออนาล็อกถึงแม้จะมียอดขายแผ่นเสียงสูง แต่ก็ไม่หวนกลับมา

เสียงดิจิตอลสามารถเป็นสามประเภทหลัก:

  • ในรูปแบบที่ไม่ใช้การบีบอัด
  • ในรูปแบบที่ใช้การบีบอัดแบบไม่สูญเสียข้อมูล
  • ในรูปแบบที่ใช้การบีบอัดแบบสูญเสียข้อมูล

เมื่อมองแวบแรก รูปแบบที่ไม่สูญเสียข้อมูลมีแนวโน้มมากกว่า ซึ่งไม่เป็นเช่นนั้นเสมอไป เนื่องจากเราจะพูดถึงรายละเอียดเพิ่มเติมในเอกสารต่อไปนี้ รูปแบบที่ไม่บีบอัดไม่สมเหตุสมผลนอกจากการจัดเก็บบันทึกหลักที่จำเป็นในการสร้างเนื้อหาเสียง พวกมันกู้คืนได้ง่ายกว่า การจัดเก็บและฟังการบันทึกที่บ้านนั้นไม่จำเป็น

จากพารามิเตอร์ต่างๆ ของเสียงดิจิตอล ผู้ใช้ควรคำนึงถึงความถี่ในการสุ่มตัวอย่างก่อน (ความแม่นยำของการแปลงสัญญาณอนาล็อกเป็นดิจิทัลในเวลา) ความลึกบิต (ความแม่นยำของการแปลงเป็นดิจิทัลในแอมพลิจูด - ความดัง) อัตราบิต (จำนวน ข้อมูลที่มีอยู่ในไฟล์ต่อวินาที)

วันนี้เราจะมาพูดถึงการสูญเสีย

สำหรับเสียงที่ถูกบีบอัด แนวคิดของโมเดลจิตอะคูสติกมีความสำคัญมาก - แนวคิดของนักวิทยาศาสตร์และวิศวกรเกี่ยวกับการรับรู้เสียงของบุคคล หูจะรับรู้คลื่นเสียงทั้งหมดที่มาถึง อย่างไรก็ตาม สมองประมวลผลสัญญาณ

ค่าอ้างอิงของช่วงเสียงที่มนุษย์ได้ยินคือตั้งแต่ 16 Hz ถึง 20 kHz แต่เขาไม่สามารถได้ยินและรับรู้เสียงที่เข้ามาทั้งหมดพร้อมกันได้

การได้ยินไม่ต่อเนื่องและความไวต่อการได้ยินไม่เป็นเชิงเส้น

แบบจำลองจิตอะคูสติกสมัยใหม่จะประเมินการได้ยินของมนุษย์ได้อย่างแม่นยำและมีการปรับปรุงอย่างต่อเนื่อง ในความเป็นจริง แม้จะมีการรับรองจากผู้รักเสียงเพลง นักดนตรี และออดิโอไฟล์ สำหรับหูที่ไม่ได้รับการฝึกฝนโดยเฉลี่ย การปรากฏครั้งแรกของ MP3 ในคุณภาพสูงสุดได้กลายเป็นที่เข้าใจได้อย่างมาก มีข้อยกเว้นไม่สามารถ แต่มีได้ แต่จะสังเกตได้ไม่ง่ายนักเมื่อคนตาบอดฟัง

รูปแบบโดยใช้แบบจำลองการบีบอัดข้อมูลทางจิตวิทยา

มีรูปแบบดังกล่าวมากมายสำหรับการบีบอัดเสียงแบบสูญเสียข้อมูล ที่พบบ่อยที่สุดในปัจจุบันมีดังต่อไปนี้

OGG (วอร์บิส)

โดยทั่วไป ไฟล์ที่มีนามสกุล *.ogg จะเป็น "คอนเทนเนอร์": ไฟล์สามารถมีไฟล์บันทึกเสียงได้หลายรายการพร้อมแท็กและคุณลักษณะของตัวเอง ส่วนใหญ่แล้ว ไฟล์ที่จัดเก็บไว้ในนั้นจะถูกบีบอัดด้วยตัวแปลงสัญญาณ Ogg Vorbis แม้ว่าไฟล์อื่น ๆ รวมถึง MP3 หรือ FLAC ก็สามารถใช้ได้

ข้อได้เปรียบหลัก ได้แก่ พารามิเตอร์ที่เป็นไปได้ที่หลากหลายระหว่างการเข้ารหัส: อัตราการสุ่มตัวอย่างเสียงสามารถเข้าถึง 192 kHz ความลึกของบิตคือ 32 บิต โดยค่าเริ่มต้น OGG จะใช้อัตราบิตแบบแปรผัน (แม้ว่าจะไม่แสดงในหน้าจอคุณสมบัติ) ซึ่งสามารถเพิ่มขึ้นได้ถึง 1,000 kbps

MP3

MP3 ได้รับการพัฒนาโดย Fraunhofer Society ต่างจาก OGG ฟรี ซึ่งเป็นสมาคมของสถาบันเยอรมันเพื่อการวิจัยประยุกต์ ซึ่งมีความสำคัญมากสำหรับอะคูสติกสมัยใหม่ ในบรรดาผู้รักเสียงเพลงนี่เป็นสำนักงานที่น่านับถืออย่างยิ่ง แต่พวกเขาไม่ชอบที่จะยอมรับ แต่การพัฒนาของพวกเขาถูกจับตามองอย่างใกล้ชิด

ต่างจาก OGG มันสามารถมีทั้งตัวแปร (VBR) และบิตเรตคงที่ (CBR) อย่างไรก็ตามต้องขอบคุณ MP3 ที่พบว่าบันทึกทุกรายการไม่สามารถเข้ารหัสด้วยคุณภาพสูงด้วยบิตเรตแบบแปรผันได้ (ดูเหตุผลข้างต้น อัลกอริธึมการเข้ารหัสและผลลัพธ์ในกรณีนี้อาจแตกต่างกันเมื่อเข้ารหัสแหล่งเดียวกัน).

เนื่องจากอายุที่มากขึ้น MP3 จึงมีข้อจำกัดที่สำคัญ: ความลึกของบิตสามารถเป็น 16-24 บิต ความถี่ในการสุ่มตัวอย่างจะแสดงเป็นค่าที่ไม่ต่อเนื่องเท่านั้น (8, 11, 025, 12, 16, 22, 05, 24, 32, 44, 1, 48) อัตราบิตจำกัดที่ 320 kbps นอกจากนี้ ใน MP3 เวอร์ชันปกติ จำนวนช่องสัญญาณยังจำกัดอยู่ที่สองช่อง

AAC

คราดเดียวกันเฉพาะในโปรไฟล์ พัฒนาโดย Fraunhofer Society ต่อมาและใช้รูปแบบจิตอะคูสติกต่างๆ ที่ทันสมัยกว่า ข้อมูลที่เปิดเผยต่อสาธารณะทำให้เราสรุปได้ว่า ใช่ พวกเขาสามารถปรับปรุงการสร้างสรรค์ของตนเองได้

แม้จะมีตัวเลขพื้นฐานที่สุด AAC ก็ยังเป็นรูปแบบที่ยืดหยุ่นกว่า ความลึกของบิตของไฟล์ที่ได้รับจากการพัฒนานี้มีตั้งแต่ 16 ถึง 24 ความถี่ในการสุ่มตัวอย่างหากต้องการจะทำให้ภาพเสียงไม่สูญหายและอยู่ในช่วง 8-192 kHz โดยทั่วไปสตรีมข้อมูลจะเข้าใกล้รูปแบบที่ไม่สูญเสียข้อมูล (สูงสุด 512 kbps) ในขณะที่จำนวนช่องไฟล์ AAC สูงสุดจะอยู่ที่ 48

แบบไหนดีที่สุดแน่นอน

เมื่อพิจารณาว่า AAC เป็น MP3 ที่คิดใหม่หลังจากผ่านไปหลายสิบปี ทางเลือกจึงเข้าข้าง หากต้องการ การเปรียบเทียบเฉพาะ MP3 กับ OGG ก็สมเหตุสมผลแล้ว มาชมภาพที่สร้างขึ้นโดย Andrey Aspidov ผู้มีเกียรติจาก ixbt.com:

1
1

บนกราฟ - AudioCD ที่ดี, OGG บีบอัดด้วยบิตเรตตัวแปร 350 kbps และ MP3 โดยใช้ Lame ยิ่งกราฟต่ำ เสียงก็ยิ่งใกล้เคียงกับต้นฉบับมากขึ้น กลายเป็นภาพที่น่าสนใจมาก แม้ว่า MP3 จะตัดความถี่สูงอย่างชัดเจน ตรงกันข้ามกับ OGG ซึ่งคุณสามารถเห็นการอุดตันที่ต่ำกว่า 2 kHz

2
2

การกระจายความถี่-เวลาของเสียงพูดถึงสิ่งที่น่าสนใจไม่น้อย ที่อัตราบิตคงที่ 320 kbps MP3 เกือบจะเหมือนกับการบันทึกต้นฉบับ ทุกอย่างดูเหมือนจะเข้าที่แล้ว แต่ … อันที่จริงทุกอย่างยิ่งสับสนมากขึ้น

ทำไมต้องใช้การสูญเสียเลยเมื่อมีการสูญเสียไม่พร้อมใช้งาน

การใช้ความคิดเบื้องต้น.

ความจริงก็คือการบันทึกแบบแอนะล็อกส่วนใหญ่ไม่มีจำนวนข้อมูลที่จะต้องจัดเก็บในรูปแบบคุณภาพสูง อย่าลืมว่าอัตราการสุ่มตัวอย่างดั้งเดิมสำหรับซีดีคือ 44.1 kHz การหาปริมาณเพียง 16 บิต

กราฟก่อนหน้านี้แสดงให้เห็นถึงความเที่ยงตรงสูงของการส่งสัญญาณ MP3 แต่สำหรับเทปเสียง เทปแม่เหล็ก (เว้นแต่แน่นอนว่านี่คือเทปหลัก) ลักษณะของ AudioCD นั้นไม่สามารถบรรลุได้ และสำหรับอุปกรณ์ในสตูดิโอขนาดใหญ่ ความสามารถในการบันทึกเสียงแอนะล็อกที่สอดคล้องกับ AudioCD ได้ปรากฏขึ้นค่อนข้างเร็ว ไม่มีประโยชน์ในการแปลงไฟล์เป็นดิจิทัลใน FLAC (และใน WAV มากยิ่งกว่านั้น) การบันทึกคอนเสิร์ตหรือแผ่นดิสก์จากยุคก่อนยุคดิจิทัล โดยเฉพาะอย่างยิ่งสิ่งที่ทำจากสื่อแม่เหล็ก ไม่มีสเปกตรัมเหล่านั้นและจำนวนข้อมูลที่สามารถจัดเก็บโดยคอนเทนเนอร์โดยไม่ต้องบีบอัด

สิ่งที่เปลี่ยนไปในวันนี้

วิศวกรเสียงที่หายากสร้างการบันทึกเสียงหลักแบบดิจิทัล (ซึ่งจากนั้นทำซ้ำบนสื่อทางกายภาพ) โดยใช้เทคโนโลยีที่ทันสมัยอย่างเต็มที่ ดังนั้น โอกาสที่แทร็ก 24 บิตจะเป็นเพียง 16 บิตจึงสูงมาก

การบันทึกคุณภาพสูงแบบอะนาล็อกบนอุปกรณ์คุณภาพสูงนั้นยากยิ่งกว่าในปัจจุบัน - ถ้าเฉพาะสำหรับแฟน ๆ ของเสียงนี้ ตัวอย่างเช่น Jack White อดีตผู้นำของ White Stripes ในเวลาเดียวกัน การบันทึกของเขาบางส่วนอ้างถึงรูปแบบของ lo-fi และการมองหาลักษณะเสียงที่อุกอาจของแทร็กก็กลายเป็นความสุขสำหรับนักชิม

หากคุณนึกภาพถึงแหล่งข้อมูลในอุดมคติ เฉพาะหูที่ผ่านการฝึกฝนหรือฟังจากอุปกรณ์เสียงคุณภาพสูงเท่านั้นที่จะช่วยให้คุณค้นหาไฟล์บีบอัดได้ และตามนี้แล้ว (และไม่ลืมเกี่ยวกับการรับรู้) คุณควรสรุปดังต่อไปนี้:

AAC จำเป็นและเพียงพอสำหรับอุปกรณ์ราคากลางในกรณีที่ไม่มี (และในกรณีที่ไม่มีแหล่งที่มาที่สามารถเข้ารหัสใน AAC) - MP3 ที่มีอัตราบิตคงที่ 320 kbps สร้างขึ้นโดยใช้ตัวแปลงสัญญาณ Lame 3.93 (คีย์ที่แนะนำสำหรับ ถอดรหัส: -cbr -b320 -q0 -k -ms)

ข้อยกเว้นคือการบันทึกที่เดิมบันทึกด้วยคุณภาพสูง เช่น บันทึกในรูปแบบ DVD-Audio, SACD หรือการบันทึกที่รวบรวมในรูปแบบ DSD (หรือรูปแบบที่คล้ายกัน) ด้วยอัตราบิตสูง

แม้ว่า lossless จะมีคุณสมบัติบางอย่าง และเราจะบอกเกี่ยวกับพวกเขาในครั้งต่อไป