يعد الفيديو الرقمي واحداً من الأمور المسلم بها اليوم في الواقع، حيث بات مسيطراً على مختلف مجالات عرض الصور المتحركة، وحتى بالنسبة للتلفاز بات من الصعب العثور على أي بث فيديو تناظري غير رقمي. والسبب في الأمر بسيط في الواقع: ضغط الفيديو الرقمي فعال جداً.
المقصود بفكرة ضغط الفيديو الرقمي هو الحصول على حجم ملف أصغر للفيديو، مما يجعل المجال المطلوب لبثه أصغر وأصغر، وذلك دون تصغير مقاساته، ومع أقل تأثير ممكن على جودة ما يتم عرضه.
في هذا الموضوع سنتحدث عن الطرق المعتادة لضغط الفيديو الرقمي، وكيف من الممكن لفيديوهات هائلة الحجم أن تصبح أصغر بمراحل دون حدوث خسارات كبرى في الجودة أو الدقة.
المحتويات
طريقة ضغط الفيديو الرقمي
يتكون الفيديو من مجموعة من الإطارات التي تعرض بشكل سريع ومتتابع، حيث أن هذه الإطارات ليست سوى صور تعرض بمعدلات عالية (24 أو 30 مرة في الثانية) لتشكل وهم الحركة لدى المشاهد.
في حال لم يكن الفيديو مضغوطاً، فسيحتاج لمساحة هائلة حقاً. حيث أن فيديو بدقة FullHD مثلاً، سيتضمن 30 إطاراً كل ثانية، كل إطار منها بدقة 1920×1080 أي أنه يحتوي أكثر من 2 مليون بكسل. كل بكسل يحتاج مساحة 3Byte لتخزين معلوماته اللونية، بالتالي يكون حجم الإطار 6MB، وخلال ثانية واحدة فقط يحتاج الفيديو 180MB.
بالطبع لا يمكن التعامل مع فيديو ذو حجم هائل كهذا، فهو كبير جداً بالنسبة لوحدات التخزين، كما أن محاولة بثه عبر الإنترنت تحتاج إلى سرعات هائلة تتجاوز 1.4Gb/s.
لحل المشكلة تتضمن معايير MPEG نوعين مختلفين من ضغط الفيديو. حيث يتم تطبيق الضغط داخل كل إطار على حدة (Intra-frame)، كما يتضمن ضغط الإطارات معاً (Inter-frame). وكل من هذين النوعين هو ضغط تدميري (Lossy Compression) يسبب خسارة بالمعلومات لا يمكن التراجع عنها.
الضغط داخل الإطارات (Intra-frame Compression)
من حيث المبدأ يعتمد هذا الضغط نفس مبدأ ضغط صور JPEG التقليدي. حيث يتم التعامل مع كل إطار على أنه صورة:
- يتم تحويل نظام الألوان من RGB إلى Y’CbCr والحد من المجال اللوني.
- يتم تقسيم الصورة إلى كتل كل منها مكونة من مربع بقياس 8×8 بكسل.
- يتم تطبيق مجموعة من الخوارزميات الرياضية المعقدة لاختزال التفاصيل وإبقاء المعلومات الأساسية فقط.
في الواقع يعد مبدأ هذا النوع من الضغط معقداً إلى حد ما، وفي حال كان لديك الفضول لمعرفة تفاصيل عمله يمكنك مراجعة مقالنا التفصيلي عن طريقة ضغط صور JPEG، ولماذا يعد هذا النوع من الضغط فعالاً جداً.
مع تطبيق ضغط JPEG على الإطارات ضمن الفيديو، من الممكن تصغير حجمه بشكل كبير في الواقع، حيث أن حجم كل إطار من الممكن أن ينخفض حتى 10% من حجمه غير المضغوط فقط. وفي صيغ الفيديو القديمة كان هذا المدى من الضغط يعد كافياً في الواقع.
بالطبع وكون ضغط JPEG قابلاً لتحديد شدته، فمن الممكن التحكم بمدى تأثير هذا الضغط على الفيديو. حيث توضع قيم جودة عالية (ومعدل ضغط منخفض) إن كان التركيز على الجودة. فيما يتم رفع معدل الضغط والتضحية بالجودة في حالات أخرى.
الضغط بين الإطارات (Inter-frame Compression)
عادة ما تكون الإطارات المتتالية في الفيديو مكونة من نفس المحتويات تقريباً. وفي حال استخدام كاميرا ثابتة للتصوير تكون الإطارات متطابقة من حيث الخلفية، فيما تكون التغيرات محصورة ببعض العناصر ضمن جزء من الإطار فقط.
يتم الاستفادة من كون الإطارات المتتالية في الفيديو متشابهة لتطبيق ما يعرف باسم الضغط بين الإطارات. ففي هذا النوع من الضغط لا تحفظ جميع إطارات الفيديو في الواقع، بل يتم حفظ إطارات أساسية (تشكل نسبة صغيرة من المجموع)، ومن ثم يتم تخزين معلومات تغير الإطار التالي بالنسبة للإطار الأصلي.
على فرض أن الصورة أعلاه تتضمن إطارين متتاليين من فيديو ما. من الممكن تخزين الإطارين كل على حدة، أو بالمقابل يمكن تخزين الإطار الثاني على أنه نفس الإطار الأول لكن مع تحريك المربع في المنتصف إلى اليسار قليلاً مع تغير لونه.
في هذا النوع من الضغط يكون هناك 3 أنواع مختلفة من الإطارات عادة:
- إطارات I-frames: وهي الإطارات الأصلية، تحفظ بشكل مستقل ولا تعتمد على إطارات أخرى، وتتعرض لضغط JPEG فقط.
- إطارات P-frames: هي إطارات يتم اشتقاقها من الإطار الأصلي السابق لها مع بعض التغييرات، حيث تبقى الخلفية ثابتة، لكن قد تضاف عناصر جديدة أو يتم تحريك بعض العناصر فقط. وعادة ما يكون حجمها قرابة نصف حجم إطارات I.
- إطارات B-Frames: هي إطارات يتم استنتاجها من الإطارات السابقة والتالية لها. تعد ذات جودة قليلة عموماً، ونادراً ما تكون واضحة. وعادة ما يكون حجمها قرابة ربع حجم إطارات I وأحياناً أصغر.
عادة ما تستخدم هذه الأنواع الثلاثة من الإطارات معاً في الفيديو، حيث يتم توزيع إطارات I بمعدل واحد كل 10 حتى 15 إطاراً بالمتوسط، وبين إطارات I توضع إطارات P وB حسب الحاجة ومعدل الضغط المطلوب. وبالطبع كلما زادت نسبة إطارات B تنخفض جودة الفيديو بوضوح.
بالطبع من المهم إدراج إطار I جديد مع بداية كل مشهد جديد، حيث يتطلب الأمر هنا تغييراً جذرياً في الإطار بدلاً من تغيرات صغيرة. لذا وفي حال تلف إطار I المرجعي في بداية مشهد جديد، من الممكن أن تتشوه الشاشة بوضوح لبعض الوقت ريثما يصل الفيديو إلى إطار مرجعي جديد وصالح.
بفهم طريقة الضغط بين الإطارات في الفيديو، يصبح من الواضح سبب كون الفيديوهات التي تتضمن شخصاً يتحدث مع خلفية ثابتة مثلاً، أصغر حجماً وأفضل جودة من تلك التي تتضمن الكثير من الحركة أو تغير زوايا الكاميرا مثل المباريات الرياضية، أو حتى الأجزاء الصغيرة المتحركة كنثرات الثلج مثلاً.
مفهوم معدل البث (Bitrate) وكيف يحدد جودة الفيديو
يعتبر معدل البث الخاص بالفيديو واحداً من أهم الأمور التي تعرف عن كل فيديو، حيث أنه يحدد الجودة الخاصة بالفيديو وحجمه، وبالتالي فهو قيمة أساسية من المهم فهمها.
يعبر عن معدل البث باستخدام مضاعفات b/s (بت بالثانية)، حيث أنه كمية البيانات المسموح استخدامها لإطارات الفيديو في كل ثانية. وكلما ارتفعت قيمة معدل البث يكون الملف أكبر حجماً، ويحتاج لاتصال إنترنت أسرع للتمكن من بثه.
غالباً ما يكون معدل البث للفيديو ثابتاً، أي أن جميع الثواني يجب أن تمتلك حجم بيانات متساوٍ. بالنتيجة من الممكن لفيديو ما أن يكون ذا جودة عالية جداً في مقاطع منه عندما تكو الخلفية ثابتة مثلاً، لكن الصورة تصبح مشوشة والتفاصيل ضائعة عندما تحدث حركات سريعة عديدة تمنع ثبات عناصر الصورة.
في الواقع وإن كنت تشاهد البث التلفزيوني الرقمي، هناك احتمال بأنك قد لاحظت هذه الانخفاضات المفاجئة بالجودة، وكذلك هو الأمر في الفيديو الرقمي المعتاد أو تطبيقات البث المباشر.
سبب هذه الظاهرة هو أن الفترات التي لا تحتاج الكثير من الإطارات المرجعية تستطيع استغلال معدل البث الأعلى من اللازم لتقليل ضغط الصور وتحسين جودتها، لكن عندما يكون هناك حركات سريعة يصبح من الضروري استخدام الكثير من الإطارات المرجعية، ولإبقاء الفيديو ضمن معدل البث المسموح يتم ضغط الإطارات بشكل أكبر من المعتاد مما يجعل الجودة تنحدر بشدة.
في الفترة الأخيرة بات من الشائع استخدام معدلات بث متغيرة في الفيديوهات، حيث أن هذه الطريقة مفيدة جداً للحفاظ على الجودة، لكنها قد تسبب متاعباً عند بث الفيديو مثلاً، كما أن العديد من المشغلات كانت تعاني عند محاولة تشغيل هذه الفيديوهات.
أسئلة وأجوبة سريعة
معدل البث هو حجم البيانات التي يستخدمها الفيديو للتعبير عن محتواه من إطارات خلال كل ثانية. وعادة ما يرتبط معدل البث بالجودة، أي أن الفيديو ذا معدل البث الأعلى يمتلك جودة أفضل (بفرض وجود نفس المحتوى واستخدام نفس الترميز).
من الممكن لمقطعي فيديو أن يمتلكا نفس الدقة والمحتوى لكن بحجم مختلف إن كان معدل البث المستخدم لكل منهما مختلفاً عن الآخر بالطبع.
يستخدم نوعا ضغط معاً في عملية ضغط الفيديو. حيث يتم تصغير حجم كل إطار على حدة أولاً، ومن ثم تحول الإطارات إلى مرجعية تخزن بشكل كامل، وإطارات ثانوية تخزن على أنها تغييرات على الإطار المرجعي السابق.
بينما يتم ضغط الفيديو المعتاد بفعالية كبيرة عند إنشاءه (أو عند الرندرة)، ففيديو البث المباشر لا يضغط بنفس الفعالية حقاً. حيث أن الوقت القصير جداً بين صنع إطار الفيديو والحاجة لإرساله عبر الإنترنت لا تترك وقتاً كافياً لضغط الفيديو بالشكل المثالي.
بالنتيجة تكون فيديوهات البث المباشر ذات حجم أكبر من الفيديوهات المماثلة لها بالجودة والدقة لكن مسجلة سابقاً. وللحصول على حجم صغير قابل للعرض بشكل أسهل يضحي الفيديو المباشر بالكثير من جودته للوصول إلى الحجم المطلوب والمسموح له.
تتضمن عملية رندرة الفيديو تطبيق الضغط داخل الإطار لجميع إطارات الفيديو (عادة 24 حتى 30 كل ثانية)، بالإضافة لتحليل الإطارات المتتالية وتحديد أيها يجب أن يكون مرجعياً وأيها لا، وما هي الأمور التي تغيرت بين الإطار المرجعي والإطارات التالية له.
كلما كانت عملية الرندرة مصممة للحصول على حجم أصغر (دون خسارة الكثير من الجودة) تأخذ وقتاً أطول. بينما تسير العملية أسرع إن كان من الممكن التضحية بالجودة على حساب السرعة كما هو الأمر عند بث الفيديو المباشر.
لا يمكن هذا أبداً. حيث يخضع الفيديو لعملية تسمى الضغط التدميري (Lossy Compression) تؤدي إلى ضياع جزء من المعلومات للأبد دون رجعة. وبغض النظر عن التحويل لا يمكن استعادة تفاصيل غير مخزنة في ملف الفيديو، وبالتالي لا يمكن تحسين جودته.
هناك اختبارات لاستخدام الذكاء الاصطناعي في تخمين مكونات الفيديو وجعلها تبدو أوضح، لكن حتى الأن العملية بطيئة جداً ونجاحها مشكك به بأفضل الحالات.
تصمم أقراص Blu-ray لتعمل على مشغلات أقراص مع قدرات معالجة محدودة جداً، لذا فهي تستخدم معايير ضغط قديمة وقليلة الفاعلية إلى حد بعيد بدلاً من معايير الضغط الحديثة التي تحتاج معالجة أكثر لكنها توفر معدلات ضغط أكبر بكثير مع الاحتفاظ بالدقة ومعظم الجودة.