في حال كنت تستخدم الإنترنت عبر متصفح معتاد لأي مدة من الزمن فلا شك أنك شاهدت أمراً غريباً يحصل للروابط من وقت لآخر، وبالأخص في حال قمت بنسخها للصقها في مكان آخر. حيث أن رابطاً طبيعياً مثل:
https://example.com/بحث
سيتحول عند نسخه من المتصفح إلى:
https://example.com/%D8%A8%D8%AD%D8%AB
دون سبب واضح.
يمكنك تجربة الأمر بالبحث ضمن موقعنا باستخدام كلمة عربية، ومن ثم نسخ رابط صفحة النتائج ولصقه في مكان آخر، وستجد أن الأحرف العربية وبعض الرموز الأخرى اختفت وتم استبدالها بسلسلة من إشارة % وأرقام وأحرف إنجليزية. وهنا سنشرح لك السبب البسيط الواقف أمام هذا التصرف المحير للبعض.
الحوسبة صنعت للولايات المتحدة، ومن ثم احتاجت للتعديل في كل مكان آخر
كما يعلم معظم الأشخاص اليوم، فتاريخ الحواسيب مرتبط بشدة بتاريخ الولايات المتحدة التي كانت سباقة في المجال. حيث أن الغالبية العظمى من التقنيات الحديثة طورت في الولايات المتحدة، أو أنها طورت من تقنيات صنعت هناك. ومن بين مختلف الأمور التي طورت في الولايات المتحدة هناك الحواسيب الحديثة كمثال.
كما يعلم الجميع ربما، لا تستطيع الحواسيب فهم لغتنا البشرية حقاً، لذا كان من الضروري وجود معيار يقوم بتحويل لغتنا المكونة من حروف وأرقام ورموز إلى لغة الآلة المكونة من الرقمين 0 و1 فقط. وفي عام 1960 تم وضع ترميز يحمل اسم ASCII يقوم بتحويل الأحرف والأرقام وبعض الرموز إلى لغة الآلة بحيث أن كل محرف منها يشغل مساحة 7bit فقط (علماً أن كل Byte يساوي 8bit).
المشكلة الأساسية في ترميز ASCII أنه صنع ليمون متوافقاً مع اللغة الإنجليزية فقط، بالنتيجة فهو يتضمن الأحرف من a إلى z ومن A إلى Z بالإضافة للأرقام وعدة رموز ومحارف أخرى. لكن بعض الأحرف الأوروبية مثل ê أو ñ ليست موجودة، كما أن كل الأبجديات غير اللاتينية غير متاحة أصلاً. بالنتيجة لا تستطيع كتابة العربية أو الصينية أو الروسية مثلاً باستخدام ترميز ASCII.
اقرأ المزيد: لماذا الرسائل النصية العربية محدودة بـ 70 محرفاً فقط، بينما يمكن إرسال حتى 160 باللغة الإنجليزية؟
تعديل القديم لتحسينه أسهل من اعتماد شيء جديد
مع الوقت تم وضع العديد من الحلول لهذه المشكلة عبر اعتماد ترميزات شاملة أكثر مثل UTF-8، لكن بقي ترميز ASCII هو الأساسي كون اللغة الإنجليزية هي المستخدمة في البرمجة أصلاً. وعندما ظهر الويب للمرة الأولى في التسعينيات، تم اختيار ترميز ASCII ليكون الترميز المخصص للروابط.
بالنتيجة وطوال السنوات الأولى من عمر الويب كانت الروابط تكتب بالأحرف الإنجليزية حصراً (وهو تقليد مستمر حتى اليوم)، لكن مع الوقت كان لا بد من تغيير هذا الأمر وكان من الضروري إتاحة الأحرف المختلفة ضمن الروابط لتسهيل انتشار الإنترنت أكثر.
بالطبع كان هناك خياران: إما تغيير الترميز المستخدم في روابط الويب بشكل كامل، وهذه عملية صعبة إن لم تكن مستحيلة تماماً، أو إيجاد طريقة لكتابة المحارف الإضافية بشكل خارجي عبر ما بات يعرف بـ “ترميز الإشارة المئوية” (Percent Coding)، وكما هو واضح من الاسم فقد تم اعتماد النسبة المئوية ضمن هذا الترميز.
اقرأ المزيد: حل مشكلة ظهور الترجمة العربية كأحرف ورموز غريبة غير مفهومة
كيف يعمل ترميز الإشارة المئوية
مبدأ عمل ترميز الإشارة المئوية بسيط للغاية في الواقع، وكل ما يحتاجه هو أن يتم تغيير معنى النسبة المئوية، حيث أن المواقع لم تعد تقرأ نسبة مئوية عند استقبال المحرف، بل أنها تعتبره بداية لترميز قصير مكون من المحرفين التاليين للإشارة المئوية والذان هما أرقام ست عشرية. وبعدها يتم تفسير هذا الترميز على أنه محرف آخر، وفي الجدول أدناه يمكنك مشاهدة بعض الأمثلة على هذا الترميز.
في البداية استخدم هذا الترميز كطريقة لإدخال بعض المحارف الموجودة في ترميز ASCII، لكنها تمتلك استخداماً محدداً في عناوين المواقع. حيث أن إشارة / مثلاً تعني الانتقال إلى مجلد فرعي، لذا لا يجوز أن توجد في النص بشكل اعتباطي، بل يتم استبدالها لتكون %2F، وكذلك إشارة التعجب لا تظهر بهيئتها المعتادة !، بل تظهر %21، وفي حال أردت تضمين الإشارة المئوية نفسها يجب أن تقوم بتحويلها إلى رمزها المقابل: %25.
لاحقاً استخدمت نفس الطريقة للتعامل مع المحارف المختلفة من الأبجديات المختلفة، لكن مع محدودية ما يمكن التعبير عنه بترميز مئوي واحد، عادة ما يتم ترميز معظم المحارف الغير لاتينية إلى ترميزين مئويين متتاليين. مثلاً حرف التاء يكون %D8%AA، وكعرض جانبي تصبح الروابط التي تحتوي نصوصاً عربية على سبيل المثال طويلة جداً ولو لم يكن ذلك ظاهراً في البداية.
لماذا يظهر المتصفح الأحرف المختلفة دون ترميز الإشارة المئوية لكن الترميز يستخدم عند نسخ الرابط
في حال دخلت إلى المتصفح الآن وانتقلت إلى صفحة يتضمن عنوانها نصاً عربياً، ستلاحظ أنه يكتب كنص عربي عادة دون مشاكل. لكن هذا المظهر ليس معمماً في الواقع وهو موجود لتسهيل قراءة الروابط التي تحتوي محارف متنوعة فقط. أي أن ما يظهر لك هو المحارف، لكن على الشبكة يرسل الرابط مرمزاً بترميز الإشارة المئوية وليس كما يظهر لنا.
في الماضي كانت المتصفحات تظهر الروابط باستخدام ترميز الإشارة المئوية فقط، والكثير منها لم يكن يدعم إدخال روابط تتضمن محارف غير لاتينية حتى. بالنتيجة وعندما انتقلت المتصفحات نحو عرض الأحرف الأصلية بدلاً من ترميزاتها نشأت مشكلة توافقية، حيث أن رابطاً من متصفح حديث لن يعمل في متصفح قديم هكذا وهذا أمر غير مقبول بالطبع.
كحل لمشاكل التوافقية الممكنة مع المتصفحات القديمة، أو الخدمات التي قد لا تتعرف على الروابط إن تضمنت محارف خارج ترميز ASCII، تم الاتفاق على ترك الروابط تظهر في المتصفح كأحرف دون ترميز، لكن عندما تقوم بنسخ الرابط ما يحفظ ضمنه هو الرابط المرمز فقط.
اقرأ المزيد: أفضل برامج المتصفحات للحواسيب لتحصل على متصفح سريع يناسب حاجاتك
التأثير طويل الأمد لترميز الإشارة المئوية وطريقة كتابة الروابط
مع كون اللغات المختلفة لم تكن مدعومة في الروابط في بدايات انتشار الويب، كان من الطبيعي أن معظم المواقع العالمية أرغمت على استخدام اللغة الإنجليزية في عناوينها، وبغض النظر عن جنسية الموقع بات من المعتاد أن يكون الاسم إما باللغة الإنجليزية، أو على الأقل تهجئة للاسم الأصلي مكتوبة باللغة الإنجليزية.
مع كون الويب اليوم يسمح بالأحرف من مختلف اللغات فقد قررت معظم المواقع استخدام عناوين صفحات بلغاتها المحلية، لكن عناوين المواقع نفسها لا زالت والأرجح أنها ستبقى باللغة الإنجليزية بالنسبة لمعظم المواقع.
مؤخراً ومع دعم المتصفحات لإظهار الأحرف دون ترميزها، قامت بعض المواقع حول العالم باستخدام لغاتها الأصلية في العناوين، لكن هذا الأمر شبه معدوم في العالم العربي لسبب بسيط، فبينما اسم الموقع وعنوان الصفحة قابلان للكتابة بالعربية، لا يمكنك تعريب لاحقة الموقع (مثل .com و.org وسواها).
بالمحصلة إن حاولت أن تصنع موقعاً ذا اسم مكتوب بالعربية يمكنك ذلك، لكن اسم الموقع سيتسبب بمشاكل عديدة من حيث التنسيق وحتى الكتابة، فاللغة العربية تكتب من اليمين إلى اليسار، بينما تكتب الإنجليزية ومعظم لغات العالم من اليسار إلى اليمين.