ما هي القابلية للفهرسة (Indexability)؟

القابلية للفهرسة هي قابلية صفحة الويب أن يتم فهرستها بواسطة محركات البحث، فقط الصفحات القابلة للفهرسة يمكن أن تظهر في نتائج البحث.

لفهرسة صفحة ويب، يجب على محركات البحث مثل جوجل أن:

  1. تكتشف عنوان URL للصفحة.
  2. تقوم بزحفها (تنزيل محتواها).
  3. معالجتها (فهم واستخراج المعلومات الرئيسية من الصفحات التي تم زحفها).

فقط بعد ذلك يمكن أن تظهر الصفحة في نتائج البحث.

إذا لم تتمكن برامج الزحف (web crawlers) من أداء مهمتها والزحف الي صفحة على موقعك، فلن يتمكنوا من فهرسة تلك الصفحة بشكل صحيح، وبدون الفهرسة، لن تتمكن صفحة موقعك من جلب أي زيارات من محركات البحث لأنها ستظل غير مرئية لها.

ما هي أهمية القابلية للفهرسة؟

القابلية للفهرسة تتيح لمحركات البحث عرض صفحات موقعك في صفحات نتائج محركات البحث (SERPs)، وبدون الفهرسة، لن تتمكن من جلب أي زيارات عضوية (organic traffic) إلى موقعك.

من الجدير بالذكر أن هناك حالات يكون فيها من المنطقي جعل بعض الصفحات غير قابلة للفهرسة. على سبيل المثال، يُفضل أن تكون صفحات مثل الصفحات منخفضة الجودة، أو صفحات “شكرًا لك على الاشتراك” غير قابلة للفهرسة، لا تريد أن تظهر هذه الصفحات في نتائج البحث.

بافتراض أنك تريد أن تحتل عناوين URL مرتبة جيدة، يجب عليك التأكد من أن هذه الصفحات قابلة للزحف (crawlable) والفهرسة (indexable).

ما الذي يجعل الصفحة قابلة للفهرسة؟

لكي تُعتبر الصفحة “قابلة للفهرسة”، يجب أن تستوفي المعايير التالية:

1. يجب أن تكون الصفحة قابلة للزحف

لكي يتم فهرسة صفحة ويب، يجب أن تتمكن برامج الزحف التابعة لمحركات البحث من الوصول إلى محتوى الصفحة وزحفها أولاً، وأحد الأشياء التي تؤثر بشكل مباشر على “قابلية الزحف” لصفحة الويب هو ملف robots.txt.
بالنسبة لأولئك الذين ليسوا على دراية بالجانب “التقني” من تحسين محركات البحث (SEO)، فإن ملف robots.txt هو ملف صغير موجود في الدليل الجذري لموقعك.

دوره هو تقديم تعليمات لبرامج الزحف وإخبارها بالصفحات التي يجب عدم زحفها على موقعك، وإلا، ستقوم برامج الزحف بزحف أي صفحة يمكنها العثور عليها على الموقع؛ فهي تفعل ذلك بشكل افتراضي.

هناك حالات يكون فيها وضع مثل هذه “القيود” منطقيًا، ومع ذلك، من الضروري التأكد من أنك لا تقوم بحظر الصفحات التي تريد فهرستها دون قصد.

2. يجب ألا تحتوي الصفحة على وسم “noindex”

وسم “noindex” هو توجيه موجود على الصفحة يخبر محرك البحث بعدم فهرسة صفحة معينة. ببساطة، يمنع هذه الصفحة من الظهور في صفحات نتائج محركات البحث (SERPs).
في بعض الأحيان، يُنصح باستخدام “noindex” لصفحات معينة – مثل صفحات تسجيل الدخول، أو الصفحات الضعيفة أو منخفضة الجودة، أو صفحات “شكرًا لك” – وذلك للحفاظ عليها “خاصة أو سرية”.

ومع ذلك، إذا أسأت استخدام هذا التوجيه أو نسيت إزالته من الصفحة التي تريد فهرستها، فستفقد الزيارات العضوية من محركات البحث.

يمكنك استخدام أداة Ahrefs Webmaster Tools لزحف موقعك والتأكد من أن أيًا من الصفحات التي تريد فهرستها لا تحتوي على وسم “noindex”.

3. يجب أن تكون الصفحة أساسية (Canonical)

وسم الأساسية (Canonical Tag) (rel=“canonical”) في كود الصفحة يُحدد النسخة الرئيسية للصفحات المكررة أو شبه المكررة أو المتشابهة، وهذا يعني أنه يمكن فهرسة الصفحات الأساسية فقط، بينما سيتم استبعاد النسخ غير الأساسية.
ما لم تقم بإضافة وسم الأساسية إلى صفحة ما، ستعتمد جوجل على إشارات مثل الروابط الداخلية والخارجية، خريطة الموقع (XML Sitemap)، وإعادة التوجيه (Redirects) لتحديد عنوان URL الذي سيمثل تلك المجموعة في فهرسها.

هذا يعني أنه إذا كنت تريد أن تظهر صفحتك في نتائج البحث، يجب ألا تُعلن أي صفحة أخرى كنسخة أساسية لها، ومن أفضل ممارسات تحسين محركات البحث (SEO) أن تحتوي الصفحات القابلة للفهرسة على وسوم أساسية تشير إلى نفسها (Self-Referencing Canonical Tags).

كيف تساعد جوجل على فهرسة صفحتك؟

إليك ما يمكنك فعله لمساعدة جوجل على فهرسة صفحات موقعك:

1. تقديم خرائط الموقع (Sitemaps) إلى جوجل

خريطة الموقع هي في الأساس قائمة (عادةً بتنسيق XML) تحتوي على جميع الصفحات الموجودة على موقعك.
دور خريطة الموقع هو إخبار جوجل بالصفحات التي تريد فهرستها على موقعك.

قبل تقديم خريطة الموقع، تحقق مما إذا كانت تعكس الحالة الحالية لموقعك وقم بإصلاح أي أخطاء – مثل الروابط المعطلة أو الصفحات اليتيمة (orphaned pages) وما شابه ذلك.

يمكنك تقديم خرائط موقعك إلى جوجل باستخدام أداة Google Search Console.

2. تقديم صفحات فردية عبر أداة فحص URL

إذا كنت ترغب في طلب فهرسة أو إعادة فهرسة عدد قليل من عناوين URL الفردية، يمكنك استخدام أداة URL Inspection Tool في Google Search Console.
أداة فحص URL هي أداة موجودة في جوجل سيرش كونسول تقدم لك نظرة على النسخة المفهرسة من صفحة الويب الخاصة بك على جوجل، وتتيح لك اختبار عناوين URL مباشرة وعرض النسخة المعالجة من الصفحة، بالإضافة إلى ميزات أخرى.

كما تتيح لك تقديم صفحات فردية إلى جوجل لطلب فهرستها.

إذا كنت ترغب في طلب فهرسة عنوان URL جديد، أو إعادة الزحف وإعادة الفهرسة لعناوين URL المحدثة، يمكنك إخبار جوجل بذلك عن طريق النقر على زر “Request Indexing”. إذا لم تكن هناك أخطاء في عنوان URL المباشر، ستقوم جوجل بإضافة صفحتك إلى قائمة الانتظار للزحف.

لكن لاحظ أن هناك حدًا لعدد عناوين URL التي يمكنك طلب فهرستها في اليوم.

3. استخدام روابط داخلية لتحسين إمكانية الاكتشاف أو تسريعه

طريقة أخرى لتشجيع الزحف، وبالتالي تسريع فهرسة الموقع، هي استخدام الروابط الداخلية.
أثناء قيامها بفحص الإنترنت، تتبع برامج زحف جوجل مسارًا يتكون من الروابط، لذلك عندما تقوم صفحة على موقعك بالربط بصفحة أخرى، ستتبع برامج الزحف هذا المسار الموجود – وتكتشف محتوى جديدًا.

الصفحات التي لا تحتوي على روابط داخلية تُسمى “صفحات يتيمة” (orphan pages).

لهذا السبب، من الضروري التأكد من أنك وفرت روابط داخلية تؤدي إلى صفحاتك الأكثر أهمية وتخرج منها، عادةً ما يحدث هذا بشكل طبيعي عند إنشاء موقع منظم جيدًا.

ومع ذلك، لا ضرر من التحقق مما إذا كانت هناك صفحات يتيمة – أي صفحات لا تحتوي على روابط داخلية تشير إليها – على موقعك، يمكنك القيام بذلك باستخدام أداة Site Audit التي توفرها منصة Ahrefs.

من الجدير بالذكر أيضًا أنه يجب التأكد من أن هذه الروابط الداخلية التي تشير إلى الصفحات القابلة للفهرسة لا تحتوي على وسم “nofollow”، لأن جوجل لن تقوم بزحف الروابط التي تحتوي على “nofollow”.

مرادفات المصطلح:
قابلية الفهرسة, إمكانية الفهرسة, الفهرسة, Indexability