گوگل بات – Googlebot

Googlebot یک ربات جستجوی نرم افزار خزنده وب است و همچنین  وب خزنده شناخته می شود که اطلاعات صفحه وب مورد استفاده برای ارائه صفحات نتایج موتور جستجوی Google ( SERP ) را جمع آوری می کند .

Googlebot اسناد را از وب جمع آوری می کند تا فهرست جستجوی Google را ایجاد کند.از طریق جمع آوری مداوم اسناد، نرم افزار صفحات جدید را کشف می کند و صفحات موجود را به روز می کند و صفحات موجود را به روز می کند. Googlebot از طراحی توزیع شده ای استفاده می کند که رایانه های زیادی را در بر می گیرد تا بتواند مانند وب رشد کند.

وب خزنده از الگوریتم‌هایی استفاده می‌کند تا تعیین کند چه سایت‌هایی را مرور کنند و از چند صفحه واکشی کنند. Googlebot با لیستی که از جلسات قبلی ایجاد شده شروع می شود. سپس این لیست توسط نقشه های سایت ارائه شده توسط وب مسترها افزوده می شود . این نرم افزار تمام عناصر مرتبط را در صفحات وب که مرور می کند می خزد و به سایت های جدید، به روز رسانی سایت ها و پیوندهای مرده اشاره می کند. اطلاعات جمع آوری شده برای به روز رسانی فهرست وب گوگل استفاده می شود.

Googlebot یک فهرست با محدودیت‌های تعیین شده توسط وب‌مسترها در فایل‌های robots.txt ایجاد می‌کند. برای مثال، اگر مدیر وب‌سایتی بخواهد صفحات را از جستجوی Google پنهان نگه دارد، می‌تواند Googlebot را در فایل robots.txt در پوشه سطح بالای سایت مسدود کند. برای جلوگیری از دنبال کردن پیوندهای Googlebot در یک صفحه مشخص از یک سایت، می تواند متا تگ nofollow را اضافه کند. برای جلوگیری از دنبال کردن لینک‌های جداگانه توسط ربات، مدیر وب‌سایت می‌تواند rel=”nofollow” را به خود پیوندها اضافه کند.

مدیر وب سایت ممکن است بازدیدها را هر چند ثانیه یکبار از رایانه های موجود در google.com شناسایی کند و Googlebot عامل کاربر را نشان دهد. به طور کلی، گوگل سعی می کند تا جایی که می تواند یک سایت را ایندکس کند بدون اینکه پهنای باند سایت را زیاد کند. اگر مدیر وب سایت متوجه شود که Googlebot از پهنای باند بیش از حد استفاده می کند، می تواند نرخی را در صفحه اصلی کنسول جستجوی Google تعیین کند که به مدت 90 روز قابل اجرا خواهد بود.

جاش جیاردینو در کنفرانس SearchLove سال 2011 ادعا کرد که Googlebot در واقع مرورگر کروم است. این بدان معناست که Googlebot نه تنها مانند خزنده ها توانایی مرور صفحات در متن را دارد، بلکه می تواند اسکریپت ها و رسانه ها را مانند مرورگرهای وب اجرا کند. این ظرفیت می تواند به Googlebot اجازه دهد اطلاعات پنهان را پیدا کند و کارهای دیگری را انجام دهد که توسط Google تأیید نشده است. جیاردینو تا آنجا پیش رفت که گفت که Googlebot ممکن است دلیل اصلی ایجاد کروم باشد.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *