خزنده وب چیست و چگونه کار میکند؟
شاید برای شما سوال پیش آمده که وبسایتهای مانند گوگل چگونه کار میکنند و محتوای جستجو شده توسط ما را پیدا میکنند. ما در این مقاله به این سوال شما پاسخ دادهایم.
آیا تا به حال به دنبال چیزی در Google رفتهاید؟ فکر میکنید گوگل از کجا میداند کجا را جستجو کند؟ پاسخ این است؛ خزنده های وب. خزنده وب در تمام وبسایتها جستجو میکند و آن را فهرست میکند تا بتوانید به راحتی چیزی که دنبال آن هستید را پیدا کنید.
موتورهای جستجو و خزنده وب
هنگامی که شما با استفاده از کلمه کلیدی در موتورهای جستجو مانند Google یا Bing جستجو میکنید، این موتورها از طریق غربال تریلیون صفحه لیستی از نتایج مربوط به درخواست شما را ایجاد میکنند. اما دقیقاً چگونه این موتورهای جستجو همه این صفحات را روی دیتابیس خود دارند، و میدانند چگونه به دنبال آنها بگردند و در عرض چند ثانیه این نتایج را ایجاد کنند؟
پاسخ خزنده وب است که به عنکبوت نیز معروف است. اینها برنامههای خودکاری هستند (که اغلب “ربات” نامیده میشوند) در سراسر وب میخزند یا مرور میکنند تا بتوانند محتوا را به موتورهای جستجو اضافه کند. این رباتها وب سایتها را فهرست بندی میکنند تا لیستی از صفحات را ایجاد کنند که در نهایت در نتایج جستجوی شما ظاهر میشوند.
همچنین خزنده وب یک کپی از این صفحات را در پایگاه داده موتور جستجوی مورد نظر ایجاد و ذخیره میکند، که به شما امکان میدهد تقریبا بلافاصله جستجو کنید. همچنین این دلیلی است که موتورهای جستجو اغلب نسخه های پنهان شده سایت ها را در پایگاه داده خود قرار میدهند.
نقشه سایت و گزینش
حالا یک سوال پیش میآیدخزنده وب چگونه وب سایتها را برای خزیدن انتخاب میکند؟ خوب، رایج ترین سناریو این است که دارندگان وب سایتها تمایل دارند وب سایت خود را به موتورهای جستجو معرفی کنند. آنها میتوانند با درخواست از گوگل، بینگ، یاهو یا موتور جستجوی دیگر برای فهرست بندی صفحات خود به این مهم دست یابند. این فرآیند با توجه به موتور جستجو میتواند متفاوت باشد. همچنین، موتورهای جستجو با ردیابی تعداد دفعاتی که یک URL در سایر سایتهای عمومی پیوند میشود، به طور مكرر وب سایتهای معروف و پیوند شده را برای خزیدن انتخاب میكنند.
دارندگان وب سایت می توانند از فرایندهای خاصی برای کمک به موتورهای جستجو استفاده کنند تا وب سایت های خود را معرفی کنند مانند بارگذاری نقشه سایت. نقشه سایت یک پرونده حاوی تمام پیوندها و صفحاتی است که بخشی از وب سایت شما هستند. به طور معمول برای نشان دادن صفحاتی که میخواهید ایندکس شوند استفاده میشود.
تبلیغات
هنگامی که موتورهای جستجو یک بار وب سایتی را جستجو کردند، آنها به طور خودکار دوباره آن سایت را جستجو میکنند. این فرکانس براساس محبوبیت یک وب سایت، در میان سایر معیارها، متفاوت است. بنابراین ، دارندگان سایت به طور مكرر نقشه های سایت را به روز را نگه میدارند تا به موتورهای جستجو تغییرات سایت خود را اطلاع دهند.
خزنده وب با ادب است!
اگر وب سایتی مایل نباشد بعضی یا همه صفحات آن در موتور جستجو نمایش داده شود، چه باید بکند؟ به عنوان مثال، ممکن است شما مایل نباشید صفحهای که فقط برای اعضایی سایت است یا صفحههای که با خطای 404 مواجهاند برای بازدیدکننده نمایش داده شوند. اینجاست که لیست استثنای خزنده، که به آن robots.txt نیز گفته میشود، وارد عمل میشود. این یک فایل متنی ساده است که به خزنده وب دستور میدهد صفحات مورد نظر شمارا را از فهرست بندی حذف کند.
دلیل دیگر مهم بودن robots.txt این است که خزنده وب می تواند تأثیر قابل توجهی بر عملکرد سایت داشته باشد. از آنجا که خزندهها اساساً تمام صفحات وب سایت شما را بارگیری میکنند، منابع را مصرف میکنند و میتوانند سرعت سایت شما را کاهش دهند. آنها در زمانهای غیرقابل پیش بینی و بدون تأیید از راه میرسند. اگر به صفحات خود نیاز ندارید که به طور مکرر ایندکس شوند، توقف خزیدن خزندهها روی سایت شما ممکن است به کاهش بار آن کمک کند. خوشبختانه خزنده وب بر اساس قوانین صاحب سایت از جستجوی صفحات خاص جلوگیری میکند.
سحر و جادو فرا دادهها
در زیر URL و عنوان هر نتیجه جستجو در Google ، شرح مختصری از صفحه را پیدا خواهید کرد. به این توصیفات قطعه گفته میشود. ممکن است متوجه شوید که قطعه یک صفحه در Google همیشه با محتوای واقعی وب سایت یکسان نیست. دلیل این امر این است که بسیاری از وب سایتها چیزی به نام “برچسبهای متا” دارند، که توضیحات سفارشی است که صاحبان سایت به صفحات خود اضافه میکنند.
صاحبان سایتها اغلب توضیحات فراداده فریبندهای را برای شما ایجاد میکنند که ترغیب شوید روی لینک آن سایت کلیک کنید. همچنین Google سایر متا اطلاعات، مانند قیمتها و در دسترس بودن سهام را لیست میکند. این به طور ویژه برای کسانی که وب سایتهای تجارت الکترونیکی دارند بسیار مفید است.
جستجو در وب
جستجوی وب قسمت اساسی استفاده از اینترنت است. جستجوی وب راهی عالی برای کشف وب سایتها، فروشگاهها، انجمنها و علایق جدید است. هر روز، خزنده وب از میلیون ها صفحه بازدید میکند و آنها را به موتورهای جستجو اضافه میکند. اگرچه خزندهها دارای نکات منفی مانند اشغال منابع سایت هستند، اما هم برای صاحبان سایت و هم برای بازدیدکنندگان بسیار ارزشمند هستند.