اصول موتورهای جستجو. موتورهای جستجوی اینترنتی

فهرست مطالب:

اصول موتورهای جستجو. موتورهای جستجوی اینترنتی
اصول موتورهای جستجو. موتورهای جستجوی اینترنتی
Anonim

در اینترنت، در سایت های مختلف، حجم زیادی از اطلاعات مختلف به کاربر ارائه می شود. موتورهای جستجو برای به دست آوردن اطلاعات لازم، جستجو برای پاسخ به سوالات ایجاد شده اند. با شنیدن این عبارت، بسیاری از مردم به گوگل، یاندکس فکر می کنند. با این حال، موتورهای جستجوی بسیار بیشتری در اینترنت وجود دارد.

موتور جستجو چیست

موتور جستجو نرم افزاری است که از پایگاه داده ای از اسناد تشکیل شده است. به کاربران یک رابط ویژه ارائه می شود که به آنها امکان می دهد پرس و جوهای لازم را وارد کرده و پیوندهایی با اطلاعات مربوطه دریافت کنند. اسنادی که بیشتر از همه با آنچه یک شخص خاص به دنبال آن است مطابقت دارند همیشه در بالای نتایج جستجو قرار دارند.

نتایج جستجو، که مطابق با پرس و جوی وارد شده ایجاد می شوند، معمولاً دارای انواع مختلفی از نتایج هستند. ممکن است حاوی صفحات وب، فایل‌های ویدیویی و صوتی، تصاویر، فایل‌های پی‌دی‌اف، محصولات خاص باشد (اگر جستجو در فروشگاه آنلاین انجام شود).

رتبه بندی موتورهای جستجو در جهان
رتبه بندی موتورهای جستجو در جهان

طبقه بندی موتورهای جستجو

موتورهای جستجوی موجود به انواع مختلفی طبقه بندی می شوند. در ابتدا لازم است به موتورهای جستجوی سنتی اشاره کنیم. برای چنین موتورهای جستجویی، اصول کار بر یافتن اطلاعات در تعداد زیادی از سایت های موجود متمرکز است. موتورهای جستجو هنوز در منابع اینترنتی جداگانه در دسترس هستند:

  • در فروشگاه های آنلاین (برای جستجوی محصولات مناسب)؛
  • در انجمن ها و وبلاگ ها (برای جستجوی پست ها)؛
  • در سایت های اطلاع رسانی (برای جستجوی مقالات در مورد موضوع یا اخبار مورد نظر) و غیره.

موتورهای جستجو نیز بر اساس ویژگی های جغرافیایی تقسیم بندی می شوند. در این طبقه بندی، 3 گروه از موتورهای جستجو وجود دارد:

  1. جهانی. جستجو در سراسر جهان انجام می شود. پیشرو در این گروه موتور جستجوی گوگل است. قبلاً موتورهای جستجو مانند Inktomi، AltaVista و غیره وجود داشت.
  2. منطقه ای. جستجو بر اساس کشور یا گروهی از کشورها انجام می شود که با یک زبان متحد شده اند. موتورهای جستجوی منطقه ای گسترده هستند. نمونه آنها در روسیه Yandex، Rambler است.
  3. محلی. جستجو در یک شهر خاص انجام می شود. نمونه ای از چنین موتورهای جستجو Tomsk.ru است.

اجزای موتورهای جستجو

در هر موتور جستجو، 3 عنصر تشکیل دهنده وجود دارد که اصول موتور جستجو را تعیین می کند:

  • ربات (شاخص، عنکبوت، خزنده)؛
  • پایگاه داده;
  • کنترل کننده درخواست.

Robot یک برنامه ویژه است که هدف آن ایجاد پایگاه داده است. پایگاه داده ذخیره و مرتب می کندتمام اطلاعات جمع آوری شده کنترل کننده درخواست که کلاینت نیز نامیده می شود، با درخواست های کاربر کار می کند. به پایگاه داده دسترسی دارد. کلاینت همیشه در یک رایانه قرار ندارد. کنترل کننده درخواست را می توان در چندین رایانه الکترونیکی غیرمرتبط فیزیکی پخش کرد.

کار موتور جستجو
کار موتور جستجو

اصول موتورهای جستجو

همه سیستم های موجود بر اساس یک اصل عمل می کنند. به عنوان مثال، عملکرد موتورهای جستجوی سنتی طراحی شده برای اینترنت را در نظر بگیرید. عملکرد ربات مشابه عملکرد یک کاربر عادی است. این برنامه به صورت دوره ای تمامی سایت ها را دور می زند، صفحات جدید و منابع اینترنتی را به پایگاه داده اضافه می کند. این فرآیند فهرست‌سازی نامیده می‌شود.

وقتی یک کاربر در اینترنت درخواست خاصی را در کادر جستجو وارد می کند، مشتری شروع به کار می کند. این برنامه به پایگاه داده موجود دسترسی پیدا می کند و نتایج را بر اساس کلمات کلیدی تولید می کند. موتور جستجو لینک ها را در یک توالی خاص به کاربر ارائه می دهد. آنها به گونه ای که با پرس و جو مطابقت دارند مرتب می شوند، یعنی ارتباط در نظر گرفته می شود.

هر موتور جستجو روش خاص خود را برای تعیین ارتباط دارد. اگر کاربر درخواست خاصی را به سیستم های مختلف ارسال کند، نتایج نه دقیقاً مشابهی را دریافت خواهد کرد. الگوریتم برای تعیین ارتباط مخفی نگه داشته می شود.

موتورهای جستجوی محبوب در روسیه
موتورهای جستجوی محبوب در روسیه

جزئیات مربوط

به عبارت ساده، ارتباط مطابقت کلمه یا ترکیبی از کلمات وارد شده در جستجو است.پیوندهای خاص در SERP چندین تفاوت بر موقعیت اسناد در لیست تأثیر می گذارد:

  1. وجود کلمات جستجو در اسناد. این تفاوت ظریف آشکار است. اگر سند حاوی کلماتی از درخواست وارد شده توسط کاربر باشد، به این معنی است که این سند با شرایط جستجو مطابقت دارد.
  2. تعداد وقوع کلمات. هرچه تعداد کلمات کلیدی در یک سند بیشتر باشد، در لیست SERP بالاتر خواهد بود. با این حال، همه چیز به این سادگی نیست. استفاده بیش از حد از کلمات می تواند نشانه محتوای بی کیفیت برای موتور جستجو باشد.

الگوریتم برای تعیین ارتباط بسیار پیچیده است. چند سال پیش، لینک‌هایی که حاوی کلمات کلیدی لازم بودند، اما از نظر محتوا با آنها مطابقت نداشتند، می‌توانستند وارد نتایج جستجو شوند. در حال حاضر، اصول عملکرد موتورهای جستجو پیچیده است. اکنون روبات ها می توانند کل متن را تجزیه و تحلیل کنند. موتورهای جستجو تعداد زیادی از عوامل مختلف را در نظر می گیرند. با تشکر از این، موضوع از با کیفیت ترین لینک های مرتبط شکل گرفته است.

چگونه درخواست ها را به درستی فرموله کنیم

حتی در مدرسه به ما یاد داده بودند که سؤالات را درست بپرسیم. بستگی به این دارد که چه نوع پاسخ هایی دریافت کنیم. اما در هنگام استفاده از موتورهای جستجو نیازی به رعایت این قانون نیست. برای موتورهای جستجوی مدرن، مهم نیست که شخص در چه تعداد یا موردی درخواست خود را بنویسد. در هر صورت، خروجی شامل همان نتایج خواهد بود.

موتورهای جستجو نیازی به یک جمله بندی واضح برای سوال ندارند. کاربر فقط باید کلمات کلیدی مناسب را انتخاب کند. یک مثال را در نظر بگیرید. ما باید پیدا کنیممتن آهنگ "یک روز بدون تو" که توسط گروه پاپ زن معروف "Via-Gra" اجرا شده است. هنگام تماس با موتور جستجو، لازم نیست گروه را نام ببرید، نشان دهید که این یک آهنگ است. کافی است بنویسید «یک روز بدون تو پیامک». حروف را حفظ کنید، علامت گذاری لازم نیست. این تفاوت های ظریف توسط موتورهای جستجو در نظر گرفته نمی شود.

جمله بندی صحیح پرس و جوها
جمله بندی صحیح پرس و جوها

رتبه بندی موتورهای جستجو در جهان

موتور جستجوی پیشرو در جهان گوگل است. در سال 1998 تاسیس شد. این سیستم بسیار محبوب است که توسط اطلاعات تحلیلی تأیید می شود. حدود 70 درصد از درخواست هایی که به اینترنت ارسال می شود توسط گوگل رسیدگی می شود. پایگاه داده موتور جستجو بسیار بزرگ است. بیش از 60 تریلیون سند مختلف نمایه شده است. گوگل با یک رابط کاربری ساده کاربران را جذب می کند. صفحه اصلی دارای لوگو و نوار جستجو است. این ویژگی به ما امکان می دهد گوگل را یکی از مینیمال ترین موتورهای جستجو بنامیم.

Bing دومین موتور جستجوی محبوب است. در همان سال با گوگل ظاهر شد. سازنده این موتور جستجو، شرکت بین المللی معروف مایکروسافت است. جایگاه های پایین تری در رتبه بندی توسط بایدو، یاهو، AOL، Excite، Ask اشغال شده است.

اصول موتور جستجو
اصول موتور جستجو

آنچه در روسیه محبوب است

Yandex محبوب ترین موتور جستجو در روسیه است. این سرویس در سال 1997 ظاهر شد. در ابتدا شرکت روسی CompTek International به آن مشغول بود. کمی بعد، شرکت Yandex ظاهر شد که به فعالیت خود در یک موتور جستجو ادامه داد. موتور جستجو برایسال ها وجود محبوبیت زیادی به دست آورده است. می توان آن را به چندین زبان جستجو کرد - روسی، بلاروسی، اوکراینی، تاتاری، قزاقستانی، انگلیسی، آلمانی، فرانسوی، ترکی.

از داده های آماری مشخص شده است که "Yandex" مورد توجه بیش از 50٪ از کاربران Runet است. بیش از 40 درصد از مردم گوگل را ترجیح می دهند. تقریباً 3٪ از کاربران Mail.ru، یک پورتال اینترنتی روسی زبان را انتخاب کردند.

موتور جستجوی گوگل
موتور جستجوی گوگل

موتورهای جستجوی محافظت شده

موتورهای جستجوی معمولی که برای ما آشنا هستند دقیقاً برای کودکان مناسب نیستند. کاربران جوان اینترنت ممکن است به طور تصادفی مطالبی برای بزرگسالان پیدا کنند، اطلاعاتی که می تواند به روان آسیب برساند. به همین دلیل موتورهای جستجوی امن خاصی ایجاد شده است. پایگاه داده آنها فقط حاوی محتوای ایمن برای کودکان است.

یک نمونه از این موتورهای جستجو Sputnik. Children است. این سرویس کاملا جوان است. این توسط Rostelecom در سال 2014 ایجاد شد. صفحه اصلی موتور جستجو روشن و جالب طراحی شده است. طیف گسترده ای از کارتون های داخلی و خارجی را برای کودکان در سنین مختلف ارائه می دهد. علاوه بر این، در صفحه اصلی پیوندهای آموزنده مربوط به چندین عنوان وجود دارد - "ورزش"، "من می خواهم همه چیز را بدانم"، "خودت انجامش بده"، "بازی ها"، "فناوری"، "مدرسه"، "طبیعت".

نمونه دیگری از موتور جستجوی ایمن کودکان Agakids.ru است. این یک منبع کاملاً ایمن است. یک موتور جستجو چگونه کار می کند؟ این ربات به گونه ای پیکربندی شده است که فقط سایت هایی را دور می زند که مربوط به موضوعات کودکانه یا مرتبط هستند.برای والدین مفید هستند. پایگاه داده موتور جستجو شامل منابعی با کارتون، کتاب، ادبیات آموزشی، بازی، کتاب رنگ آمیزی است. والدین با استفاده از Agakids.ru می توانند سایت هایی در مورد تربیت و سلامت کودکان پیدا کنند.

موتورهای جستجوی محافظت شده برای کودکان
موتورهای جستجوی محافظت شده برای کودکان

در پایان، شایان ذکر است که موتورهای جستجو سیستم های پیچیده ای هستند. آنها با مشکلات زیادی روبرو هستند - مشکلات هرزنامه، تعیین ارتباط اسناد، غربالگری محتوای با کیفیت پایین، تجزیه و تحلیل اسنادی که حاوی اطلاعات متنی نیستند. به همین دلیل، توسعه دهندگان رویکردها و الگوریتم های جدیدی را که اسرار تجاری هستند در کار موتورهای جستجوی اینترنتی معرفی می کنند.

توصیه شده: