سیستمهای رتبه بندی گوگل
تاریخ انتشار: ۱۴۰۴/۰۱/۲۴
آخرین بروزرسانی: ۱۴۰۴/۰۱/۲۴
گوگل از سیستمهای خودکار رتبه بندی استفاده میکند که با تحلیل صدها عامل و سیگنال مختلف از میان میلیاردها صفحه وب و محتوای موجود در فهرست جستجو، در کسری از ثانیه، مرتبطترین و مفیدترین نتایج را نمایش میدهد. در ادامه با سیستمهای رتبه بندی گوگل آشنا خواهیم شد.
آنچه خواهید خواند!
🔍 مقدمه
این راهنما، مروری است بر برخی از مهمترین این سیستمها؛ بخشی از آنها، هستهی اصلی الگوریتمهای جستجو را شکل میدهند و برخی دیگر، برای هدفهای خاص طراحی شدهاند.
سیستمهای رتبه بندی گوگل معمولاً در سطح هر صفحه (Page-Level) عمل میکنند، یعنی تلاش میکنند بفهمند هر صفحه دقیقاً چه ارزشی دارد. در عین حال، از سیگنالهایی که در سطح کل سایت دریافت میشود نیز بهره میبرند. البته داشتن برخی سیگنالهای مثبت در سطح سایت به این معنا نیست که تمام محتوای آن سایت رتبه خوبی خواهد داشت، همانطور که وجود سیگنالهای منفی هم الزاماً به رتبه پایین همه صفحات منجر نمیشود.
ما این سیستمها را بهطور مداوم و بر پایهی آزمونهای دقیق بهروزرسانی و اصلاح میکنیم و در صورت نیاز، تغییرات مهم را به تولیدکنندگان محتوا اطلاع میدهیم.
برای آشنایی دقیقتر با روند جستجو، میتوانید به وبسایت How Search Works مراجعه کنید.
🔍 مهمترین سیستمهای رتبه بندی گوگل
🔸 BERT
مدلی از هوش مصنوعی به نام BERT (نمایشگر رمزگذار دوطرفه از ترنسفورمرها) به گوگل کمک میکند تا منظور کاربران از ترکیب کلمات را بهتر درک کند.
🔸 اطلاعات بحران
گوگل برای نمایش اطلاعات مفید در شرایط بحرانی، سیستمهایی طراحی کرده که در دو حالت به کار میروند:
بحرانهای شخصی: اگر کسی عباراتی مرتبط با بحرانهایی چون خودکشی، خشونت جنسی، اعتیاد یا مسمومیت جستجو کند، گوگل، اطلاعات و منابع معتبر، از جمله شماره تلفنهای اضطراری را نمایش میدهد.
هشدارهای SOS: هنگام وقوع بلایای طبیعی، اطلاعات و هشدارهای رسمی از مراجع محلی و بینالمللی بهسرعت نمایش داده میشود.
🔸 حذف محتوای تکراری (Deduplication)
برای جلوگیری از نمایش نتایج تکراری و مشابه، گوگل تنها مفیدترین نسخه را نمایش میدهد. حتی در مورد «اسنیپتهای ویژه» (Featured Snippets)، صفحهای که به این موقعیت ارتقا یافته، در نتایج دیگر صفحه اول تکرار نمیشود.
🔸 دامنههای تطبیقی دقیق
اگر نام دامنهی سایتی بهصورت دقیق با عبارت جستجو شده تطابق داشته باشد، گوگل بررسی میکند که این تطابق واقعی و مفید است یا صرفاً با هدف فریب الگوریتم انجام شده است.
🔸 محتوای تازه (Freshness)
برای جستجوهایی که نیاز به اطلاعات بهروز دارند، گوگل محتوای تازه را در اولویت قرار میدهد؛ مثلاً اخبار زلزله، نقد فیلمهای جدید یا تحولات لحظهای.
🔸 تحلیل لینکها و PageRank
گوگل با بررسی لینکهایی که بین صفحات مختلف رد و بدل میشود، متوجه میشود کدام صفحات معتبرترند. یکی از قدیمیترین و اصلیترین این الگوریتمها، PageRank است که از ابتدا با گوگل همراه بوده است.
🔸 اخبار محلی
برای جستجوهایی با بُعد جغرافیایی خاص، سیستمهای گوگل منابع خبری محلی را شناسایی کرده و در بخشهایی چون «داستانهای مهم» (Top Stories) یا «اخبار محلی» نمایش میدهد.
🔸 مدل MUM
مدلی قدرتمند از هوش مصنوعی است که توانایی درک و تولید زبان را دارد. MUM فعلاً در رتبه بندی کلی جستجو کاربرد ندارد و بیشتر در پروژههایی مثل اطلاعات مربوط به واکسن کرونا یا ارتقای اسنیپتهای ویژه بهکار میرود.
🔸 تطبیق عصبی (Neural Matching)
این سیستم مفاهیم کلیدی موجود در عبارتهای جستجو و صفحات وب را درک کرده و میان آنها ارتباط برقرار میکند، حتی اگر کلمات دقیقاً یکی نباشند.
🔸 اولویت با محتوای اصیل
گوگل با استفاده از الگوریتمهایی خاص و نشانهگذاریهای HTML (مانند canonical)، کمک میکند محتوای اصیل در اولویت نتایج جستجو قرار گیرد، نه نسخههای کپیشده آن.
🔸 تنزل بر اساس درخواستهای حذف محتوا
اگر سایت خاصی حجم زیادی از درخواستهای حذف معتبر (مثلاً حذف محتوای خلاف قانون یا نقض کپیرایت) دریافت کند، ممکن است رتبه کلی آن در نتایج جستجو کاهش یابد.
🔸 رتبه بندی بر اساس بخشها (Passage Ranking)
گاهی یک پاراگراف مشخص از یک مقاله اطلاعات مفیدتری نسبت به کل مقاله دارد. این سیستم به گوگل کمک میکند همان بخش را در نتایج نمایش دهد.
🔸 RankBrain
یکی از نخستین سیستمهای هوش مصنوعی گوگل برای درک ارتباط میان کلمات و مفاهیم، حتی اگر عبارات جستجو شده دقیقاً در صفحه وجود نداشته باشند.
🔸 اطلاعات معتبر
سیستمهایی برای نمایش منابع معتبر و کاهش محتوای بیکیفیت یا گمراهکننده وجود دارند. در مواردی که اطلاعات قابلاعتماد کافی در دسترس نباشد، هشدارهایی به کاربران نمایش داده میشود.
🔸 رتبه بندی نقد و بررسیها
سیستمی برای تشویق نقدهای باکیفیت، بررسیهای تخصصی و تحلیلهای مبتنی بر تجربه شخصی کاربران یا کارشناسان طراحی شده است.
🔸 تنوع نتایج سایتها
برای جلوگیری از سیطره یک سایت خاص بر تمام نتایج جستجو، معمولاً بیش از دو نتیجه از یک دامنه در صفحه اول نشان داده نمیشود. البته گاهی در شرایط خاص ممکن است این محدودیت برداشته شود.
🔸 شناسایی اسپم
گوگل با کمک الگوریتمهایی مانند SpamBrain، محتوای اسپم را شناسایی کرده و از نتایج جستجو حذف میکند. این سیستمها دائماً بهروزرسانی میشوند.
📜 سیستمهای بازنشسته
⊗ محتوای مفید (Helpful Content): ابتدا بهصورت بهروزرسانی معرفی شد، اما در سال ۲۰۲۴ بهعنوان بخشی از سیستم اصلی رتبه بندی درآمد.
⊗ مرغ مگسخوار (Hummingbird): تحول مهمی در الگوریتم گوگل که در سال ۲۰۱۳ پیادهسازی شد.
⊗ پاندا (Panda): مقابله با محتوای کمارزش و کپی، معرفی در ۲۰۱۱ و ادغام در سیستم اصلی در ۲۰۱۵.
⊗ پنگوئن (Penguin): برای مبارزه با اسپم لینکها در سال ۲۰۱۲ معرفی شد و در سال ۲۰۱۶ به سیستم اصلی اضافه شد.
