موتورهای جستجوی هوش مصنوعی به منابع «کم طرفدار» تکیه می‌ کنند

۶ آبان ۱۴۰۴ مطالعه ۳ دقیقه

از زمان معرفی قابلیت‌هایی مانند AI Overviews گوگل، شیوه مواجهه ما با نتایج جستجوی وب دستخوش تغییر شده است. این سیستم‌های مبتنی بر هوش مصنوعی مولد (Generative AI)، برخلاف فهرست سنتی پیوندهایی که موتورهای جستجو در دهه‌های گذشته ارائه می‌دادند، نتایج را به‌صورت خلاصه‌شده و یکپارچه به کاربر عرضه می‌ کنند. اکنون، تحقیقات جدیدی از محققان آلمانی نشان می‌دهد که این نتایج جدید نه تنها در شکل، بلکه در منابع مورد ارجاع نیز تفاوت‌ های چشمگیری با جستجوی سنتی دارند و ما را به سمت وب‌ سایت‌ های کم‌ طرفدارتر و خارج از دید می‌ کشانند.

تفاوت‌ های کمی در ارجاعات وب

پژوهشی با عنوان «شخصیت‌ یابی جستجوی وب در عصر هوش مصنوعی تولیدی» که توسط محققانی از دانشگاه روهر در بوخوم آلمان و مؤسسه ماکس پلانک انجام شده، به مقایسه لینک‌های سنتی جستجوی گوگل با نتایج AI Overviews و Gemini-2.5-Flash گوگل، و همچنین GPT-4o و GPT-4o با Search Tool پرداخت. نتایج این مطالعه، تفاوت‌های اساسی در الگوی ارجاع منابع را آشکار ساخت:

  • ارجاع به منابع کمتر محبوب: ابزارهای جستجوی مولد، به‌ویژه جستجوی Gemini گوگل، تمایل شدیدی به ارجاع به وب‌سایت‌هایی دارند که کمتر محبوب هستند. منابع مورد استفاده این موتورها در مقایسه با 10 نتیجه اول جستجوی سنتی گوگل، بیشتر به خارج از 1000 و حتی خارج از 1 میلیون دامنه برتر بر اساس شاخص رتبه‌بندی دامنه Tranco تعلق دارند.
  • نادیده گرفتن لینک‌های برتر گوگل: بخش قابل توجهی از منابع معرفی‌شده توسط AI Overviews گوگل حتی در 10 نتیجه اول جستجوی سنتی گوگل برای همان پرسش ظاهر نمی‌شوند. به‌طور مثال، 53 درصد منابع معرفی‌شده توسط AI Overviews در 10 لینک اول گوگل نیامده‌اند و 40 درصد آن‌ها حتی در 100 لینک برتر نیز نبوده‌اند.
نادیده گرفتن لینک‌های برتر گوگل

اکثر منابع ذکر شده در AI Overview در 10 نتیجه برتر لینک گوگل برای همان عبارت جستجو ظاهر نمی‌شوند. منبع: Kirsten و همکاران

مزایا و معایب نتایج هوشمند

آیا ارجاع به دامنه‌های ناشناخته‌تر به معنای کیفیت پایین‌تر است؟ محققان قاطعانه چنین حکمی صادر نکرده‌اند و مزایا و معایبی را برای هر دو روش جستجو برشمرده‌ اند:

مزایای جستجوی هوشمند:

  • تنوع و سطح جزئیات مشابه: یک ابزار تحلیلی مبتنی بر مدل زبانی نشان داد که نتایج جستجوی هوشمند، تعداد مفاهیم قابل شناسایی با ده لینک سنتی را به طور مشابهی پوشش می‌دهند که نشان‌دهنده سطح جزئیات، تنوع و نوآوری قابل مقایسه است.
  • منابع معتبرتر: جستجوی مبتنی بر GPT بیشتر از منابعی مانند نهادهای شرکتی و دانشنامه‌ ها نقل‌قول می‌آورد و تقریباً از سایت‌های شبکه‌های اجتماعی نقل نمی‌کند.
  • ادغام دانش: موتورهای مبتنی بر هوش مصنوعی می‌توانند «دانش داخلی پیش‌آموزش داده‌شده» خود را با داده‌های استخراج‌شده از سایت‌های ارجاع‌داده‌شده ادغام کنند. این ویژگی به‌خصوص در مورد GPT-4o با Search Tool دیده شد که اغلب پاسخی مستقیم بر اساس داده‌های آموزشی خود می‌داد و اصلاً به منبع وب اشاره نمی‌ کرد.

معایب و محدودیت‌ ها:

  • فشرده‌ سازی اطلاعات: موتورهای تولیدی تمایل به فشرده‌سازی اطلاعات دارند و گاهی اوقات ابعاد فرعی یا ابهام‌آمیز موضوع را که جستجوی سنتی پوشش می‌دهد، حذف می‌کنند.
  • مشکل در جستجوهای مبهم: در جستجوهای مبهم (مثلاً اسامی که بین افراد مختلف مشترکند)، «نتایج جستجوی ارگانیک پوشش بهتری ارائه می‌دهند.»
  • اتکا به داده‌های قدیمی: اتکا به داده‌های پیش‌آموزش‌یافته باعث ایجاد محدودیت هنگام جستجوی اطلاعات به‌روز می‌شود. برای مثال، در بررسی جستجوهای پررونق، GPT-4o با Search Tool اغلب از جستجوی وب برای اطلاعات جدید خودداری کرده و با درخواست اطلاعات بیشتر به کاربر پاسخ می‌داد.
معایب و محدودیت‌ ها:

به طور خاص، جستجوی گوگل جمینی بیشتر احتمال داشت که دامنه‌های کم‌محبوبیت را ذکر کند. منبع: کیرستن و همکاران

نتیجه گیری و گام‌ های بعدی

در نهایت، محققان به این نتیجه نرسیدند که آیا موتورهای جستجوی هوشمند لزوماً بهتر یا بدتر از لینک‌های جستجوی سنتی هستند. اما این پژوهش به وضوح نشان می‌دهد که عصر هوش مصنوعی، قوانین بازی ارجاع به منابع وب را تغییر داده است.

این دگرگونی، نیاز به روش‌های ارزیابی جدید را برجسته می‌کند. محققان خواستار پژوهش‌های بیشتری شدند که همزمان تنوع منابع، پوشش مفهومی و رفتار تلفیقی سیستم‌های جستجوی مولد را مورد توجه قرار دهد. در حالی که موتورهای هوش مصنوعی می‌توانند با آوردن منابع جدید و کمتر دیده‌شده، تنوع را به نتایج اضافه کنند، کاربران و محققان باید از تمایل این سیستم‌ها به فشرده‌سازی اطلاعات و اتکای آن‌ها به دانش داخلی آگاه باشند. این یک شروع است و آینده جستجوی وب به تعادل ظریفی میان دسترسی به منابع گسترده و ارائه اطلاعات دقیق و به‌روز بستگی دارد.

منبع

https://arstechnica.com/ai/2025/10/ai-powered-search-engines-rely-on-less-popular-sources-researchers-find


داغ‌ترین مطالب روز

بهترین DNSهای گیمینگ 🎮

بهترین DNSهای گیمینگ 🎮

DNS یکی از مهم ترین مواردی است که سبب می شود تا تجربه شما از بازی کردن بهبود یافته و اتصال شما به سرورها پایداری و ثبات پیدا کند. اما پیدا کردن دی ان اس خوب برای بازی ها آنلاین به خصوص بازی هایی نظیر Valorant، Call of Duty و … همواره چالش محسوب شده […]

۱۶ خرداد ۱۴۰۱ ۹

رفع مشکل وصل نشدن اینترنت در ویندوز 7🌐

رفع مشکل وصل نشدن اینترنت در ویندوز 7🌐

اینترنت یکی از مهم ترین عناصر زندگی در عصر امروز است. اما اگر نتوانیم با ویندوز به اینترنت وصل شویم چه؟ مشکل وصل نشدن اینترنت در ویندوز 7 چیست؟ در این مقاله به آموزش رفع مشکل وصل نشدن اینترنت در ویندوز 7 می پردازیم تا با بررسی راه حل های آن بتوانید به صورت اصولی […]

۲۸ اردیبهشت ۱۴۰۱ ۸

دلایل وصل نشدن اینترنت لپ تاپ 💻🌐

دلایل وصل نشدن اینترنت لپ تاپ 💻🌐

وقتی لپ تاپ شما به WiFi متصل نمی شود، روش هایی را که می توانید برای دسترسی به اینترنت استفاده کنید محدود می کند. اگرچه این یک راه بسیار راحت برای آنلاین شدن است، اما چندین مورد وجود دارد که هنگام استفاده از WiFi ممکن است اشتباه کند.این مشکلات باعث می شود که اتصال شما […]

۱۸ تیر ۱۴۰۱ ۶

هوش مصنوعی گوگل Google AI Studio

هوش مصنوعی گوگل Google AI Studio

دروازه‌ ای وسیع‌ تر به دنیای شگفت‌ انگیز هوش مصنوعی هوش مصنوعی (AI)، این نیروی دگرگون‌ کننده، دیگر محدود به آزمایشگاه‌های پیشرفته و پروژه‌های علمی-تخیلی نیست. هوش مصنوعی با سرعت چشمگیری در حال نفوذ به تار و پود زندگی روزمره ماست. از دستیارهای صوتی که به ما کمک می‌کنند کارهای روزانه را انجام دهیم گرفته […]

۶ بهمن ۱۴۰۳ ۶

سرور ابری

سرور ابری

سرور ابری و یا سرویس ابری از اصطلاحاتی هستند که امروزه به آن زیاد بر می خوریم. اما شاید تا کنون درک درستی در خصوص خدمات مبتنی بر ابر و سرور ابری (سرور رایانش ابری) نداشته باشیم. انتخاب خدمات مرکز داده مناسب ، می تواند تاثیر به سزایی در هزینه های یک کسب و کار […]

۲ تیر ۱۳۹۹ ۵

دیدگاه‌ها

comment symbol

برای این مقاله ۰ دیدگاه نوشته شده است. دیدگاه شما چیست؟

شما نیز، دیدگاه خود را از طریق دکمه زیر به اشتراک بگذارید.

نوشتن دیدگاه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *