فیلم بیشتر »»
کد خبر ۱۱۴۳۲۳۵
تاریخ انتشار: ۰۵:۰۰ - ۰۳-۱۲-۱۴۰۴
کد ۱۱۴۳۲۳۵
انتشار: ۰۵:۰۰ - ۰۳-۱۲-۱۴۰۴

هرچه بیشتر با چت‌بات‌ها صحبت کنید، دقت‌شان کمتر می‌شود!

هرچه بیشتر با چت‌بات‌ها صحبت کنید، دقت‌شان کمتر می‌شود!
ظاهراً دقت مدل‌های هوش مصنوعی در گفت‌وگوهای چندمرحله‌ای طولانی کاهش می‌یابد.

شرکت‌های پیشرو طی سال‌های اخیر مدل‌ها و چت‌بات‌های پیشرفته‌ای را برای تثبیت جایگاه برند خود در بازار پرشتاب هوش مصنوعی معرفی کرده‌اند؛ بازاری که دنبال‌کردن تحولاتش همچنان ساده نیست و با وجود پیشرفت‌های فنی، کاربران همچنان از توهم‌زایی و پاسخ‌های نادرست در تعامل با این مدل‌ها گلایه دارند.

به گزارش زومیت، Microsoft Research و Salesforce در پژوهشی مشترک با تحلیل بیش از ۲۰۰ هزار مکالمه‌ی مرتبط با مدل‌هایی مانند GPT-4.1، Gemini 2.5 Pro، Claude 3.7 Sonnet، o3، DeepSeek R1 و Llama 4، نشان دادند که مدل‌های زبانی بزرگ در مکالمه‌های چندمرحله‌ای دچار افت عملکرد می‌شوند و به‌اصطلاح «در گفت‌وگو گم می‌شوند».

طبق تحقیقات، نرخ موفقیت مدل‌هایی مانند GPT-4.1 و Gemini 2.5 Pro در سناریوهای تک‌درخواستی به حدود ۹۰ درصد می‌رسد؛ اما عملکرد همین مدل‌ها در گفت‌وگوهای رفت‌وبرگشتی طولانی با کاهش محسوسی روبه‌رو می‌شود و میانگین موفقیت آن‌ها به نزدیک ۶۵ درصد سقوط می‌کند.

پژوهش مایکروسافت نشان می‌دهد افت کیفیت لزوماً به‌معنای کاهش چشمگیر توانایی نیست. در واقع، گفته می‌شود هرچه بیشتر با چت‌بات‌ها صحبت کنید، دقت‌شان کمتر خواهد شد.

تحلیل‌ها همچنین از بروز پدیده‌ای با عنوان «تورم پاسخ» حکایت دارند؛ به‌گونه‌ای که طول خروجی‌ها در مکالمه‌های چندنوبتی بین ۲۰ تا ۳۰۰ درصد افزایش می‌یابد. پاسخ‌های مفصل‌تر فرضیات بیشتری وارد متن می‌کنند و احتمال توهم‌زایی را بالا می‌برند؛ خطاهایی که سپس به‌عنوان زمینه‌ی دائمی گفت‌وگو استفاده می‌شوند.

در شرایطی که استفاده از ابزارهای هوش مصنوعی به‌سرعت گسترش پیدا می‌کند و قابلیت‌هایی مانند Google AI Overviews به تجربه‌ی جست‌وجوی افزوده شده‌اند، کنارگذاشتن موتورهای جست‌وجوی سنتی و اتکا به پاسخ‌های تولیدشده با مدل‌های هوش مصنوعی می‌تواند ریسک‌پذیر باشد.

ارسال به دوستان
پارادوکس تجربه: دانایان هم اشتباه می کنند / پرونده های عجیب نابودی: نوکیا، کداک، چلنجر و ایرفرانس 447 رئیس پارلمان لبنان: مذاکره تحت فشار حملات اسرائیل چه سودی دارد؟ کشف جسد فرد مغروق در رود ارس با تلاش امدادگران در جلفا سی‌ان‌ان: ایران تقریبا همه سایت‌های نظامی آمریکا در خاورمیانه را هدف قرار داده رونمایی بایکار از پهپاد کی2؛ پهپاد انتحاری ترکیه با قابلیت بازگشت به آشیانه! (+فیلم و عکس) نیروی دریایی سپاه: قواعد مدیریت جدید خلیج فارس اعمال خواهد شد پرواز رفت و برگشت رشت- مشهد برقرار شد مدیر مسؤول عصر ایران در سوگ پدر دستگیری عامل تیراندازی مرگبار در عملیات ضربتی پلیس ازنا نتایج نظرسنجی جدید: ۶۱ درصد آمریکایی ها جنگ با ایران را یک اشتباه می دانند ترامپ: برای ادامه جنگ با ایران، اجازه رسمی از کنگره نخواهم گرفت نفتالی بنت: اسرائیل در حال فروپاشی است شهادت ۱۴ عضو سپاه زنجان بر اثر انفجار مهمات عمل‌نکرده رایزنی تلفنی عراقچی و لاوروف پیام رهبر انقلاب اسلامی به مناسبت روز کارگر و روز معلم