گزارش رئیس دفتر رئیس‌جمهور به مراجع تقلید از وضعیت مدیریت کشور

امیل لحود: جنگ علیه لبنان و ایران با پیروزی دو کشور رو به پایان است

صدور روادید تیم ملی فوتبال ایران تا ساعاتی دیگر

فیلم بیشتر »»

پنالتی عجیب و گل به خودی وحشتناک در لیگ عربستان!

فیلمی که بابک زنجانی از رباتش منتشر کرد

آموزش زبان انگلیسی بیشتر »»

درس چهل و هفتم

درس چهل و ششم

در حاشیه

ازدواج مخفیانه ستاره موسیقی و بازیگر بریتانیایی (+عکس)

رابرت دنیرو لباسی با نشان ایران بر تن کرد(+عکس)

استایل هخامنشی آزاده صمدی در فضای مجازی (عکس)

ژست متفاوت مهسا کامیابی در دل طبیعت کردستان (عکس)

تغییر چهره محمود احمدی‌نژاد بعد از گذشت ۱۶ سال؛ از ۱۳۸۸ تا ۱۴۰۴ (+عکس)

باشگاه مغز

آیا می توانید منطق پنهان این ضرب های عجیب را کشف کنید؟

معمای تصویری؛ افراد با دقت زیر 15 ثانیه به جواب می رسند

معمای مثلث ها؛ خیلی ها نمی توانند زیر 30 ثانیه این معما را حل کنند!

معمای ریاضی؛ اگر زیر 30 ثانیه جواب را پیدا کنید، یک نابغه هستید!

تست بینایی و تمرکز؛ 90 درصد افراد در پیدا کردن این جغد شکست می خورند؛ شما چطور؟

معمای ریاضی لوزی های جادویی؛ عدد مجهول را پیدا کنید!

تست 10 ثانیه ای بینایی: یک سرگرمی نه چندان دشوار

صفحه نخست » علمی

کد خبر ۱۱۵۶۱۵۹

‍‍‍ پ پ ‍‍‍

تاریخ انتشار: ۰۹:۱۴ - ۲۶-۰۱-۱۴۰۵

‌گزارش خطا در خبر

صفحه نخست » علمی

کد ۱۱۵۶۱۵۹

انتشار: ۰۹:۱۴ - ۲۶-۰۱-۱۴۰۵

مدل‌های پیشرفته هوش مصنوعی، تصاویر ناموجود را می‌بینند

چند سال پیش، خبرهایی منتشر شد مبنی بر اینکه هوش مصنوعی ممکن است به‌زودی به رادیولوژیست‌ها در تفسیر عکس‌های شکستگی استخوان و تحلیل ماموگرافی کمک کند. اما یک مطالعه جدید نشان می‌دهد که هنوز تا رسیدن به این هدف فاصله زیادی داریم.

دانشمندان کشف کرده‌اند که مدل‌های پیشرفته هوش مصنوعی، حتی زمانی که هیچ تصویری به آن‌ها نشان داده نمی‌شود، با اطمینان کامل جزئیات خیالی را توصیف می‌کنند؛ این پدیده که در بیش از ۶۰ درصد موارد رخ می‌دهد، زنگ خطری برای کاربرد هوش مصنوعی در تشخیص پزشکی است.

به گزارش ایرنا، وبگاه تِک‌اِکسپلور در گزارشی آورده است:

گروهی از پژوهشگران دانشگاه استنفورد آزمایشی به نام فانتوم- صفر (Phantom-0) طراحی کردند. آن‌ها از جدیدترین مدل‌های هوش مصنوعی مانند جی‌پی‌تی- ۵، جمینای ۳ پرو، کلود سونت ۴.۵ و کلود اپوس ۴.۵ سوالات بسیار دقیقی درباره تصاویر پرسیدند، اما هیچ تصویری در اختیار آن‌ها قرار ندادند.

وقتی هوش مصنوعی «سراب» می‌سازد

نتایج شگفت‌انگیز بود: مدل‌های هوش مصنوعی به جای اینکه بپذیرند چیزی نمی‌بینند، با اطمینان کامل جزئیات خیالی را توصیف کردند. از شماره پلاک ماشین و زبان یک روزنامه گرفته تا شرایط تهدیدکننده حیات که اصلاً وجود نداشتند.

به طور متوسط، این رفتار در بیش از ۶۰ درصد موارد در میان مدل‌های پیشرفته مشاهده شد.

پاسخ از سرنخ‌های متنی، نه درک بصری

در پنج سال گذشته، پیشرفت چشمگیری در مدل‌های هوش مصنوعی که هم متن و هم تصویر را پردازش می‌کنند، دیده شده است. این قابلیت چندوجهی کاربردهایی در پزشکی و رباتیک پیدا کرده است. بیش از ۲۳۰ میلیون نفر روزانه سوالات مربوط به حوزه سلامت را از هوش مصنوعی می‌پرسند.

برای سنجش عملکرد این مدل‌ها، آزمون‌های استانداردی طراحی شده است. فرض اولیه این است که نمره بالاتر به معنای درک بصری بهتر است؛ اما این مطالعه جدید، این سامانه ارزیابی را زیر سؤال می‌برد.

آزمایش‌ها نشان داد مدل‌های هوش مصنوعی حتی زمانی که تصاویر کاملاً حذف شده بودند، نمرات به طرز شگفت‌آور خوبی در آزمون‌های بصری کسب کردند.

مدل متنی که از مدل‌های بصری پیشی گرفت

گروه پژوهشی یک قدم فراتر رفت و یک مدل فقط متنی (بدون دسترسی به داده‌های بصری) را برای پاسخ به سؤالات مربوط به عکس‌های قفسه سینه آموزش داد.

نتیجه شگفت‌آور بود: این مدل متنی در یک آزمون استاندارد تفسیر عکس قفسه سینه، هم از سامانه‌های پیشرفته هوش مصنوعی و هم از پزشکان انسانی بهتر عمل کرد.

این یافته‌ها نشان می‌دهد که سامانه‌های ارزیابی فعلی ممکن است بیش از حد به الگوهای متنی تکیه کنند تا درک بصری واقعی.

وقتی مدل می‌داند تصویری وجود ندارد

پژوهشگران الگوی جالب دیگری نیز مشاهده کردند: وقتی به مدل هوش مصنوعی به صراحت گفته می‌شد که تصویری وجود ندارد و از او خواسته می‌شد حدس بزند، دقت پاسخ‌ها به‌شدت کاهش می‌یافت.

اما وقتی سؤال به گونه‌ای پرسیده می‌شد که مدل تصور می‌کرد تصویری وجود دارد، وارد حالت سراب می‌شد و عملکردش بهبود می‌یافت، زیرا می‌توانست از سرنخ‌ها و الگوهای پنهان متنی برای تولید پاسخ استفاده کند.

نیاز فوری به روش‌های ارزیابی جدید

پژوهشگران بر نیاز فوری به معیارهای ارزیابی بهتر و امن‌تر، به‌ویژه در محیط‌های پزشکی که پاسخ‌های ساختگی می‌توانند عواقب جدی داشته باشند، تأکید می‌کنند.

آن‌ها روش ارزیابی جدیدی به نام بی-کلین (B-Clean) را به‌عنوان راه‌حلی بالقوه معرفی کردند. این روش سؤالاتی را که بدون تصویر قابل پاسخگویی هستند، حذف می‌کند و مدل‌های چندوجهی را بر اساس درک بصری واقعی آزمایش می‌کند، نه بر اساس حدس‌های از روی سرنخ‌های متنی.

برای تعیین اینکه آیا بی-کلین و روش‌های مشابه می‌توانند به طور مؤثر پدیده سراب را حذف کنند، به مطالعات بیشتری نیاز است.

خبر بعد نظرات کاربران خبر قبل

اشتراک گذاری :

گزارش رئیس دفتر رئیس‌جمهور به مراجع تقلید از وضعیت مدیریت کشور

تماشاخانه