لحظات اولیه هدف قرار گرفتن یک ساختمان مسکونی در محله «الرمال» غزه (فیلم)

حمله هکری به دستگاه‌های قرائت سوخت در پمپ بنزین‌های آمریکا

ارتش اسرائیل به حالت آماده‌باش درآمد

فیلم بیشتر »»

حمله موشکی و پهپادی حزب‌الله به تجمعات نظامیان صهیونیست

طرز تهیه باقلوا خانگی با طعمی فوق‌العاده

آموزش زبان انگلیسی بیشتر »»

درس سی و نهم

درس سی و هشتم

در حاشیه

ادعای نشریه فرانسوی: سیلی خوردن امانوئل مکرون از همسرش به دلیل رابطه با گلشیفته فراهانی بود

درخواست مهران غفوریان برای دعای خیر جهت سلامتی اکبر عبدی

استوری رضا صادقی خواننده برای وطن (عکس)

واکنش آزیتا موگویی کارگردان به برخی فارسی زبانان خارج از کشور: آیا ما هم وطنیم؟ (عکس)

استوری یوسف حاتمی‌کیا درباره صرفه جویی (عکس)

100 سالگی

قیمت انواع فرش ایرانی در بازار آلمان اعلام شد +عکس

۳۵ قصاب در تهران تحت تعقیب قرار گرفتند +اسامی

حاجی فیروزها در تهران بازداشت شدند! +عکس و جزئیات

قیمت گوشت و مرغ و زولبیا و بامیه در ماه رمضان ۳۰ سال پیش!

عکس منتشرنشده از فرزند و همسر آیت‌الله مدرس

باشگاه مغز

آیا می توانید منطق پنهان این ضرب های عجیب را کشف کنید؟

معمای تصویری؛ افراد با دقت زیر 15 ثانیه به جواب می رسند

معمای مثلث ها؛ خیلی ها نمی توانند زیر 30 ثانیه این معما را حل کنند!

معمای ریاضی؛ اگر زیر 30 ثانیه جواب را پیدا کنید، یک نابغه هستید!

تست بینایی و تمرکز؛ 90 درصد افراد در پیدا کردن این جغد شکست می خورند؛ شما چطور؟

معمای ریاضی لوزی های جادویی؛ عدد مجهول را پیدا کنید!

تست 10 ثانیه ای بینایی: یک سرگرمی نه چندان دشوار

صفحه نخست » فناوری

کد خبر ۱۰۰۶۵۱۱

‍‍‍ پ پ ‍‍‍

تاریخ انتشار: ۰۱:۰۰ - ۲۹-۰۷-۱۴۰۳

‌گزارش خطا در خبر

صفحه نخست » فناوری

کد ۱۰۰۶۵۱۱

انتشار: ۰۱:۰۰ - ۲۹-۰۷-۱۴۰۳

هوش مصنوعی روزی آگاهانه خرابکاری می‌کند

شرکت توسعه هوش مصنوعی آنتروپیک(Anthropic) می‌گوید هوش مصنوعی روزی می‌تواند بشریت را با کارشکنی و خرابکاری مواجه کند، اما فعلاً همه چیز خوب پیش می‌رود.

شرکت آنتروپیک که توسعه دهنده هوش مصنوعی است، به تازگی تحقیقات جدیدی را منتشر کرده است که در آن مجموعه‌ای از تهدیدات بالقوه خرابکارانه برای بشریت ناشی از مدل‌های پیشرفته هوش مصنوعی را شناسایی می‌کند.

به گفته این شرکت، این پژوهش بر چهار روش خاص متمرکز شده است که یک مدل هوش مصنوعی مخرب می‌تواند انسان را فریب دهد تا تصمیمی خطرناک یا مضر بگیرد.

در نهایت، این تحقیقات جدید یک خبر خوب یک خبر بد برای ما دارد. خبر بد اینکه طبق تحقیقات این شرکت، مدل‌های زبان بزرگ پیشرفته مانند ChatGPT و Claude-3 ظرفیت روشنی برای خرابکاری نشان می‌دهند.

به گزارش ایسنا، در این مطالعه آمده است: مدل‌های به اندازه کافی توانمند می‌توانند نظارت و تصمیم‌گیری انسانی را در زمینه‌های مهم زیر سوال ببرند. به عنوان مثال، در زمینه توسعه هوش مصنوعی، مدل‌ها می‌توانند به طور پنهانی تلاش‌ها برای ارزیابی قابلیت‌های خطرناک خود، نظارت بر رفتار آنها یا تصمیم‌گیری در مورد استقرارشان را مختل کنند.

با این حال، خبر خوب این است که محققان شرکت آنتروپیک مطمئن هستند که این خطرات را حداقل در حال حاضر می‌توان کاهش داد.

خرابکاری

آنتروپیک چهار راه را که یک مدل هوش مصنوعی می‌تواند با آنها تصمیم‌گیری انسان را مختل کند، شناسایی کرد و سپس مدل‌های خود را آزمایش کرد تا ببیند آیا موفقیت آمیز عمل خواهند کرد یا خیر.

محققان ابتدا یک مدل را وادار کردند تا با هدایت انسان به سمت اطلاعات نادرست، اقدام به خرابکاری کند. این تهدید می‌تواند در شرایطی پدیدار شود که انسان‌ها برای تجزیه حجم عظیمی از داده‌ها از جانب خود به یک سیستم هوش مصنوعی متکی هستند.

سپس این تیم مدل‌ها را آزمایش کرد تا ببیند سامانه هوش مصنوعی طراحی شده برای کمک به توسعه‌دهندگان انسانی برای ایجاد کدی برای وارد کردن مخفیانه اشکالات یا خراب کردن تلاش‌های کدگذار، چقدر آسان عمل می‌کند.

دو تهدید آخر شامل «پنهان کردن توانایی‌ها»(sandbagging) بود که اصطلاحی است که سناریویی را توصیف می‌کند که در آن یک هوش مصنوعی وانمود می‌کند که قادر به انجام کاری نیست تا آزمایش‌کنندگان ایمنی را متقاعد کند که خطرناک نیست.

در حالی که همه اینها ممکن است به طور بالقوه خطرناک به نظر برسند، آنتروپیک به مردم اطمینان داد که برای محافظت از بشریت در برابر احتمال خرابکاری هوش مصنوعی به اقدامات پیش‌گیرنده اندکی نیاز است.

طبق اعلام این شرکت؛ به طور کلی در حالی که آزمایشات ما نشان داد که احتمالاً نشانه‌های سطح پایینی از توانایی‌های خرابکاری در مدل‌های فعلی وجود دارد، ما می‌گوییم که حداقل اقدامات پیش‌گیرنده برای مقابله با خطرات کافی است. با این حال، با بهبود قابلیت‌های هوش مصنوعی، ارزیابی‌های واقعی‌تر و پیش‌گیری‌های قوی‌تر احتمالاً ضروری خواهند بود.

پربیننده ترین پست همین یک ساعت اخیر

کشف راز عجیب سنگ قبر مشکوک پس از نبش قبر در تهران

خبر بعد نظرات کاربران خبر قبل

اشتراک گذاری :

لحظات اولیه هدف قرار گرفتن یک ساختمان مسکونی در محله «الرمال» غزه (فیلم)

بیشتر بخوانید:

ارسال بوی دیجیتال با هوش‌مصنوعی ممکن شد!

هوش مصنوعی هزاران ایرلندی را به خیابان کشاند!

۱۰ روند برتر فناوری که باید منتظرش باشیم

درباره هوش مصنوعی مخفی «اوریون»

اعلام جنگ بزرگترین انتشارات جهان علیه هوش مصنوعی

تماشاخانه