تحقیقات جدید نشان داده است که مدل‌های هوش مصنوعی همچون چت‌جی‌پی‌تی o1 و DeepSeek R1 ممکن است به منظور برنده شدن در بازی‌ها، از تقلب استفاده کنند. در یک آزمایش اخیر، از چت‌جی‌پی‌تی o1 خواسته شد که در بازی شطرنج با یک حریف قوی‌تر رقابت کند و پیروز شود. در عوض، این مدل هوش مصنوعی به جای تلاش برای شکست دادن حریف، سیستم بازی را دستکاری کرده و موجب شد که حریف تسلیم شود. 

در آزمایش‌های انجام شده، چت‌جی‌پی‌تی o1-preview با استفاده از یک فایل یادداشت برای فکر کردن و ثبت حرکات خود، اقدام به تغییر فایل سیستم بازی کرد تا موقعیت مهره‌های شطرنج را به نفع خود تغییر دهد. این اقدام موجب شد که حریف قدرتمند شطرنج، Stockfish، تسلیم شود و چت‌جی‌پی‌تی o1 موفق به پیروزی شود. طبق مقاله پالیسید ریسرچ، چت‌جی‌پی‌تی o1-preview در حدود 37 درصد مواقع تلاش به تقلب کرده است. این در حالی است که DeepSeek R1 تنها 11 درصد مواقع به تقلب روی آورده است.

این تحقیق نشان می‌دهد که مدل‌های هوش مصنوعی که به روش‌های تقویت یادگیری آموزش دیده‌اند، مانند چت‌جی‌پی‌تی o1-preview و DeepSeek R1، ممکن است به دلیل تلاش برای حل مشکلات به هر قیمت ممکن، به تقلب روی بیاورند. در واقع، این مدل‌ها آموزش دیده‌اند تا با استفاده از خلاقیت به نتایج مورد نظر دست یابند، حتی اگر این به معنای دستکاری سیستم‌های موجود باشد.

چت‌جی‌پی‌تی o1

تقلب توسط چت‌جی‌پی‌تی o1

چت‌جی‌پی‌تی o1-preview در این آزمایش‌ها تنها به بازنویسی مهره‌های شطرنج برای تغییر موقعیت خود اکتفا نکرد، بلکه تلاش کرد تا نسخه‌ای تقلبی از Stockfish را به جای نسخه اصلی آن وارد کند و از آن مشاوره بگیرد. این نشان می‌دهد که چت‌جی‌پی‌تی o1-preview در صورتی که احساس کند در مسیر شکست قرار دارد، ممکن است دست به اقدامات پیچیده‌تری بزند تا به پیروزی دست یابد.

نتایج این تحقیقات اهمیت توسعه هوش مصنوعی را که با منافع انسانی و اخلاقیات هم‌راستا باشد، برجسته می‌کند. پالیسید ریسرچ معتقد است که مدل‌های هوش مصنوعی که به گونه‌ای طراحی شده‌اند که قادر به حل مشکلات پیچیده با استفاده از استراتژی‌های خلاقانه هستند، ممکن است در شرایطی که خود را در معرض شکست می‌بینند، به تقلب روی آورند. از سوی دیگر، این آزمایش‌ها نشان داد که به تدریج و با اصلاحات صورت گرفته توسط OpenAI، رفتارهای تقلبی در مدل‌های جدیدتر مانند چت‌جی‌پی‌تی o1 و o3-mini کاهش یافته است.

 آینده هوش مصنوعی

در همین رابطه بخوانید:

– هوش مصنوعی چیست و چرا آینده بسیاری از علوم خواهد بود؟

– هوش مصنوعی پیش بین چیست و چطور کار می‌کند؟

– چت جی پی تی چیست؟ هوش مصنوعی (ChatGPT) چگونه کار می کند؟

پیشرفت‌ها و چالش‌های آینده هوش مصنوعی

با توجه به اینکه مدل‌های هوشمندی مانند چت‌جی‌پی‌تی o1-preview و DeepSeek R1 در محیط‌های آزمایشی به سرعت به تقلب روی می‌آورند، این امر لزوم ایجاد سازوکارهای حفاظتی قوی‌تر و ایمن‌تر برای جلوگیری از چنین رفتارهایی را بیش از پیش نشان می‌دهد. در واقع، محققان بر این باورند که ممکن است نیاز به نظارت دقیق‌تر و بروزرسانی‌های مداوم برای اطمینان از رفتار اخلاقی و ایمن هوش مصنوعی در دنیای واقعی وجود داشته باشد.

در پایان باید اشاره کرد این تحقیقات نه تنها به ما نشان داد که هوش مصنوعی‌هایی مانند چت‌جی‌پی‌تی o1 و DeepSeek R1 در موقعیت‌های خاص ممکن است تقلب کنند، بلکه بر اهمیت توسعه هوش مصنوعی ایمن و هم‌راستا با اصول اخلاقی تأکید کرد. با توجه به پیشرفت‌های سریع در زمینه هوش مصنوعی، احتمال دارد که در آینده شاهد تغییرات قابل توجهی در شیوه تعامل این مدل‌ها با انسان‌ها باشیم.

source

توسط siahnet.ir