به گزارش ایسنا، در رویدادی با نام Agents4Science 2025 که قرار است در روز 22 اکتبر به صورت آنلاین برگزار شود، مقالات ارسالی که توسط خود عوامل هوش مصنوعی یا توسط انسانهایی که آزمایشها را انجام دادهاند نوشته شده است، ارائه میشود و شرکتکنندگان این رویداد انسانها خواهند بود.
به نقل از نیچر، جیمز زو، محقق هوش مصنوعی در دانشگاه استنفورد در کالیفرنیا که از برگزارکنندگان این رویداد است، میگوید: این کنفرانس یک محیط نسبتا امن را ارائه میدهد که در آن میتوانیم فرآیندهای مختلف ارسال و انواع مختلف فرآیندهای بررسی را آزمایش کنیم. زو میگوید این کنفرانس برای ثبت «تغییر الگو» در نحوه استفاده از هوش مصنوعی در علم که در طول سال گذشته رخ داده است، طراحی شده است. او میگوید محققان اکنون به جای استفاده از مدلهای زبان بزرگ یا سایر ابزارهایی که برای وظایف خاص طراحی شدهاند، در حال ساخت گروههای هماهنگ از مدلها، معروف به عاملها، هستند تا به عنوان دانشمندانی که در سراسر تلاش تحقیقاتی کار میکنند، عمل کنند.
مدلهای هوش مصنوعی در حال حاضر برای تولید و بررسی تحقیقات استفاده میشوند، اما اکثر ناشران و برگزارکنندگان کنفرانس، ماشینها را از فهرست شدن به عنوان نویسنده یا سخنران مقاله منع میکنند. زو میگوید: ما فکر کردیم که اوضاع را برعکس کنیم، جایی که هم نویسندگان و هم داوران باید هوش مصنوعی باشند. اگرچه انسانها میتوانند طبق راهنمای کنفرانس، مشاوره و بازخورد ارائه دهند، اما هوش مصنوعی باید مشارکتکننده اصلی، شبیه به نویسنده اول، باشد.
مارگارت میچل، دانشمند رایانه، که در دانشگاه هاگینگ فیس در شهر نیویورک، اخلاق هوش مصنوعی را مطالعه میکند، میگوید: این کنفرانس توجه را به این واقعیت جلب میکند که کسانی از ما در دنیای هوش مصنوعی باید در درک نقاط قوت و ضعف استفاده از سیستمها به این روش، کار بهتری انجام دهیم. اینکه چگونه عاملهای هوش مصنوعی را ارزیابی کنیم، یک حوزه تحقیقاتی باز است. یک سوال کلیدی این است که چگونه میتوان فراوانی کشفیات «مثبت کاذب» بیفایده این مدل را در نظر گرفت، چیزی که میتواند سودمندی کلی آن را تعدیل کند.
کلمنتین فوریه، محقق هوش مصنوعی و همچنین در هاگینگ فیس، میگوید: Agents4Science مزیت دیگری نیز دارد. امیدواریم کنفرانسی مانند این، بخشی از حجم زیاد هوش مصنوعی را برای کاهش بار داوری در جلسات دیگر کاهش دهد.
بازرسان هوش مصنوعی
برگزارکنندگان کنفرانس، آثار ارسالی بیش از 300 عامل هوش مصنوعی را دریافت کردند که از این تعداد، 48 مورد پس از ارزیابی توسط هیئت داوران هوش مصنوعی پذیرفته شدند. زو میگوید این مقالات عمدتا مطالعات محاسباتی به جای آزمایشهای فیزیکی هستند و زمینههایی از روانکاوی تا ریاضیات را پوشش میدهند. او امیدوار است که این کنفرانس دادههایی در مورد میزان مهارت دانشمندان هوش مصنوعی و انواع اشتباهاتی که مرتکب میشوند، تولید کند. میچل میگوید چنین دادههایی میتواند برای اطلاعرسانی در مورد سیاستهای استفاده از هوش مصنوعی در تحقیقات استفاده شود.
عاملهای هوش مصنوعی که به حال خود رها شوند، هنوز مستعد خطا هستند. زو میگوید، مقالات ارسالی برای کنفرانس Agents4Science ملزم بودند که در هر مرحله از فرآیند، تعامل بین محقق و عامل هوش مصنوعی را بیان کنند. این بدان معناست که میتوان ارزیابی کرد که میزان دخالت انسان چگونه بر کیفیت کار تاثیر میگذارد.
میزان مهارت هوش مصنوعی در بررسی نیز ارزیابی خواهد شد. برای انتخاب مقالات کنفرانس برای پذیرش، عوامل هوش مصنوعی دور اول بررسی را با استفاده از دستورالعملها و سیستم امتیازدهی ارائه شده به داوران در کنفرانس معتبر NeurIPS انجام دادند. سپس مقالات برتر توسط یک هیئت مشاوره انسانی نیز ارزیابی شدند. زو میگوید، بررسیها به صورت آزاد برای مطالعه در دسترس همه قرار خواهد گرفت و برگزارکنندگان همچنین بررسیهای تولید شده توسط هوش مصنوعی را با بررسیهای نوشته شده توسط انسانها مقایسه خواهند کرد. او میافزاید: فکر میکنم این یک معیار مقایسه مفید نیز فراهم میکند.
استفاده از مدلهای هوش مصنوعی به عنوان داور همتا برای مجلات یا کنفرانسها موضوعی بحثبرانگیز است. یک بررسی جدید از موسسه فیزیک بریتانیا نشان داد که ۵۷ درصد از پاسخدهندگان اگر از هوش مصنوعی مولد برای نوشتن گزارش داوری همتا در مورد نسخه خطی که آنها در نوشتن آن مشارکت داشتهاند، استفاده شود، ناراضی خواهند بود. داوران هوش مصنوعی طیف وسیعی از نقاط ضعف و آسیبپذیریها را دارند. برای مثال، نشان داده شده است که برخی از آنها از دستورالعملهای پنهانی برای نقد مثبت یک مقاله پیروی میکنند که نیاز به اقدامات حفاظتی دارند. برخی از محققان معتقدند که استفاده از هوش مصنوعی برای بررسی مقالات میتواند به این معنی باشد که محققان تازه کار از یادگیری مهارتهای حیاتی محروم میشوند.
اما زو و دیگران میگویند که حداقل در علوم رایانه، نوعی بررسی هوش مصنوعی برای مقابله با افزایش عظیم مقالات ارسالی به کنفرانسها مورد نیاز است. ارسال مقالات به NeurIPS در پنج سال گذشته بیش از دو برابر شده است، که بخشی از آن به دلیل استفاده از مدلهای زبانی بزرگ است. زو پیشنهاد میکند که عوامل هوش مصنوعی ممکن است تیمهای بررسی ترکیبی با انسانها تشکیل دهند. او میگوید: چنین انفجاری در انتشارات وجود دارد، فکر میکنم مردم شروع به تشخیص این موضوع کردهاند که ما به کمک نیاز داریم.
مطالعات موجود نشان میدهد که مدلهای زبانی بزرگ در این زمینه به خوبی انسانها نیستند.
انتهای پیام