
مسابقات داغ هوش مصنوعی: چرا جدول امتیازات اشتباه میگویند و چگونه آنها را بهتر کنیم؟
تصور کنید که مسابقهای برگزار شده است. در این مسابقه، رباتهای هوشمند و کامپیوترهای فوقالعاده داریم که کارهای مختلفی انجام میدهند، مثلاً تشخیص عکس گربه از سگ، یا نوشتن داستانهای بامزه. برای اینکه بفهمیم کدام ربات بهتر است، یک «جدول امتیازات» درست میکنیم. مثل جدول امتیازات در بازیهای ویدیویی یا مسابقات ورزشی که نشان میدهد کدام بازیکن یا تیم بهتر عمل کرده است.
اما دانشگاه میشیگان در تاریخ ۲۹ جولای ۲۰۲۵، یک مقاله جالب منتشر کرد که میگوید این جدولهای امتیازات هوش مصنوعی همیشه هم دقیق نیستند! بیایید ببینیم چرا و چطور میتوانیم آنها را درست کنیم.
چرا جدول امتیازات هوش مصنوعی گاهی گولزننده هستند؟
تصور کنید ما یک ربات داریم که میتواند عکسهای حیوانات را تشخیص دهد. ما به او هزاران عکس گربه و سگ نشان میدهیم و میگوییم کدام گربه و کدام سگ است. بعد، از او میخواهیم عکسهای جدیدی را تشخیص دهد. جدول امتیازات به ما میگوید ربات ما چقدر در تشخیص درست موفق بوده است.
اما مشکل اینجاست:
- آمادهسازی متفاوت: بعضی وقتها، رباتها را با اطلاعات (عکسها) متفاوتی آموزش میدهند. مثل این است که یک دانشآموز در کلاس درس ریاضی، مطالب بیشتری یاد گرفته باشد و دیگری کمتر. طبیعی است که اولی در امتحان بهتر عمل کند، اما این دلیل بر باهوشتر بودن کلی او نیست.
- سوالات یا وظایف یکسان نیستند: گاهی اوقات، جدول امتیازات، رباتها را با سوالات یا کارهایی میسنجند که با هم فرق دارند. مثلاً یک ربات فقط عکس حیوانات را تشخیص میدهد، اما ربات دیگر هم حیوانات را تشخیص میدهد و هم نام آنها را مینویسد. این دو با هم قابل مقایسه مستقیم نیستند. مثل این است که بخواهیم یک دونده دوی سرعت را با یک شناگر مقایسه کنیم!
- فریب دادن سیستم: بعضی وقتها، سازندگان رباتها، روشهایی را پیدا میکنند که رباتشان در همان تستهای مخصوص جدول امتیازات، خوب عمل کند، اما در کارهای واقعی که کمی با آن تستها فرق دارند، خیلی خوب نباشند. این مثل یاد گرفتن جواب یک امتحان خاص است، نه یاد گرفتن کلی درس.
- عدم تنوع در تستها: تصور کنید فقط از یک نوع سوال در امتحان استفاده کنیم. ممکن است دانشآموزی که روش خاصی برای پاسخ دادن به آن سوال بلد است، نمره خوبی بگیرد، ولی دانشآموز دیگری که مطالب را بهتر فهمیده ولی با آن روش خاص آشنا نیست، نمره کمتری بگیرد. در هوش مصنوعی هم اگر تستها متنوع نباشند، نتیجه ممکن است درست نباشد.
- مخفی ماندن جزئیات: ما همیشه نمیدانیم که چطور رباتها ساخته شدهاند یا با چه اطلاعاتی آموزش دیدهاند. این مثل این است که نتیجه امتحان را بدانیم، ولی ندانیم دانشآموز چطور درس خوانده است.
چگونه جدول امتیازات را بهتر کنیم؟
دانشمندان دانشگاه میشیگان پیشنهاد کردهاند که برای اینکه جدولهای امتیازات بهتر و عادلانهتر شوند، باید کارهای زیر را انجام دهیم:
- آزمایشهای یکسان و شفاف: همه رباتها باید با یک روش و با استفاده از همان نوع اطلاعات (دادهها) تست شوند. مثل این است که همه دانشآموزان در یک روز، با همان سوالات و همان زمان امتحان بدهند.
- تستهای متنوع و واقعی: علاوه بر تستهای معمول، باید از رباتها بخواهیم کارهای واقعیتری انجام دهند که شبیه به کارهایی است که در دنیای واقعی از آنها انتظار داریم. این یعنی امتحان کردن مهارتها در موقعیتهای مختلف.
- فهمیدن چگونگی عملکرد: باید بتوانیم بفهمیم که رباتها چطور به جوابهایشان میرسند. این کمک میکند تا مطمئن شویم که آنها واقعاً باهوش هستند، نه اینکه فقط روشی را یاد گرفتهاند.
- انجام تستهای جدید: هر بار که رباتهای جدیدی ساخته میشوند، باید تستهای جدیدی هم طراحی شوند تا از تواناییهای واقعی آنها مطمئن شویم.
- مشارکت همگانی: در این مسابقات، نباید فقط چند نفر تصمیم بگیرند. بهتر است دانشمندان و متخصصان بیشتری با هم مشورت کنند تا جدولهای امتیازات عادلانه و مفیدی طراحی شود.
چرا این موضوع برای ما مهم است؟
هوش مصنوعی قرار است به ما در کارهای زیادی کمک کند، مثل پیدا کردن داروها، رانندگی بهتر ماشینها، یا حتی کمک به معلمان در آموزش. اگر جدولهای امتیازات هوش مصنوعی درست نباشند، ممکن است رباتهایی را بهتر از آنچه واقعاً هستند، فکر کنیم. این میتواند باعث شود که در استفاده از آنها اشتباه کنیم.
علاقه نشان دادن به علم و رباتیک، به ما کمک میکند تا بفهمیم چطور دنیا کار میکند و چگونه میتوانیم آن را بهتر کنیم. با درک این مسائل، حتی شما هم میتوانید در آینده به ساخت رباتهای هوشمندتر و مفیدتر کمک کنید! دنیای علم پر از چالشها و هیجان است، درست مثل یک مسابقه بزرگ که با همکاری هم میتوانیم آن را برنده شویم!
Why AI leaderboards are inaccurate and how to fix them
هوش مصنوعی اخبار را ارائه کرد.
سوال زیر برای دریافت پاسخ از Google Gemini استفاده شد:
در 2025-07-29 16:10، University of Michigan ‘Why AI leaderboards are inaccurate and how to fix them’ را منتشر کرد. لطفاً یک مقاله مفصل با اطلاعات مرتبط، به زبانی ساده که کودکان و دانشآموزان بتوانند بفهمند، بنویسید تا کودکان بیشتری به علم علاقهمند شوند. لطفاً فقط مقاله را به زبان فارسی ارائه دهید.