رقابت نفس گیر هوش مصنوعی با باهوش ترین دانش آموزان دنیا
به گزارش تور آسیایی ارزان، هوش مصنوعی DeepMind در این مسابقه پیروز شد تا به 25 سوال از 30 سوال مطرح شده پاسخ دهد و این در حالی بود که دارنده مدال طلای هندسه به 26 سوال پاسخ داد.
غزال زیاری: سیستم پیشرفته به وسیله DeepMind گوگل، رکورد نوی را از عملکرد هوش مصنوعی در حل مسائل هندسه را به نمایش گذاشت. این سیستم که AlphaGeometry نام دارد، توانست تا به 25 سوال از 30 سوال هندسه ای که از المپیادهای دنیای بین المللی ریاضی در بین سال های 2000 تا 2022 استخراج شده بود، پاسخ دهد.
بدین ترتیب این نرم افزار، از اکثریت ریاضی دانان جوان و برندگان مدال طلای IMO پیشی گرفته است. خود DeepMind پیش بینی نموده که یک دارنده مدال طلای المپیاد می تواند 26 سوال از 30 سوال را حل نماید.
بسیاری از افراد IMO را معترجحانن مسابقه ریاضی دنیا برای دانش آموزان دبیرستانی می دانند. DeepMind در این رابطه نوشت: از آنجا که مدل های زبانی در شناسایی الگوها و روابط عمومی در داده ها رجحان دارند، این قابلیت را دارند که به سرعت به پیش بینی سازه های بالقوه مفید بپردازند. اما در اغلب مواقع توانایی استدلال دقیق یا شرح تصمیمات خود را ندارند. از همین رو و برای غلبه بر این مشکل، DeepMind یک مدل زبان را با یک موتور کسر نمادین سنتی تر که استدلال جبری و هندسی را انجام می دهد، با هم همراه کرد.
این تحقیق به وسیله Trieu Trinh، دانشمند کامپیوتر که اخیرا دکترای خود را از دانشگاه نیویورک گرفته، راهنمایی شد. ایوان چن، دارنده مدال طلای المپیاد سابق، بعد از ارزیابی بعضی از خروجی های AlphaGeometry، به تمجید از آن پرداخت و گفت: این حیرت انگیز است؛ چرا که هم قابل تائید و هم تر و تمیز است. این در حالی است که بعضی از نرم افزارهای قبلی، اثبات های پیچیده ای را برای هندسه ارائه می دادند که درک آن برای بازدیدنمایندگان سخت بود. اما خروجی AlphaGeometry مشابه آنچه که یک ریاضیدان می نویسد، خواهد بود.
AlphaGeometry بخشی از یک پروژه بزرگتر DeepmMind است که برای بهبود قابلیت های استدلال مدل های زبان بزرگ با ترکیب آنها با الگوریتم های جستجوی سنتی به کار می رود. DeepMind مقالات متعددی در این باره منتشر نموده است.
راه چاره DeepMind برای غلبه بر نقطه ضعف ها
نقطه ضعف یک مدل زبان این است که در استدلال قیاسی عالی نیست؛ از همین رو تیم DeepMind یک معماری ترکیبی را توسعه داده اند که یک موتور کسر نمادین به شکل مکانیکی نتایجی را به دست می آورد که به صورت منطقی از فرضیه های دریافتی ناشی می شوند و به شکل دوره ای، کنترل به یک مدل زبان منتقل می گردد که خلاقانه تر خواهد بود.
آنچه کار را سخت می نماید این است که برای آموزش یک مدل زبان نو، به داده های زیادی احتیاج خواهد بود و این در حالی است که داده های کافی درباره مسائل هندسی سخت و سخت وجود ندارد؛ از همین رو ترین و همکارانش به جای تکیه بر مسائل هندسه طراحی شده به وسیله انسان، یک پایگاه داده بزرگ از مسئله های چالش برانگیز هندسه ایجاد کردند.
معرفی FunSearch
ماه گذشته بود که DeepMind، Funsearch را که یک مدل زبان برای فراوری برنامه های کامپیوتری را معرفی کرد که از آن برای حل مسائل سخت ریاضی استفاده می گردد. Funsearch به جای جستجوی درختی از الگوریتم ژنتیک برای کشف فضای برنامه های ممکن استفاده می نماید. اما در سطح انتزاعی تر، از همان رویکرد اساسی AlphaGeometry بهره می برد.
شین لگ، یکی از بنیانگذاران و دانشمند ارشد DeepMind در این باره گفته:این مدل های پایه، یک نوع مدل دنیای هستند و برای حل خلاقانه مسئله، باید جستجو را شروع کرد. برای خلاقیت بیشتر، باید در فضاهای احتمالی به جستجو پرداخته و این جواهرات پنهان شده را بیابید.
Tree of Thoughts، FunSearch و اکنون AlphaGeometry همگی انواعی از این موضوع اصلی هستند. گرچه مدل های زبان، منبع خوبی برای ایده های امیدوارنماینده هستند، اما در استدلال منطقی عالی نیستند. چرا که گاهی اشتباه می نمایند یا گیج می شوند. بنابراین DeepMind با جاسازی مدل های زبانی در سیستم های بزرگ تر آزمایش می نماید که آیا می توان در استدلال سیستماتیک تر شرکت داده شوند یا خیر.
از سوی دیگر شایعاتی وجود دارد که OpenAI روی روینمودهای مشابهی کار می نماید. در نوامبر گذشته و با اخراج و استخدام مجدد سام آلتمن به عنوان مدیرعامل OpenAI، گزارش هایی درباره ساخت پروژه مرموز OpenAI به نام Q منتشر شد که تلاشی برای ترکیب مدل های زبان با الگوریتم های جستجوی سنتی تر بوده است.
تردیدی نیست که این رویکرد پیشرفت های مهمی را به همراه خواهد داشت. وجه اشتراک FunSearch و AlphaGeometry این است که هر دو به دامنه هایی محدود می شوند که در آن ما روش های اتوماتیک ارزیابی راه چاره های پیشنهادی را داریم و این بدان معناست که مدل های زبانی احتیاجی به درک عمیق مسائلی که در حال حل آنها هستند را ندارند.
منبع: arstechnica
5858
منبع: خبرآنلاین