غزل زیاری: سیستم توسعه یافته توسط DeepMind گوگل رکورد عملکرد جدیدی را برای هوش مصنوعی در حل مسائل هندسی به ثبت رسانده است. این سیستم که AlphaGeometry نام داشت، توانست به 25 سوال از 30 سوال هندسه ای که در المپیادهای بین المللی ریاضی بین سال های 2000 تا 2022 مطرح شده بود پاسخ دهد.
یعنی این نرم افزار از اکثر ریاضیدانان جوان و به نظر من مدال آوران طلا پیشی گرفته است. خود دیپ مایند پیش بینی کرد که یک دارنده مدال طلای المپیک می تواند 26 سوال از 30 سوال را حل کند.
به نظر من، IMO از نظر بسیاری معتبرترین مسابقه ریاضی در جهان برای دانش آموزان دبیرستانی است. DeepMind نوشت: از آنجایی که مدلهای زبانی در شناسایی الگوها و روابط عمومی در دادهها عالی هستند، میتوانند سازههای بالقوه مفید را به سرعت پیشبینی کنند.. اما اغلب آنها قادر به توجیه یا توضیح دقیق تصمیمات خود نیستند. برای حل این مشکل، DeepMind یک مدل زبان را با یک موتور تفریق نمادین سنتی تر ترکیب کرد که استدلال جبری و هندسی را انجام می دهد.
این تحقیق توسط Trieu Trinh، دانشمند کامپیوتر که اخیراً دکترای خود را از دانشگاه نیویورک دریافت کرده است، انجام شد. پس از ارزیابی برخی از نتایج AlphaGeometry، ایوان چن دارنده مدال طلای سابق المپیک اینگونه تمجید کرد: «این شگفت انگیز است. چون هم قابل ردیابی است و هم تمیز. در همین حال، برخی از نرمافزارهای قبلی اثباتهای هندسی پیچیدهای را ارائه کردند که درک آن برای بازدیدکنندگان دشوار بود. اما خروجی AlphaGeometry شبیه چیزی است که یک ریاضیدان مینویسد.
هندسه آلفا بخشی از یک پروژه بزرگتر DeepmMind برای بهبود قابلیتهای استدلال مدلهای زبان بزرگ با ترکیب آنها با الگوریتمهای جستجوی سنتی استفاده میشود. DeepMind چندین مقاله در این مورد منتشر کرده است.
راه حل DeepMind بر نقاط ضعف غلبه کنید
نقطه ضعف یک مدل زبانی این است که در استدلال قیاسی خوب نیست. بنابراین، تیم DeepMind یک معماری ترکیبی ایجاد کرده است که در آن یک موتور کسر نمادین به طور مکانیکی نتایجی را که به طور منطقی از فرضیههای دریافتی ناشی میشود، به دست میآورد، و به طور دورهای کنترل را به یک مدل زبان خلاقتر واگذار میکند.
چیزی که کار را دشوار می کند این است که برای آموزش یک مدل زبان جدید به داده های زیادی نیاز است و داده های کافی در مورد مسائل هندسی دشوار وجود ندارد. بنابراین، ترین و همکارانش به جای تکیه بر مسائل هندسه طراحی شده توسط انسان، پایگاه داده عظیمی از مسائل پیچیده هندسه ایجاد کردند.
معرفی FunSearch
ماه گذشته، DeepMind Funsearch را معرفی کرد، مدل زبانی برای تولید برنامه های کامپیوتری که برای حل مسائل دشوار ریاضی استفاده می شود. به جای جستجوی درختی، Funsearch از یک الگوریتم ژنتیک برای کشف فضای برنامه های ممکن استفاده می کند. اما در یک سطح انتزاعی تر از همان رویکرد اساسی AlphaGeometry استفاده می کند.
شین لوگ، یکی یکی از بنیانگذاران و دانشمندان ارشد DeepMind میگوید: «این مدلهای اساسی نوعی مدل جهانی هستند و برای حل خلاقانه مشکل باید شروع به جستجو کرد.» برای خلاقیت بیشتر باید فضاهای ممکن را جستجو کرد و این گنجینههای پنهان را پیدا کرد. . “
Tree of Thoughts، FunSearch و اکنون AlphaGeometry همگی تغییراتی در این موضوع اصلی هستند. اگرچه مدلهای زبان منبع خوبی برای ایدههای امیدوارکننده هستند، اما بهویژه در استدلال منطقی خوب نیستند. چون گاهی اشتباه می کنند یا گیج می شوند. با جاسازی مدلهای زبان در سیستمهای بزرگتر، DeepMind آزمایش میکند که آیا آنها برای تفکر سیستماتیکتر مناسب هستند یا خیر.
از سوی دیگر، شایعاتی وجود دارد که OpenAI روی رویکردهای مشابه کار می کند. نوامبر گذشته، با اخراج و بازگرداندن سام آلتمن، مدیر عامل OpenAI، گزارشهایی مبنی بر ایجاد یک پروژه مرموز OpenAI به نام Q* منتشر شد، تلاشی برای ترکیب مدلهای زبان با الگوریتمهای جستجوی سنتیتر.
شکی نیست که این رویکرد پیشرفت های مهمی را به همراه خواهد داشت. وجه اشتراک FunSearch و AlphaGeometry این است که هر دو به حوزههایی محدود میشوند که در آن روشهای خودکار برای ارزیابی راهحلهای پیشنهادی داریم، به این معنی که مدلهای زبان نیازی به درک عمیقی از مشکلاتی که حل میکنند ندارند.
منبع: Arstechnica
۵۸۵۸