مسابقه هوش مصنوعی خیره کننده با باهوش ترین دانش آموزان جهان

غزل زیاری: سیستم توسعه یافته توسط DeepMind گوگل رکورد عملکرد جدیدی را برای هوش مصنوعی در حل مسائل هندسی به ثبت رسانده است. این سیستم که AlphaGeometry نام داشت، توانست به 25 سوال از 30 سوال هندسه ای که در المپیادهای بین المللی ریاضی بین سال های 2000 تا 2022 مطرح شده بود پاسخ دهد.

یعنی این نرم افزار از اکثر ریاضیدانان جوان و به نظر من مدال آوران طلا پیشی گرفته است. خود دیپ مایند پیش بینی کرد که یک دارنده مدال طلای المپیک می تواند 26 سوال از 30 سوال را حل کند.

به نظر من، IMO از نظر بسیاری معتبرترین مسابقه ریاضی در جهان برای دانش آموزان دبیرستانی است. DeepMind نوشت: از آنجایی که مدل‌های زبانی در شناسایی الگوها و روابط عمومی در داده‌ها عالی هستند، می‌توانند سازه‌های بالقوه مفید را به سرعت پیش‌بینی کنند.. اما اغلب آنها قادر به توجیه یا توضیح دقیق تصمیمات خود نیستند. برای حل این مشکل، DeepMind یک مدل زبان را با یک موتور تفریق نمادین سنتی تر ترکیب کرد که استدلال جبری و هندسی را انجام می دهد.

این تحقیق توسط Trieu Trinh، دانشمند کامپیوتر که اخیراً دکترای خود را از دانشگاه نیویورک دریافت کرده است، انجام شد. پس از ارزیابی برخی از نتایج AlphaGeometry، ایوان چن دارنده مدال طلای سابق المپیک اینگونه تمجید کرد: «این شگفت انگیز است. چون هم قابل ردیابی است و هم تمیز. در همین حال، برخی از نرم‌افزارهای قبلی اثبات‌های هندسی پیچیده‌ای را ارائه کردند که درک آن برای بازدیدکنندگان دشوار بود. اما خروجی AlphaGeometry شبیه چیزی است که یک ریاضیدان می‌نویسد.

هندسه آلفا بخشی از یک پروژه بزرگتر DeepmMind برای بهبود قابلیت‌های استدلال مدل‌های زبان بزرگ با ترکیب آنها با الگوریتم‌های جستجوی سنتی استفاده می‌شود. DeepMind چندین مقاله در این مورد منتشر کرده است.

راه حل DeepMind بر نقاط ضعف غلبه کنید

نقطه ضعف یک مدل زبانی این است که در استدلال قیاسی خوب نیست. بنابراین، تیم DeepMind یک معماری ترکیبی ایجاد کرده است که در آن یک موتور کسر نمادین به طور مکانیکی نتایجی را که به طور منطقی از فرضیه‌های دریافتی ناشی می‌شود، به دست می‌آورد، و به طور دوره‌ای کنترل را به یک مدل زبان خلاق‌تر واگذار می‌کند.

چیزی که کار را دشوار می کند این است که برای آموزش یک مدل زبان جدید به داده های زیادی نیاز است و داده های کافی در مورد مسائل هندسی دشوار وجود ندارد. بنابراین، ترین و همکارانش به جای تکیه بر مسائل هندسه طراحی شده توسط انسان، پایگاه داده عظیمی از مسائل پیچیده هندسه ایجاد کردند.

معرفی FunSearch

ماه گذشته، DeepMind Funsearch را معرفی کرد، مدل زبانی برای تولید برنامه های کامپیوتری که برای حل مسائل دشوار ریاضی استفاده می شود. به جای جستجوی درختی، Funsearch از یک الگوریتم ژنتیک برای کشف فضای برنامه های ممکن استفاده می کند. اما در یک سطح انتزاعی تر از همان رویکرد اساسی AlphaGeometry استفاده می کند.

شین لوگ، یکی یکی از بنیان‌گذاران و دانشمندان ارشد DeepMind می‌گوید: «این مدل‌های اساسی نوعی مدل جهانی هستند و برای حل خلاقانه مشکل باید شروع به جستجو کرد.» برای خلاقیت بیشتر باید فضاهای ممکن را جستجو کرد و این گنجینه‌های پنهان را پیدا کرد. . “

Tree of Thoughts، FunSearch و اکنون AlphaGeometry همگی تغییراتی در این موضوع اصلی هستند. اگرچه مدل‌های زبان منبع خوبی برای ایده‌های امیدوارکننده هستند، اما به‌ویژه در استدلال منطقی خوب نیستند. چون گاهی اشتباه می کنند یا گیج می شوند. با جاسازی مدل‌های زبان در سیستم‌های بزرگ‌تر، DeepMind آزمایش می‌کند که آیا آنها برای تفکر سیستماتیک‌تر مناسب هستند یا خیر.

از سوی دیگر، شایعاتی وجود دارد که OpenAI روی رویکردهای مشابه کار می کند. نوامبر گذشته، با اخراج و بازگرداندن سام آلتمن، مدیر عامل OpenAI، گزارش‌هایی مبنی بر ایجاد یک پروژه مرموز OpenAI به نام Q* منتشر شد، تلاشی برای ترکیب مدل‌های زبان با الگوریتم‌های جستجوی سنتی‌تر.

شکی نیست که این رویکرد پیشرفت های مهمی را به همراه خواهد داشت. وجه اشتراک FunSearch و AlphaGeometry این است که هر دو به حوزه‌هایی محدود می‌شوند که در آن روش‌های خودکار برای ارزیابی راه‌حل‌های پیشنهادی داریم، به این معنی که مدل‌های زبان نیازی به درک عمیقی از مشکلاتی که حل می‌کنند ندارند.

منبع: Arstechnica

۵۸۵۸

اخبار مرتبط

ارسال به دیگران :

آخرین اخبار

همکاران ما

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *