غزل زیاری: این هفته استارتاپی به نام Cogintion AI با انتشار دمو یک برنامه هوش مصنوعی سروصدا به پا کرد.
این برنامه هوش مصنوعی Devin نام دارد و کارهایی را انجام می دهد که معمولاً توسط توسعه دهندگان نرم افزار با درآمد بالا انجام می شود. چت ربات هایی مانند ChatGPT و Gemini می توانند کد تولید کنند، اما دوین از آن مرزها فراتر رفت و برای حل یک مشکل برنامه ریزی، کدگذاری، آزمایش و سپس پیاده سازی کرد.
سازندگان دوین آن را «توسعهدهنده نرمافزار هوش مصنوعی» مینامند. هنگامی که از دوین خواسته شد تا نحوه عملکرد مدل زبان متن باز Llama 2 Meta را هنگام دسترسی از شرکت های میزبان مختلف آزمایش کند، Devin یک طرح گام به گام برای پروژه ایجاد کرد. کد مورد نیاز برای دسترسی به APIها و اجرای تستهای بنچمارک را ایجاد کرد، سپس یک وبسایت ایجاد کرد که نتایج را خلاصه کرد.
مهندسان از عملکرد دوین هیجان زده شدند
قضاوت در مورد دموها همیشه دشوار است. اما Cognition نشان داده است که دوین کارهای شگفت انگیز مختلفی را انجام می دهد و سرمایه گذاران و مهندسان را در شبکه های اجتماعی شگفت زده می کند. در صنعت فناوری.)
دیوین آخرین و جدیدترین نمونه از روندی است که مدتی است زیر ذره بین بوده است (ظهور عوامل هوش مصنوعی که می توانند به جای ارائه پاسخ یا توصیه، مشکل ایجاد شده توسط انسان را حل کنند). چند ماه پیش یک Auto-GPT آزمایش شد، یک برنامه منبع باز که سعی می کند کارهای مفیدی را با انجام اقدامات روی رایانه شخصی و وب سایت انجام دهد. اخیراً، برنامه دیگری به نام vimGPT مورد آزمایش قرار گرفت تا ببیند که چگونه قابلیت های بصری مدل های جدید هوش مصنوعی می تواند به این عوامل کمک کند تا وب سایت ها را به طور مؤثرتر خزیدن کنند.
اشتباهات و شکست ها
محققان تحت تأثیر آزمایشات این عوامل هوش مصنوعی قرار گرفتند. با وجود آن در وضعیت فعلی خود، این عوامل، مانند مدل های زبانی زیربنایی خود، اشتباهات زیادی مرتکب می شوند. و هنگامی که نرم افزار اقداماتی را اجرا می کند (نه فقط متن تولید می کند)، یک اشتباه می تواند به معنای شکست کامل با عواقب بالقوه پرهزینه و خطرناک باشد.
محدود کردن دامنه وظایفی که یک عامل می تواند انجام دهد (مثلاً به مجموعه خاصی از وظایف مهندسی نرم افزار) راهی هوشمندانه برای کاهش فراوانی خطاها به نظر می رسد. اما هنوز راه های زیادی وجود دارد که می تواند شکست بخورد.
بازی های ویدیویی را از عوامل هوش مصنوعی انجام دهید
البته این فقط استارت آپ ها نیستند که در حال توسعه عوامل هوش مصنوعی هستند. در اوایل این هفته مقاله ای در مورد عاملی به نام SIMA که توسط Google DeepMind توسعه یافته بود، نوشته شد. سیما بازی های ویدیویی مختلفی از جمله Goat Simulator 3 را اجرا می کند.
سیما با تماشای بازی بازیکنان انسان، انجام بیش از 600 کار نسبتاً پیچیده مانند قطع درخت یا تیراندازی به یک سیارک را آموخت. مهمتر از همه، بسیاری از این اقدامات را می توان با موفقیت در یک بازی ناآشنا انجام داد. Google DeepMind آن را “عمومی” می نامد.
گوگل امیدوار است که این عوامل در نهایت خارج از دنیای بازی های ویدئویی کار کنند و شاید به کاربران در جهت یابی وب سایت ها یا نرم افزارها کمک کنند. اما بازیهای ویدیویی نیز با فراهم کردن محیطهای پیچیدهای که میتوان در آن آزمون و خطا انجام داد و پیشرفت کرد، شرایط خوبی را برای توسعه و آزمایش عوامل فراهم میکند. تیم هارلی، دانشمند تحقیقاتی در گوگل دیپ مایند، گفت: “ما سخت کار می کنیم تا عوامل هوش مصنوعی را دقیق تر کنیم و ایده های متفاوتی داریم.”
منتظر اخبار بیشتری در مورد عوامل هوش مصنوعی در ماه های آینده باشید. Demis Hassabis، مدیر عامل Google DeepMind، گفت که قصد دارد مدلهای زبان بزرگ را با کار شرکتش در برنامههای آموزشی هوش مصنوعی برای بازیهای ویدیویی ترکیب کند تا عوامل قدرتمندتر و قابل اعتمادتری ایجاد کند. وی گفت: این حوزه بزرگ است و ما در این زمینه سرمایه گذاری زیادی انجام می دهیم و می توانم تصور کنم که دیگران نیز همین کار را انجام دهند و این گام بزرگی در تغییر قابلیت های این سامانه ها است.
منبع: سیمی
227227