گام جدید انویدیا در مدل های متن باز خودران

انویدیا روز دوشنبه مجموعهای از زیرساختها و مدلهای جدید هوش مصنوعی را معرفی کرد؛ گامی که در راستای توسعه فناوریهای زیربنایی هوش مصنوعی فیزیکی، شامل رباتها و خودروهای خودران است؛ سامانههایی که باید قادر باشند محیط واقعی را درک کرده و با آن تعامل داشته باشند.
این شرکت بزرگ نیمههادی در کنفرانس NeurIPS در سندیگو کالیفرنیا، مدل Alpamayo-R1 را معرفی کرد؛ یک مدل متنباز بینایی–زبانی مبتنی بر استدلال که ویژه تحقیقات رانندگی خودران طراحی شده است. انویدیا اعلام کرده این نخستین مدل «بینایی–زبان–اقدام» است که بهطور اختصاصی بر حوزه رانندگی خودران تمرکز دارد.
مدلهای بینایی–زبانی میتوانند متن و تصویر را همزمان پردازش کنند، بنابراین خودرو قادر میشود محیط پیرامون خود را «ببیند» و بر اساس آنچه درک میکند تصمیمگیری نماید.
این مدل جدید بر پایه مدل Cosmos-Reason انویدیا ساخته شده است؛ مدلی استدلالمحور که قبل از ارائه پاسخ، منطق و مراحل تصمیمگیری را طی میکند. انویدیا نخستین نسخههای خانواده Cosmos را در ژانویه ۲۰۲۵ عرضه کرد و مدلهای تکمیلی آن در آگوست منتشر شد.
انویدیا در یک پست وبلاگ اعلام کرد که فناوریهایی مانند Alpamayo-R1 برای شرکتهایی که قصد دستیابی به سطح ۴ خودران دارند بسیار حیاتی است؛ سطحی که در آن خودرو میتواند در یک محدوده مشخص و تحت شرایط تعریفشده، بهطور کامل و بدون دخالت انسان حرکت کند.
هدف انویدیا از توسعه چنین مدلهای استدلالی، ایجاد نوعی «常sense» یا درک شهودی مشابه انسان در خودروهای خودران است تا بتوانند تصمیمهای پیچیدهی رانندگی را بهتر و با ظرافت بیشتری مدیریت کنند.
این مدل جدید هماکنون در GitHub و Hugging Face در دسترس قرار دارد.
همزمان با انتشار این مدل، انویدیا مجموعهای از راهنماهای گامبهگام، منابع استنتاج و گردشکارهای پسآموزش را نیز در GitHub بارگذاری کرده است که در مجموع Cosmos Cookbook نام دارند. این راهنماها برای کمک به توسعهدهندگان جهت استفاده و آموزش مدلهای Cosmos در کاربردهای اختصاصی خود تهیه شدهاند و بخشهایی همچون سازماندهی داده، تولید داده مصنوعی و ارزیابی مدل را پوشش میدهند.
این اعلامیهها در زمانی منتشر میشود که انویدیا با تمام قدرت در حال ورود به حوزه هوش مصنوعی فیزیکی بهعنوان مسیر جدیدی برای استفاده از GPUهای پیشرفته خود است.
جنسن هوانگ، همبنیانگذار و مدیرعامل انویدیا، بارها تأکید کرده است که موج بعدی هوش مصنوعی، هوش مصنوعی فیزیکی خواهد بود. بیل دالی، دانشمند ارشد انویدیا، نیز در گفتوگویی با TechCrunch در تابستان گذشته همین دیدگاه را تکرار کرده و بر نقش هوش مصنوعی فیزیکی در رباتیک تأکید کرده است.
او گفته بود:
«من فکر میکنم در نهایت رباتها به بازیگران اصلی جهان تبدیل خواهند شد و ما میخواهیم مغز تمام رباتها را بسازیم. برای این کار، باید از اکنون توسعه فناوریهای کلیدی را آغاز کنیم.»







