انتشار اوپوس ۴.۵ توسط انتروپیک با ادغام‌های جدید در کروم و اکسل

6 آذر 1404آخرین به روز رسانی: 6 آذر 1404

0 0 خواندن این مطلب 2 دقیقه زمان میبرد

انتشار اوپوس ۴.۵ توسط انتروپیک با ادغام‌های جدید در کروم و اکسل

روز دوشنبه، شرکت Anthropic مدل Opus 4.5 را به‌عنوان جدیدترین نسخه از مدل اصلی خود معرفی کرد. این مدل آخرین نسخه از سری ۴.۵ به شمار می‌رود؛ نسخه‌های Sonnet 4.5 در سپتامبر و Haiku 4.5 در اکتبر منتشر شده بودند.

طبق انتظار، نسخه جدید اوپوس در مجموعه‌ای از بنچمارک‌ها عملکردی هم‌تراز با پیشرفته‌ترین مدل‌های روز دارد؛ از جمله بنچمارک‌های کدنویسی (SWE-Bench و Terminal-bench)، بنچمارک‌های استفاده از ابزارها (tau2-bench و MCP Atlas)، و حل مسائل عمومی (ARC-AGI 2 و GPQA Diamond).
نکته قابل توجه این است که Opus 4.5 نخستین مدلی است که در بنچمارک SWE-Bench verified امتیازی بالاتر از ۸۰٪ کسب می‌کند؛ معیاری مهم در حوزه ارزیابی توانایی کدنویسی مدل‌های هوش مصنوعی.

انتروپیک همچنین بر توانایی‌های اوپوس در استفاده از کامپیوتر و صفحه‌گسترده‌ها تأکید کرد و هم‌زمان مجموعه‌ای از محصولات مکمل را معرفی نمود تا کارایی مدل را در این محیط‌ها نمایش دهد. هم‌زمان با عرضه اوپوس ۴.۵، نسخه‌های عمومی‌تر Claude for Chrome و Claude for Excel نیز ارائه می‌شوند.
افزونه کروم در دسترس همه کاربران Max قرار می‌گیرد و نسخه مخصوص اکسل برای کاربران Max، Team و Enterprise عرضه خواهد شد.

اوپوس ۴.۵ همچنین با به‌روزرسانی‌های مهم در مدیریت حافظه برای عملیاتِ با زمینه طولانی (Long Context) همراه است؛ تغییری که به گفته شرکت، مستلزم بازطراحی قابل‌توجه نحوه مدیریت حافظه بود.

دیان نا پِن، مدیر محصول تحقیقات در انتروپیک، در گفتگو با تک‌کرانچ گفت:
«در آموزش اوپوس ۴.۵ کیفیت زمینه‌های طولانی را بهبود داده‌ایم، اما داشتن یک پنجره کانتکست بزرگ به‌تنهایی کافی نیست. دانستن اینکه کدام جزئیات باید حفظ شوند، به اندازه اندازه کانتکست اهمیت دارد.»

این تغییرات امکان ارائه قابلیتی پرتَقاضا به نام چت بی‌پایان را برای کاربران پولی کلود فراهم کرده است؛ قابلیتی که به مدل اجازه می‌دهد حتی پس از پر شدن پنجره کانتکست، مکالمه را بدون وقفه ادامه دهد. در این حالت، مدل حافظه مکالمه را فشرده می‌کند بدون اینکه به کاربر اطلاع دهد.

بسیاری از این ارتقاها با نگاه به سناریوهای عامل‌محور (Agentic) انجام شده‌اند؛ به‌ویژه سناریوهایی که در آن اوپوس نقش عامل اصلی را ایفا می‌کند و گروهی از زیرعامل‌های مبتنی بر Haiku را هدایت می‌کند. مدیریت چنین وظایفی نیازمند توانایی چشمگیر در حافظه کاری است؛ جایی که به‌روزرسانی‌های جدید بیشترین تأثیر خود را نشان می‌دهند.

پِن در ادامه می‌گوید: «در اینجا اصولی مثل حافظه اهمیت حیاتی پیدا می‌کنند، چون کلود باید قادر باشد در میان کدبیس‌ها و اسناد بزرگ جست‌وجو کند و بداند چه زمانی لازم است به عقب برگردد و چیزی را دوباره بررسی کند.»

اوپوس ۴.۵ اکنون باید با مدل‌های قدرتمند و تازه‌منتشرشده رقابت کند؛ از جمله GPT 5.1 محصول OpenAI (منتشرشده در ۱۲ نوامبر) و Gemini 3 از گوگل (منتشرشده در ۱۸ نوامبر).

6 آذر 1404آخرین به روز رسانی: 6 آذر 1404

0 0 خواندن این مطلب 2 دقیقه زمان میبرد

نمایش بیشتر