انتشار اوپوس ۴.۵ توسط انتروپیک با ادغامهای جدید در کروم و اکسل

روز دوشنبه، شرکت Anthropic مدل Opus 4.5 را بهعنوان جدیدترین نسخه از مدل اصلی خود معرفی کرد. این مدل آخرین نسخه از سری ۴.۵ به شمار میرود؛ نسخههای Sonnet 4.5 در سپتامبر و Haiku 4.5 در اکتبر منتشر شده بودند.
طبق انتظار، نسخه جدید اوپوس در مجموعهای از بنچمارکها عملکردی همتراز با پیشرفتهترین مدلهای روز دارد؛ از جمله بنچمارکهای کدنویسی (SWE-Bench و Terminal-bench)، بنچمارکهای استفاده از ابزارها (tau2-bench و MCP Atlas)، و حل مسائل عمومی (ARC-AGI 2 و GPQA Diamond).
نکته قابل توجه این است که Opus 4.5 نخستین مدلی است که در بنچمارک SWE-Bench verified امتیازی بالاتر از ۸۰٪ کسب میکند؛ معیاری مهم در حوزه ارزیابی توانایی کدنویسی مدلهای هوش مصنوعی.
انتروپیک همچنین بر تواناییهای اوپوس در استفاده از کامپیوتر و صفحهگستردهها تأکید کرد و همزمان مجموعهای از محصولات مکمل را معرفی نمود تا کارایی مدل را در این محیطها نمایش دهد. همزمان با عرضه اوپوس ۴.۵، نسخههای عمومیتر Claude for Chrome و Claude for Excel نیز ارائه میشوند.
افزونه کروم در دسترس همه کاربران Max قرار میگیرد و نسخه مخصوص اکسل برای کاربران Max، Team و Enterprise عرضه خواهد شد.
اوپوس ۴.۵ همچنین با بهروزرسانیهای مهم در مدیریت حافظه برای عملیاتِ با زمینه طولانی (Long Context) همراه است؛ تغییری که به گفته شرکت، مستلزم بازطراحی قابلتوجه نحوه مدیریت حافظه بود.
دیان نا پِن، مدیر محصول تحقیقات در انتروپیک، در گفتگو با تککرانچ گفت:
«در آموزش اوپوس ۴.۵ کیفیت زمینههای طولانی را بهبود دادهایم، اما داشتن یک پنجره کانتکست بزرگ بهتنهایی کافی نیست. دانستن اینکه کدام جزئیات باید حفظ شوند، به اندازه اندازه کانتکست اهمیت دارد.»
این تغییرات امکان ارائه قابلیتی پرتَقاضا به نام چت بیپایان را برای کاربران پولی کلود فراهم کرده است؛ قابلیتی که به مدل اجازه میدهد حتی پس از پر شدن پنجره کانتکست، مکالمه را بدون وقفه ادامه دهد. در این حالت، مدل حافظه مکالمه را فشرده میکند بدون اینکه به کاربر اطلاع دهد.
بسیاری از این ارتقاها با نگاه به سناریوهای عاملمحور (Agentic) انجام شدهاند؛ بهویژه سناریوهایی که در آن اوپوس نقش عامل اصلی را ایفا میکند و گروهی از زیرعاملهای مبتنی بر Haiku را هدایت میکند. مدیریت چنین وظایفی نیازمند توانایی چشمگیر در حافظه کاری است؛ جایی که بهروزرسانیهای جدید بیشترین تأثیر خود را نشان میدهند.
پِن در ادامه میگوید: «در اینجا اصولی مثل حافظه اهمیت حیاتی پیدا میکنند، چون کلود باید قادر باشد در میان کدبیسها و اسناد بزرگ جستوجو کند و بداند چه زمانی لازم است به عقب برگردد و چیزی را دوباره بررسی کند.»
اوپوس ۴.۵ اکنون باید با مدلهای قدرتمند و تازهمنتشرشده رقابت کند؛ از جمله GPT 5.1 محصول OpenAI (منتشرشده در ۱۲ نوامبر) و Gemini 3 از گوگل (منتشرشده در ۱۸ نوامبر).







