Anthropic ra mắt Opus 4.6: Claude mở rộng context 1 triệu token, tăng mạnh năng lực AI doanh nghiệp
https://fptshop.com.vn/https://fptshop.com.vn/
Tâm An
4 tháng trước

Anthropic ra mắt Opus 4.6: Claude mở rộng context 1 triệu token, tăng mạnh năng lực AI doanh nghiệp

Opus 4.6 là mô hình AI mới nhất của Anthropic với nhiều cải tiến lớn về khả năng lập luận, xử lý tác vụ phức tạp và hiệu suất doanh nghiệp, đồng thời bổ sung nhiều tính năng quan trọng như ngữ cảnh 1 triệu token và agent teams.
Chia sẻ:
Cỡ chữ nhỏ
Cỡ chữ nhỏ
Cỡ chữ lớn
Nội dung bài viết
Opus 4.6 tăng năng lực vận hành, giữ nguyên chi phí cho doanh nghiệp
Bước tiến rõ rệt cho kịch bản doanh nghiệp
Hiệu năng benchmark cho thấy bước nhảy rõ ràng
Mở rộng tính năng, tăng tính linh hoạt
Agent teams và cách làm việc song song

Opus 4.6 tăng năng lực vận hành, giữ nguyên chi phí cho doanh nghiệp

Opus 4.6 được công bố như một bước tiến lớn so với Opus 4.5 và nhiều đối thủ cùng phân khúc. Theo Anthropic, mô hình mới cải thiện trên gần như toàn bộ các benchmark phổ biến, đồng thời mở rộng mạnh về năng lực vận hành. Điểm đáng chú ý là cửa sổ ngữ cảnh được nâng lên 1 triệu token, khả năng xuất tối đa 128.000 token trong một lần phản hồi và hỗ trợ agent teams trong Claude Code để nhiều tác nhân AI xử lý song song.

Dù nâng cấp đáng kể về kỹ thuật, mức giá vẫn giữ nguyên. Chi phí là 5 USD cho mỗi triệu token đầu vào và 25 USD cho mỗi triệu token đầu ra. Điều này giúp doanh nghiệp tiếp cận các cải tiến mới mà không phải điều chỉnh ngân sách.

Bước tiến rõ rệt cho kịch bản doanh nghiệp

Anthropic đánh giá Opus 4.6 là một thay đổi quan trọng trong cách doanh nghiệp ứng dụng mô hình ngôn ngữ lớn vào quy trình làm việc. Mô hình có thể xử lý tác vụ phức tạp hơn, nhanh hơn và giảm số vòng lặp chỉnh sửa trong quá trình sử dụng thực tế.

Đại diện Anthropic cho biết chất lượng đầu ra của Opus 4.6 ngay từ lần chạy đầu đã tiến rất gần mức sẵn sàng đưa vào sản xuất. Các tài liệu, bảng tính và bản trình bày tạo ra bởi mô hình cần ít chỉnh sửa hơn so với các thế hệ trước.

Claude tích hợp trong Excel cũng được nâng cấp đáng kể. Mô hình có thể xử lý các tác vụ dài, nhiều bước và phức tạp chỉ trong một lần chạy. Đây là cải tiến quan trọng với các nhóm phân tích, tài chính và vận hành dữ liệu, nơi yêu cầu cao về độ chính xác và hiệu suất.

anthropic-ra-mat-opus-46-claude-mo-rong-context-1-trieu-token-200800-1.png

Hiệu năng benchmark cho thấy bước nhảy rõ ràng

Opus 4.6 tiếp tục duy trì thế mạnh truyền thống của Anthropic trên các benchmark về lập trình. Một vài bài kiểm tra như SWE-bench verified và MCP Atlas ghi nhận mức giảm nhẹ, nhưng đây là ngoại lệ hiếm. Ở các benchmark về lập trình dạng tác nhân trong terminal và sử dụng công cụ, mô hình lại đạt kết quả rất cao.

Trên Terminal Bench 2.0, Opus 4.6 đạt 65,4%, tăng từ 59,8% của Opus 4.5. Trên OSWorld, điểm số tăng từ 66,3% lên 72,7%. Kết quả này giúp Opus 4.6 vượt GPT-5.2 và Gemini 3 Pro. Anthropic cho biết mô hình mới đặc biệt hiệu quả trong việc phát hiện và chẩn đoán các lỗi phức tạp.

anthropic-ra-mat-opus-46-claude-mo-rong-context-1-trieu-token-200800-2.jpg

Điểm nổi bật nhất nằm ở ARC AGI 2. Opus 4.6 đạt 68,8%, trong khi Opus 4.5 chỉ đạt 37,6%. Gemini 3 Pro đạt 45,1% và GPT-5.2 đạt 54,2%. ARC AGI 2 tập trung vào các bài toán con người thấy đơn giản nhưng AI thường gặp khó. Kết quả này cho thấy sự cải thiện rõ rệt về năng lực suy luận tổng quát.

Anthropic cũng nhấn mạnh rằng benchmark không phản ánh toàn bộ thực tế sử dụng. Trong quá trình triển khai nội bộ, Opus 4.6 xử lý được nhiều tác vụ khó hơn, kể cả khi không có chỉ dẫn chi tiết, đồng thời cho kết quả nhanh và ổn định hơn.

Về an toàn, Opus 4.6 duy trì mức độ tương đương Opus 4.5 đối với các rủi ro như lừa dối, xu nịnh hoặc khuyến khích ảo tưởng. Việc tăng hiệu năng không đi kèm gia tăng sai lệch hành vi.

anthropic-ra-mat-opus-46-claude-mo-rong-context-1-trieu-token-200800-3.png

Mở rộng tính năng, tăng tính linh hoạt

Opus 4.6 là mô hình đầu tiên trong dòng Opus sở hữu cửa sổ ngữ cảnh 1 triệu token. Điều này cho phép xử lý tài liệu rất lớn hoặc hội thoại kéo dài mà không cần chia nhỏ ngữ cảnh.

Mô hình cũng lần đầu áp dụng adaptive thinking. Cơ chế này cho phép AI tự điều chỉnh mức độ nỗ lực dựa trên ngữ cảnh của prompt. Nhà phát triển vẫn có thể kiểm soát thông qua tham số effort để cân bằng giữa chất lượng, tốc độ suy luận và chi phí. So với cách bật hoặc tắt extended thinking trước đây, phương pháp mới linh hoạt hơn nhiều.

Với người dùng API, Claude hỗ trợ compaction để tóm tắt ngữ cảnh. Nhờ đó, các tác vụ dài có thể tiếp tục mà không chạm giới hạn ngữ cảnh. Đây là điểm cộng lớn cho các ứng dụng cần tương tác liên tục hoặc xử lý dữ liệu theo thời gian dài.

Anthropic cũng bổ sung tùy chọn chạy workload chỉ trong lãnh thổ Hoa Kỳ. Tùy chọn này đi kèm mức phí cao hơn 10%, phục vụ các yêu cầu đặc thù về chủ quyền dữ liệu.

Agent teams và cách làm việc song song

Agent teams là tính năng đáng chú ý nhất với giới phát triển. Trước đây, Claude Code mặc định chỉ chạy một agent tại một thời điểm. Với Opus 4.6, công việc có thể được chia cho nhiều agent, để chúng xử lý song song và tự phối hợp.

Anthropic cho biết agent teams đặc biệt hiệu quả với các tác vụ đọc nhiều, như rà soát codebase lớn. Việc nhiều agent cùng phân tích các phần khác nhau giúp rút ngắn thời gian và tăng độ bao quát cho toàn bộ dự án.

Với loạt cải tiến về hiệu năng, khả năng suy luận và kiến trúc vận hành, Opus 4.6 cho thấy tham vọng rõ ràng của Anthropic trong việc đưa AI tiến sát môi trường sản xuất thực tế. Đây không chỉ là bản nâng cấp về điểm số benchmark, mà là bước đi hướng tới các kịch bản doanh nghiệp quy mô lớn.

Hãy theo dõi FPT Shop thường xuyên để cập nhật nhanh các tin tức và xu hướng công nghệ mới. Hiện FPT Shop có nhiều lựa chọn laptopPC cấu hình mạnh, vận hành ổn định, phù hợp cho nhu cầu làm việc cường độ cao và triển khai các công cụ AI cục bộ, giúp bạn nâng cao hiệu quả công việc mỗi ngày.

Xem thêm: Claude 5.0 và kỳ vọng thay đổi cách AI làm việc với code nhờ trí nhớ dài hạn

Nguồn: Thenewstack

Thương hiệu đảm bảo

Thương hiệu đảm bảo

Nhập khẩu, bảo hành chính hãng

Đổi trả dễ dàng

Đổi trả dễ dàng

Theo chính sách đổi trả tại FPT Shop

Giao hàng tận nơi

Giao hàng tận nơi

Trên toàn quốc

Sản phẩm chất lượng

Sản phẩm chất lượng

Đảm bảo tương thích và độ bền cao