DeepSeek V4 ra mắt: Mô hình AI 1,6 nghìn tỷ tham số, giá cạnh tranh, hiệu năng tiệm cận hàng đầu

Hai phiên bản được giới thiệu gồm DeepSeek V4 Flash và DeepSeek V4 Pro, đều áp dụng kiến trúc MoE. Điểm đáng chú ý nằm ở cửa sổ ngữ cảnh lên tới 1 triệu token, cho phép xử lý trực tiếp các kho mã nguồn lớn hoặc tài liệu dung lượng cao trong một lần nhập liệu. Cách tiếp cận này chỉ kích hoạt một phần tham số theo từng tác vụ, giúp giảm chi phí suy luận so với mô hình truyền thống.

Ở quy mô phần cứng, DeepSeek V4 Pro đạt tổng cộng 1,6 nghìn tỷ tham số, trong đó 49 tỷ tham số hoạt động tại mỗi thời điểm. Đây hiện là mô hình open-weight có quy mô lớn nhất, vượt qua Kimi K 2.6 của Moonshot AI và M1 của MiniMax, đồng thời lớn hơn hai lần so với DeepSeek V3.2. Phiên bản V4 Flash nhỏ hơn, sở hữu 284 tỷ tham số, với 13 tỷ tham số hoạt động.

DeepSeek cho biết các cải tiến về kiến trúc giúp V4 đạt hiệu năng và hiệu quả cao hơn thế hệ trước. Trong các bài kiểm tra suy luận, hãng khẳng định mô hình đã gần như thu hẹp khoảng cách với các hệ thống AI hàng đầu, cả ở nhóm mã nguồn mở lẫn mô hình đóng.

Đáng chú ý, biến thể V4 Pro Max được DeepSeek đề cập có khả năng vượt các đối thủ mã nguồn mở trong nhiều bài benchmark suy luận. Theo công bố, mô hình có thể vượt GPT-5.2 và Gemini 3.0 Pro trong một số tác vụ cụ thể. Ở các bài đánh giá lập trình dạng thi đấu, hiệu năng của V4 được nhận định tương đương GPT-5.4.

Tuy vậy, DeepSeek thừa nhận V4 vẫn kém nhẹ trong các bài kiểm tra kiến thức tổng hợp, khi so với GPT-5.4 và Gemini 3.1 Pro. Theo đánh giá nội bộ, khoảng cách phát triển hiện ở mức 3 đến 6 tháng so với các mô hình tiên tiến nhất.

Hiện tại, DeepSeek V4 Flash và V4 Pro chỉ hỗ trợ văn bản. Điều này khác với nhiều mô hình AI đóng đang mở rộng sang đa phương thức như âm thanh, hình ảnh và video. Hướng đi của DeepSeek cho thấy hãng ưu tiên tối ưu năng lực xử lý ngôn ngữ và suy luận trước khi mở rộng sang các định dạng khác.

Một lợi thế rõ rệt của DeepSeek V4 nằm ở chi phí vận hành thấp. Cụ thể, phiên bản V4 Flash có giá 0,14 USD cho mỗi triệu token đầu vào và 0,28 USD cho mỗi triệu token đầu ra. Trong khi đó, V4 Pro được niêm yết ở mức 0,145 USD cho mỗi triệu token đầu vào và 3,48 USD cho mỗi triệu token đầu ra.

Mức giá này thấp hơn đáng kể so với nhiều mô hình cùng phân khúc như GPT-5.4 Nano, Gemini 3.1 Flash, GPT-5.4 Mini hay Claude Haiku 4.5, cũng như các mô hình cao cấp như Gemini 3.1 Pro hay GPT-5.5.

Hãy theo dõi FPT Shop thường xuyên để cập nhật nhanh các tin tức và xu hướng công nghệ mới. Hiện FPT Shop có nhiều lựa chọn laptop và PC cấu hình mạnh, vận hành ổn định, phù hợp cho nhu cầu làm việc cường độ cao và triển khai các công cụ AI cục bộ, giúp bạn nâng cao hiệu quả công việc mỗi ngày.

Xem thêm:

Nguồn: TechCrunch