:quality(75)/deepseek_mo_man_nam_2026_voi_kien_truc_ai_moi_197687_2_efa3b72644.jpg)
DeepSeek mở màn năm 2026 với kiến trúc AI mới, tối ưu hiệu quả huấn luyện mô hình
Trọng tâm của nghiên cứu là phương pháp manifold-constrained hyperconnection, gọi tắt là mHC. Thay vì chạy đua nâng hiệu năng, mHC tập trung cải thiện độ ổn định trong quá trình huấn luyện. Đây là điểm yếu phổ biến của nhiều mô hình AI hiện nay, khi chỉ một lỗi nhỏ cũng có thể khiến toàn bộ quá trình huấn luyện phải làm lại từ đầu.

Trên thực tế, việc mô hình gặp sự cố giữa chừng đồng nghĩa với hàng tuần tính toán bị bỏ phí, kéo theo hàng nghìn giờ GPU và lượng điện năng tiêu thụ rất lớn. Cách tiếp cận của DeepSeek hướng đến việc giữ hành vi mô hình ổn định và dễ kiểm soát hơn, ngay cả khi quy mô tham số tiếp tục mở rộng.
Dù không trực tiếp giúp GPU tiêu thụ ít điện hơn, mHC góp phần giảm lãng phí năng lượng bằng cách hạn chế tình trạng huấn luyện thất bại hoặc phải khởi động lại nhiều lần. Điều này đặc biệt quan trọng trong bối cảnh các trung tâm dữ liệu AI đang chịu áp lực lớn về chi phí vận hành và năng lượng.
Bên cạnh đó, độ ổn định cao hơn cũng giúp các doanh nghiệp bớt phụ thuộc vào giải pháp “đắp tài nguyên”, như tăng số lượng GPU, bộ nhớ hay kéo dài thời gian huấn luyện chỉ để đảm bảo mô hình chạy ổn định. Nhờ vậy, tổng mức tiêu thụ tài nguyên và năng lượng cho toàn bộ vòng đời huấn luyện có thể được tối ưu đáng kể.
Nghiên cứu của DeepSeek không hứa hẹn giải quyết ngay lập tức các vấn đề về thiếu hụt phần cứng hay khủng hoảng năng lượng. Tuy nhiên, đây được xem là bước tiến quan trọng theo hướng tối ưu cách sử dụng tài nguyên hiện có. Trong bối cảnh các mô hình ngôn ngữ ngày càng phình to, việc giảm kém hiệu quả có thể trở nên quan trọng không kém việc nâng cao hiệu năng, và đó chính là giá trị mà kiến trúc AI mới này mang lại.

Hãy theo dõi FPT Shop để cập nhật nhanh các tin tức và xu hướng công nghệ mới nhất. Hiện FPT Shop đang có nhiều ưu đãi cho laptop, máy tính bảng, tai nghe và các thiết bị hỗ trợ học tập, làm việc, giải trí. Bạn có thể ghé hệ thống cửa hàng hoặc xem chi tiết trên website để chọn sản phẩm phù hợp nhất cho nhu cầu của mình.
Xem thêm: Khi người dùng đề cao quyền riêng tư, Lotus Chat thể hiện ra sao?
Nguồn: Gizmochina
:quality(75)/estore-v2/img/fptshop-logo.png)