DeepSeek dẫn dắt mô hình AI mới: Từ cuộc cạnh tranh khả năng tính toán đến đổi mới thuật toán
Gần đây, DeepSeek đã phát hành cập nhật phiên bản V3 mới nhất – DeepSeek-V3-0324 trên nền tảng Hugging Face. Mô hình này với 6850 tỷ tham số đã có những cải tiến đáng kể trong khả năng lập trình, thiết kế giao diện người dùng và khả năng suy luận.
Tại hội nghị GTC 2025 vừa kết thúc, CEO của NVIDIA, Huang Renxun, đã đánh giá cao DeepSeek. Ông nhấn mạnh rằng quan điểm trước đây của thị trường cho rằng mô hình hiệu quả của DeepSeek sẽ giảm nhu cầu về chip là sai lầm, và nhu cầu tính toán trong tương lai chỉ có thể tăng lên, chứ không giảm.
DeepSeek như một sản phẩm đại diện cho sự đột phá trong thuật toán, mối quan hệ giữa nó và nguồn cung chip đã khiến mọi người suy ngẫm về vai trò của khả năng tính toán và thuật toán trong sự phát triển của ngành.
Khả năng tính toán và sự tiến hóa đồng sinh của thuật toán
Trong lĩnh vực AI, khả năng tính toán được cải thiện đã cung cấp nền tảng để chạy các thuật toán phức tạp hơn, giúp mô hình có thể xử lý một lượng dữ liệu lớn hơn, học được các mẫu phức tạp hơn; trong khi đó, việc tối ưu hóa thuật toán có thể sử dụng khả năng tính toán một cách hiệu quả hơn, nâng cao hiệu suất sử dụng tài nguyên tính toán.
Khả năng tính toán và mối quan hệ cộng sinh của thuật toán đang tái cấu trúc bối cảnh ngành AI:
Phân hóa lộ trình công nghệ: Một số công ty theo đuổi việc xây dựng các cụm khả năng tính toán siêu lớn, trong khi những công ty khác tập trung vào tối ưu hóa hiệu suất thuật toán, hình thành các trường phái công nghệ khác nhau.
Tái cấu trúc chuỗi công nghiệp: Các nhà sản xuất chip trở thành người dẫn đầu về khả năng tính toán AI thông qua hệ sinh thái, trong khi các nhà cung cấp dịch vụ đám mây giảm thiểu rào cản triển khai thông qua dịch vụ khả năng tính toán linh hoạt.
Điều chỉnh phân bổ tài nguyên: Doanh nghiệp tìm kiếm sự cân bằng giữa đầu tư cơ sở hạ tầng phần cứng và phát triển thuật toán hiệu quả.
Sự trỗi dậy của cộng đồng mã nguồn mở: Mô hình mã nguồn mở cho phép chia sẻ các thành tựu đổi mới thuật toán và khả năng tính toán, thúc đẩy sự lặp lại và lan tỏa công nghệ.
Đổi mới công nghệ của DeepSeek
Sự thành công của DeepSeek gắn liền với sự đổi mới công nghệ của nó. Dưới đây là giải thích dễ hiểu về những điểm đổi mới chính của nó:
Tối ưu hóa kiến trúc mô hình
DeepSeek áp dụng kiến trúc kết hợp Transformer+MOE (Mixture of Experts) và giới thiệu cơ chế chú ý tiềm ẩn đa đầu (Multi-Head Latent Attension, MLA). Kiến trúc này giống như một đội ngũ siêu hạng, trong đó Transformer chịu trách nhiệm xử lý các nhiệm vụ thông thường, trong khi MOE giống như nhóm chuyên gia trong đội, mỗi chuyên gia có lĩnh vực chuyên môn riêng, khi gặp vấn đề cụ thể, chuyên gia giỏi nhất sẽ xử lý, từ đó có thể nâng cao đáng kể hiệu quả và độ chính xác của mô hình. Cơ chế MLA cho phép mô hình linh hoạt hơn trong việc chú ý đến các chi tiết quan trọng khác nhau khi xử lý thông tin, từ đó nâng cao hiệu suất của mô hình.
Phương pháp huấn luyện đổi mới
DeepSeek đã đề xuất khung đào tạo độ chính xác hỗn hợp FP8. Khung này giống như một bộ phân phối tài nguyên thông minh, có khả năng chọn lựa độ chính xác tính toán phù hợp một cách linh hoạt dựa trên nhu cầu của các giai đoạn khác nhau trong quá trình đào tạo. Khi cần tính toán với độ chính xác cao, nó sẽ sử dụng độ chính xác cao hơn để đảm bảo độ chính xác của mô hình; trong khi khi có thể chấp nhận độ chính xác thấp hơn, nó sẽ giảm độ chính xác để tiết kiệm tài nguyên tính toán, tăng tốc độ đào tạo và giảm chiếm dụng bộ nhớ.
Nâng cao hiệu suất suy luận
Trong giai đoạn suy diễn, DeepSeek đã giới thiệu công nghệ Dự đoán nhiều Token (Multi-token Prediction, MTP). Phương pháp suy diễn truyền thống là từng bước một, mỗi bước chỉ dự đoán một Token. Trong khi đó, công nghệ MTP có khả năng dự đoán nhiều Token cùng một lúc, từ đó tăng tốc độ suy diễn đáng kể và giảm chi phí suy diễn.
Đột phá thuật toán học tăng cường
Thuật toán học tăng cường mới của DeepSeek GRPO (Tối ưu hóa thưởng - phạt tổng quát) tối ưu hóa quy trình đào tạo mô hình. Học tăng cường giống như việc trang bị cho mô hình một huấn luyện viên, người huấn luyện viên hướng dẫn mô hình học các hành vi tốt hơn thông qua thưởng và phạt. Các thuật toán học tăng cường truyền thống trong quá trình này có thể tiêu tốn một lượng lớn khả năng tính toán, trong khi thuật toán mới của DeepSeek thì hiệu quả hơn, nó có thể giảm bớt tính toán không cần thiết mà vẫn đảm bảo cải thiện hiệu suất mô hình, từ đó đạt được sự cân bằng giữa hiệu suất và chi phí.
Những đổi mới này không phải là những điểm kỹ thuật cô lập, mà là hình thành một hệ thống kỹ thuật hoàn chỉnh, giảm nhu cầu về khả năng tính toán từ đào tạo đến suy luận trong toàn bộ chuỗi. Các card đồ họa tiêu dùng thông thường bây giờ cũng có thể chạy các mô hình AI mạnh mẽ, làm giảm đáng kể rào cản ứng dụng AI, cho phép nhiều nhà phát triển và doanh nghiệp tham gia vào đổi mới AI.
Ảnh hưởng đến các nhà sản xuất chip
Nhiều người cho rằng DeepSeek đã bỏ qua lớp phần mềm của nhà sản xuất GPU, từ đó thoát khỏi sự phụ thuộc vào họ. Thực tế, DeepSeek trực tiếp tối ưu hóa thuật toán thông qua lớp PTX (Parallel Thread Execution) của nhà sản xuất GPU. PTX là một ngôn ngữ biểu diễn trung gian nằm giữa mã GPU cấp cao và lệnh GPU thực tế, thông qua việc thao tác ở lớp này, DeepSeek có thể thực hiện tinh chỉnh hiệu suất một cách tinh vi hơn.
Ảnh hưởng đối với các nhà sản xuất chip là hai mặt, một mặt, DeepSeek thực sự đã gắn bó sâu hơn với phần cứng và hệ sinh thái, việc giảm bớt rào cản ứng dụng AI có thể mở rộng quy mô thị trường tổng thể; mặt khác, tối ưu hóa thuật toán của DeepSeek có thể thay đổi cấu trúc cầu đối với chip cao cấp, một số mô hình AI vốn dĩ cần GPU cao cấp để chạy, giờ đây có thể hoạt động hiệu quả trên các card đồ họa tầm trung hoặc thậm chí là card tiêu dùng.
Ý nghĩa đối với ngành AI Trung Quốc
Tối ưu hóa thuật toán của DeepSeek cung cấp con đường đột phá công nghệ cho ngành AI Trung Quốc. Trong bối cảnh bị hạn chế bởi chip cao cấp, tư duy "phần mềm bù đắp phần cứng" đã giảm bớt sự phụ thuộc vào chip nhập khẩu hàng đầu.
Ở phía trên, thuật toán hiệu quả đã giảm áp lực nhu cầu khả năng tính toán, giúp các nhà cung cấp dịch vụ khả năng tính toán có thể mở rộng chu kỳ sử dụng phần cứng thông qua tối ưu hóa phần mềm, từ đó nâng cao tỷ suất lợi nhuận đầu tư. Ở phía dưới, mô hình mã nguồn mở đã được tối ưu hóa làm giảm rào cản phát triển ứng dụng AI. Nhiều doanh nghiệp vừa và nhỏ không cần tài nguyên khả năng tính toán lớn, vẫn có thể phát triển ứng dụng cạnh tranh dựa trên mô hình DeepSeek, điều này sẽ thúc đẩy sự xuất hiện của nhiều giải pháp AI trong các lĩnh vực dọc hơn.
Tác động sâu rộng của Web3+AI
Cơ sở hạ tầng AI phi tập trung
Tối ưu hóa thuật toán của DeepSeek đã mang lại động lực mới cho cơ sở hạ tầng AI Web3, với kiến trúc sáng tạo, thuật toán hiệu quả và nhu cầu khả năng tính toán thấp, điều này làm cho việc suy diễn AI phi tập trung trở nên khả thi. Kiến trúc MoE tự nhiên phù hợp cho việc triển khai phân tán, các nút khác nhau có thể giữ các mạng chuyên gia khác nhau, không cần một nút duy nhất lưu trữ mô hình đầy đủ, điều này đáng kể giảm yêu cầu lưu trữ và tính toán của một nút đơn, từ đó nâng cao tính linh hoạt và hiệu quả của mô hình.
Khung đào tạo FP8 đã giảm thêm nhu cầu về tài nguyên tính toán cao cấp, cho phép nhiều tài nguyên tính toán hơn có thể tham gia vào mạng lưới nút. Điều này không chỉ hạ thấp rào cản tham gia vào tính toán AI phi tập trung mà còn nâng cao khả năng và hiệu suất tính toán của toàn bộ mạng.
Hệ thống đa tác nhân
Tối ưu hóa chiến lược giao dịch thông minh: Thông qua việc phân tích dữ liệu thị trường theo thời gian thực của agent, dự đoán biến động giá ngắn hạn của agent, thực hiện giao dịch trên chuỗi của agent, giám sát kết quả giao dịch của agent, hỗ trợ người dùng đạt được lợi nhuận cao hơn.
Thực thi tự động của hợp đồng thông minh: agent giám sát hợp đồng thông minh, agent thực thi hợp đồng thông minh, agent giám sát kết quả thực thi, v.v. phối hợp hoạt động, thực hiện tự động hóa logic kinh doanh phức tạp hơn.
Quản lý danh mục đầu tư cá nhân hóa: AI giúp người dùng tìm kiếm cơ hội staking hoặc cung cấp thanh khoản tốt nhất theo sở thích rủi ro, mục tiêu đầu tư và tình hình tài chính của người dùng.
DeepSeek chính là việc tìm kiếm đột phá thông qua đổi mới thuật toán dưới sự ràng buộc của khả năng tính toán, mở ra con đường phát triển khác biệt cho ngành AI Trung Quốc. Giảm thiểu rào cản ứng dụng, thúc đẩy sự hội nhập giữa Web3 và AI, giảm bớt sự phụ thuộc vào chip cao cấp, trao quyền cho đổi mới tài chính, những tác động này đang định hình lại cấu trúc nền kinh tế số. Trong tương lai, sự phát triển của AI không còn chỉ là cuộc đua về khả năng tính toán, mà là cuộc đua tối ưu hóa sự phối hợp giữa khả năng tính toán và thuật toán. Trên đường đua mới này, các nhà đổi mới như DeepSeek đang sử dụng trí tuệ Trung Quốc để định nghĩa lại quy tắc trò chơi.
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
18 thích
Phần thưởng
18
9
Chia sẻ
Bình luận
0/400
ValidatorViking
· 6giờ trước
giao thức đã được kiểm tra qua trận chiến, algo của deepseek có thể hứa hẹn... nhưng hãy xem những chỉ số thời gian hoạt động đó trước đã
Xem bản gốcTrả lời0
MoonMathMagic
· 15giờ trước
Cách chơi vẫn như vậy.
Xem bản gốcTrả lời0
MetaverseLandlord
· 17giờ trước
Chip tăng lên!
Xem bản gốcTrả lời0
GateUser-e51e87c7
· 17giờ trước
Đầu tư thì vẫn phải xem ông Hoàng thôi!
Xem bản gốcTrả lời0
GetRichLeek
· 17giờ trước
Chỉ hỏi các bạn ai còn không tin vào tình hình bơm lớn của chip.
Xem bản gốcTrả lời0
OldLeekConfession
· 17giờ trước
Khả năng tính toán này không phải là tiền sao~
Xem bản gốcTrả lời0
ChainComedian
· 17giờ trước
Tiến nhanh vào nâng cấp ngành!
Xem bản gốcTrả lời0
MetaReckt
· 17giờ trước
Đừng nói nữa, chỉ cần tiền được chuyển đầy đủ là được.
DeepSeek dẫn đầu sự đổi mới thuật toán, mở ra một khuôn mẫu phát triển AI mới.
DeepSeek dẫn dắt mô hình AI mới: Từ cuộc cạnh tranh khả năng tính toán đến đổi mới thuật toán
Gần đây, DeepSeek đã phát hành cập nhật phiên bản V3 mới nhất – DeepSeek-V3-0324 trên nền tảng Hugging Face. Mô hình này với 6850 tỷ tham số đã có những cải tiến đáng kể trong khả năng lập trình, thiết kế giao diện người dùng và khả năng suy luận.
Tại hội nghị GTC 2025 vừa kết thúc, CEO của NVIDIA, Huang Renxun, đã đánh giá cao DeepSeek. Ông nhấn mạnh rằng quan điểm trước đây của thị trường cho rằng mô hình hiệu quả của DeepSeek sẽ giảm nhu cầu về chip là sai lầm, và nhu cầu tính toán trong tương lai chỉ có thể tăng lên, chứ không giảm.
DeepSeek như một sản phẩm đại diện cho sự đột phá trong thuật toán, mối quan hệ giữa nó và nguồn cung chip đã khiến mọi người suy ngẫm về vai trò của khả năng tính toán và thuật toán trong sự phát triển của ngành.
Khả năng tính toán và sự tiến hóa đồng sinh của thuật toán
Trong lĩnh vực AI, khả năng tính toán được cải thiện đã cung cấp nền tảng để chạy các thuật toán phức tạp hơn, giúp mô hình có thể xử lý một lượng dữ liệu lớn hơn, học được các mẫu phức tạp hơn; trong khi đó, việc tối ưu hóa thuật toán có thể sử dụng khả năng tính toán một cách hiệu quả hơn, nâng cao hiệu suất sử dụng tài nguyên tính toán.
Khả năng tính toán và mối quan hệ cộng sinh của thuật toán đang tái cấu trúc bối cảnh ngành AI:
Đổi mới công nghệ của DeepSeek
Sự thành công của DeepSeek gắn liền với sự đổi mới công nghệ của nó. Dưới đây là giải thích dễ hiểu về những điểm đổi mới chính của nó:
Tối ưu hóa kiến trúc mô hình
DeepSeek áp dụng kiến trúc kết hợp Transformer+MOE (Mixture of Experts) và giới thiệu cơ chế chú ý tiềm ẩn đa đầu (Multi-Head Latent Attension, MLA). Kiến trúc này giống như một đội ngũ siêu hạng, trong đó Transformer chịu trách nhiệm xử lý các nhiệm vụ thông thường, trong khi MOE giống như nhóm chuyên gia trong đội, mỗi chuyên gia có lĩnh vực chuyên môn riêng, khi gặp vấn đề cụ thể, chuyên gia giỏi nhất sẽ xử lý, từ đó có thể nâng cao đáng kể hiệu quả và độ chính xác của mô hình. Cơ chế MLA cho phép mô hình linh hoạt hơn trong việc chú ý đến các chi tiết quan trọng khác nhau khi xử lý thông tin, từ đó nâng cao hiệu suất của mô hình.
Phương pháp huấn luyện đổi mới
DeepSeek đã đề xuất khung đào tạo độ chính xác hỗn hợp FP8. Khung này giống như một bộ phân phối tài nguyên thông minh, có khả năng chọn lựa độ chính xác tính toán phù hợp một cách linh hoạt dựa trên nhu cầu của các giai đoạn khác nhau trong quá trình đào tạo. Khi cần tính toán với độ chính xác cao, nó sẽ sử dụng độ chính xác cao hơn để đảm bảo độ chính xác của mô hình; trong khi khi có thể chấp nhận độ chính xác thấp hơn, nó sẽ giảm độ chính xác để tiết kiệm tài nguyên tính toán, tăng tốc độ đào tạo và giảm chiếm dụng bộ nhớ.
Nâng cao hiệu suất suy luận
Trong giai đoạn suy diễn, DeepSeek đã giới thiệu công nghệ Dự đoán nhiều Token (Multi-token Prediction, MTP). Phương pháp suy diễn truyền thống là từng bước một, mỗi bước chỉ dự đoán một Token. Trong khi đó, công nghệ MTP có khả năng dự đoán nhiều Token cùng một lúc, từ đó tăng tốc độ suy diễn đáng kể và giảm chi phí suy diễn.
Đột phá thuật toán học tăng cường
Thuật toán học tăng cường mới của DeepSeek GRPO (Tối ưu hóa thưởng - phạt tổng quát) tối ưu hóa quy trình đào tạo mô hình. Học tăng cường giống như việc trang bị cho mô hình một huấn luyện viên, người huấn luyện viên hướng dẫn mô hình học các hành vi tốt hơn thông qua thưởng và phạt. Các thuật toán học tăng cường truyền thống trong quá trình này có thể tiêu tốn một lượng lớn khả năng tính toán, trong khi thuật toán mới của DeepSeek thì hiệu quả hơn, nó có thể giảm bớt tính toán không cần thiết mà vẫn đảm bảo cải thiện hiệu suất mô hình, từ đó đạt được sự cân bằng giữa hiệu suất và chi phí.
Những đổi mới này không phải là những điểm kỹ thuật cô lập, mà là hình thành một hệ thống kỹ thuật hoàn chỉnh, giảm nhu cầu về khả năng tính toán từ đào tạo đến suy luận trong toàn bộ chuỗi. Các card đồ họa tiêu dùng thông thường bây giờ cũng có thể chạy các mô hình AI mạnh mẽ, làm giảm đáng kể rào cản ứng dụng AI, cho phép nhiều nhà phát triển và doanh nghiệp tham gia vào đổi mới AI.
Ảnh hưởng đến các nhà sản xuất chip
Nhiều người cho rằng DeepSeek đã bỏ qua lớp phần mềm của nhà sản xuất GPU, từ đó thoát khỏi sự phụ thuộc vào họ. Thực tế, DeepSeek trực tiếp tối ưu hóa thuật toán thông qua lớp PTX (Parallel Thread Execution) của nhà sản xuất GPU. PTX là một ngôn ngữ biểu diễn trung gian nằm giữa mã GPU cấp cao và lệnh GPU thực tế, thông qua việc thao tác ở lớp này, DeepSeek có thể thực hiện tinh chỉnh hiệu suất một cách tinh vi hơn.
Ảnh hưởng đối với các nhà sản xuất chip là hai mặt, một mặt, DeepSeek thực sự đã gắn bó sâu hơn với phần cứng và hệ sinh thái, việc giảm bớt rào cản ứng dụng AI có thể mở rộng quy mô thị trường tổng thể; mặt khác, tối ưu hóa thuật toán của DeepSeek có thể thay đổi cấu trúc cầu đối với chip cao cấp, một số mô hình AI vốn dĩ cần GPU cao cấp để chạy, giờ đây có thể hoạt động hiệu quả trên các card đồ họa tầm trung hoặc thậm chí là card tiêu dùng.
Ý nghĩa đối với ngành AI Trung Quốc
Tối ưu hóa thuật toán của DeepSeek cung cấp con đường đột phá công nghệ cho ngành AI Trung Quốc. Trong bối cảnh bị hạn chế bởi chip cao cấp, tư duy "phần mềm bù đắp phần cứng" đã giảm bớt sự phụ thuộc vào chip nhập khẩu hàng đầu.
Ở phía trên, thuật toán hiệu quả đã giảm áp lực nhu cầu khả năng tính toán, giúp các nhà cung cấp dịch vụ khả năng tính toán có thể mở rộng chu kỳ sử dụng phần cứng thông qua tối ưu hóa phần mềm, từ đó nâng cao tỷ suất lợi nhuận đầu tư. Ở phía dưới, mô hình mã nguồn mở đã được tối ưu hóa làm giảm rào cản phát triển ứng dụng AI. Nhiều doanh nghiệp vừa và nhỏ không cần tài nguyên khả năng tính toán lớn, vẫn có thể phát triển ứng dụng cạnh tranh dựa trên mô hình DeepSeek, điều này sẽ thúc đẩy sự xuất hiện của nhiều giải pháp AI trong các lĩnh vực dọc hơn.
Tác động sâu rộng của Web3+AI
Cơ sở hạ tầng AI phi tập trung
Tối ưu hóa thuật toán của DeepSeek đã mang lại động lực mới cho cơ sở hạ tầng AI Web3, với kiến trúc sáng tạo, thuật toán hiệu quả và nhu cầu khả năng tính toán thấp, điều này làm cho việc suy diễn AI phi tập trung trở nên khả thi. Kiến trúc MoE tự nhiên phù hợp cho việc triển khai phân tán, các nút khác nhau có thể giữ các mạng chuyên gia khác nhau, không cần một nút duy nhất lưu trữ mô hình đầy đủ, điều này đáng kể giảm yêu cầu lưu trữ và tính toán của một nút đơn, từ đó nâng cao tính linh hoạt và hiệu quả của mô hình.
Khung đào tạo FP8 đã giảm thêm nhu cầu về tài nguyên tính toán cao cấp, cho phép nhiều tài nguyên tính toán hơn có thể tham gia vào mạng lưới nút. Điều này không chỉ hạ thấp rào cản tham gia vào tính toán AI phi tập trung mà còn nâng cao khả năng và hiệu suất tính toán của toàn bộ mạng.
Hệ thống đa tác nhân
Tối ưu hóa chiến lược giao dịch thông minh: Thông qua việc phân tích dữ liệu thị trường theo thời gian thực của agent, dự đoán biến động giá ngắn hạn của agent, thực hiện giao dịch trên chuỗi của agent, giám sát kết quả giao dịch của agent, hỗ trợ người dùng đạt được lợi nhuận cao hơn.
Thực thi tự động của hợp đồng thông minh: agent giám sát hợp đồng thông minh, agent thực thi hợp đồng thông minh, agent giám sát kết quả thực thi, v.v. phối hợp hoạt động, thực hiện tự động hóa logic kinh doanh phức tạp hơn.
Quản lý danh mục đầu tư cá nhân hóa: AI giúp người dùng tìm kiếm cơ hội staking hoặc cung cấp thanh khoản tốt nhất theo sở thích rủi ro, mục tiêu đầu tư và tình hình tài chính của người dùng.
DeepSeek chính là việc tìm kiếm đột phá thông qua đổi mới thuật toán dưới sự ràng buộc của khả năng tính toán, mở ra con đường phát triển khác biệt cho ngành AI Trung Quốc. Giảm thiểu rào cản ứng dụng, thúc đẩy sự hội nhập giữa Web3 và AI, giảm bớt sự phụ thuộc vào chip cao cấp, trao quyền cho đổi mới tài chính, những tác động này đang định hình lại cấu trúc nền kinh tế số. Trong tương lai, sự phát triển của AI không còn chỉ là cuộc đua về khả năng tính toán, mà là cuộc đua tối ưu hóa sự phối hợp giữa khả năng tính toán và thuật toán. Trên đường đua mới này, các nhà đổi mới như DeepSeek đang sử dụng trí tuệ Trung Quốc để định nghĩa lại quy tắc trò chơi.