Tin tức từ bot Gate, MiniMax đã thông báo vào ngày 17 tháng 6 rằng họ sẽ phát hành các cập nhật quan trọng trong năm ngày liên tiếp. Hôm nay là bản đầu tiên với mô hình suy diễn mã nguồn mở đầu tiên MiniMax-M1.
Theo báo cáo chính thức, MiniMax-M1 đã thực hiện nhiều bài kiểm tra chuẩn tương đương với các mô hình mã nguồn mở như DeepSeek-R1, Qwen3, gần với các mô hình tiên tiến nhất ở nước ngoài.
Blog chính thức cũng đề cập, dựa trên hai đổi mới công nghệ lớn, quá trình đào tạo MiniMax-M1 hiệu quả đến mức "vượt quá mong đợi", chỉ mất 3 tuần và 512 khối GPU H800 đã hoàn thành giai đoạn đào tạo học tăng cường, chi phí thuê tính toán chỉ 53,47 triệu USD. Điều này thấp hơn một bậc so với mong đợi ban đầu.
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
Mô hình suy diễn đầu tiên Mã nguồn mở MiniMax: Đối thủ cạnh tranh với DeepSeek, Khả năng tính toán chi phí chỉ khoảng 53 triệu đô la.
Tin tức từ bot Gate, MiniMax đã thông báo vào ngày 17 tháng 6 rằng họ sẽ phát hành các cập nhật quan trọng trong năm ngày liên tiếp. Hôm nay là bản đầu tiên với mô hình suy diễn mã nguồn mở đầu tiên MiniMax-M1.
Theo báo cáo chính thức, MiniMax-M1 đã thực hiện nhiều bài kiểm tra chuẩn tương đương với các mô hình mã nguồn mở như DeepSeek-R1, Qwen3, gần với các mô hình tiên tiến nhất ở nước ngoài.
Blog chính thức cũng đề cập, dựa trên hai đổi mới công nghệ lớn, quá trình đào tạo MiniMax-M1 hiệu quả đến mức "vượt quá mong đợi", chỉ mất 3 tuần và 512 khối GPU H800 đã hoàn thành giai đoạn đào tạo học tăng cường, chi phí thuê tính toán chỉ 53,47 triệu USD. Điều này thấp hơn một bậc so với mong đợi ban đầu.
Nguồn tin: Jin Shi