Tin tức từ Jinshi Data ngày 13 tháng 8, mô hình lớn của Alibaba Tiếp tục Mã nguồn mở, gia đình Qwen2 Mã nguồn mở đã thêm mô hình ngôn ngữ âm thanh mới Qwen2-Audio. Qwen2-Audio có thể trả lời bằng giọng nói trực tiếp mà không cần nhập văn bản, hiểu và phân tích tín hiệu âm thanh mà người dùng nhập, bao gồm cả giọng nói, âm thanh tự nhiên, âm nhạc, v.v. Mô hình này đã vượt xa các mô hình tốt nhất trước đó trong nhiều bài đánh giá uy tín. Nhóm Tiếp tục cũng đồng thời giới thiệu một Mã nguồn mở mới về đánh giá mô hình hiểu âm thanh Điểm chuẩn, và bài báo liên quan đã được chọn vào Hội nghị top quốc tế ACL2024 diễn ra trong tuần này.
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
阿里通义Mã nguồn mở音频语言模型Qwen2-Audio,相关论文入选顶会ACL 2024
Tin tức từ Jinshi Data ngày 13 tháng 8, mô hình lớn của Alibaba Tiếp tục Mã nguồn mở, gia đình Qwen2 Mã nguồn mở đã thêm mô hình ngôn ngữ âm thanh mới Qwen2-Audio. Qwen2-Audio có thể trả lời bằng giọng nói trực tiếp mà không cần nhập văn bản, hiểu và phân tích tín hiệu âm thanh mà người dùng nhập, bao gồm cả giọng nói, âm thanh tự nhiên, âm nhạc, v.v. Mô hình này đã vượt xa các mô hình tốt nhất trước đó trong nhiều bài đánh giá uy tín. Nhóm Tiếp tục cũng đồng thời giới thiệu một Mã nguồn mở mới về đánh giá mô hình hiểu âm thanh Điểm chuẩn, và bài báo liên quan đã được chọn vào Hội nghị top quốc tế ACL2024 diễn ra trong tuần này.