تم اختيار ورقة البحث المتعلقة بنموذج لغة الصوت Qwen2-Audio المفتوح المصدر لتوليف الصوت والنص الخاص بها ضمن مؤتمر ACL الرفيع المستوى لعام 2024.

GoldenOctober2024

2024-08-13 03:22:49

أخبار بوابة جيتيو: في 13 أغسطس، قام فريق تونجي تشونغ الخاص بـ Alibaba بإطلاق نموذج Qwen2-Audio المفتوح المصدر، وهو جزء من عائلة Qwen2 المفتوح المصدر. يتيح Qwen2-Audio القدرة على الإجابة على الأسئلة من خلال الصوت دون الحاجة إلى إدخال النص، حيث يمكنه فهم وتحليل الإشارات الصوتية المدخلة من المستخدم، بما في ذلك الأصوات البشرية والصوت الطبيعي والموسيقى وما إلى ذلك. هذا النموذج تفوق بشكل ملحوظ على أفضل النماذج السابقة في العديد من التقييمات الرسمية. كما قام فريق التونجي تشونغ بإطلاق تقييم جديد لفهم الصوت بالكامل، وهو يتضمن بحثًا مختارًا في مؤتمر ACL2024 الدولي الذي يعقد هذا الأسبوع.

AUDIO0.01%

شاهد النسخة الأصلية

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.