DeepSeek يقود الخوارزمية الابتكارية ويبدأ نموذج جديد لتطوير الذكاء الاصطناعي

DeepSeek تقود نموذجًا جديدًا للذكاء الاصطناعي: من قوة الحوسبة إلى革新 الخوارزمية

مؤخراً، أصدرت DeepSeek التحديث الأخير للإصدار V3 على منصة Hugging Face - DeepSeek-V3-0324. يتمتع هذا النموذج الذي يحتوي على 6850 مليار معلمة بتحسينات ملحوظة في القدرة على البرمجة، وتصميم واجهة المستخدم، وقدرة الاستدلال.

في مؤتمر GTC 2025 الذي انتهى للتو، أعطى الرئيس التنفيذي لشركة إنفيديا، جين هوانغ، تقييمًا عاليًا لـ DeepSeek. وأكد أن الرؤية السابقة للسوق بأن النموذج الفعال لـ DeepSeek سيقلل من الطلب على الشرائح كانت خاطئة، وأن الطلب على الحوسبة في المستقبل سيكون أكبر، وليس أقل.

تعد DeepSeek كمنتج تمثيلي لابتكارات الخوارزمية، وقد أثار ارتباطها بإمدادات الرقائق تفكير الناس حول دور قوة الحوسبة والخوارزمية في تطوير الصناعة.

من قوة الحوسبة المنافسة إلى革新 الخوارزمية: DeepSeek تقود نموذج AI الجديد

قوة الحوسبة والخوارزمية المتعايشة

في مجال الذكاء الاصطناعي، فإن提升 قوة الحوسبة يوفر قاعدة تشغيل للخوارزميات الأكثر تعقيدًا، مما يسمح للنماذج بمعالجة كميات أكبر من البيانات، وتعلم أنماط أكثر تعقيدًا؛ بينما يمكن لتحسين الخوارزمية استخدام قوة الحوسبة بشكل أكثر كفاءة، وزيادة كفاءة استخدام الموارد الحاسوبية.

قوة الحوسبة والخوارزمية تعملان معًا لإعادة تشكيل مشهد صناعة الذكاء الاصطناعي:

  • تباين المسارات التقنية: تسعى بعض الشركات لبناء مجموعات حوسبة ضخمة، بينما تركز شركات أخرى على تحسين كفاءة الخوارزمية، مما يؤدي إلى تشكيل تيارات تقنية مختلفة.
  • إعادة هيكلة سلسلة الصناعة: أصبحت شركات تصنيع الرقائق هي المسيطرة على قوة الحوسبة AI من خلال النظام البيئي، بينما تقلل شركات خدمات السحابة من عتبة النشر من خلال خدمات الحوسبة المرنة.
  • تعديل تخصيص الموارد: تسعى الشركات لتحقيق التوازن بين استثمار البنية التحتية للأجهزة وتطوير الخوارزميات الفعالة.
  • ظهور المجتمع مفتوح المصدر: نماذج مفتوحة المصدر تجعل الابتكارات في الخوارزمية ونتائج قوة الحوسبة قابلة للمشاركة، مما يسرع من عملية التكرار والتوسع التكنولوجي.

الابتكار التكنولوجي في DeepSeek

نجاح DeepSeek مرتبط ارتباطًا وثيقًا بالابتكار التكنولوجي الخاص به. فيما يلي شرح مبسط لنقاط الابتكار الرئيسية فيه:

تحسين هيكل النموذج

تعتمد DeepSeek على الهيكل المركب Transformer + MOE (خليط من الخبراء)، وقد قدمت آلية الانتباه الكامنة متعددة الرأس (MLA). يشبه هذا الهيكل فريقًا خارقًا، حيث يتولى Transformer معالجة المهام العادية، بينما يعمل MOE كفريق من الخبراء، حيث يمتلك كل خبير مجاله الخاص من التخصصات، وعندما يواجهون مشكلة معينة، يتولى الخبير الأكثر كفاءة التعامل معها، مما يمكن أن يزيد بشكل كبير من كفاءة النموذج ودقته. تتيح آلية MLA للنموذج التركيز بشكل أكثر مرونة على التفاصيل المهمة المختلفة أثناء معالجة المعلومات، مما يعزز أداء النموذج بشكل أكبر.

طرق التدريب مبتكرة

قدمت DeepSeek إطار عمل لتدريب دقة مختلطة FP8. يعمل هذا الإطار كمنظم ذكي للموارد، حيث يمكنه اختيار دقة الحساب المناسبة ديناميكيًا وفقًا لاحتياجات مراحل التدريب المختلفة. عندما تكون هناك حاجة لحسابات عالية الدقة، فإنه يستخدم دقة أعلى لضمان دقة النموذج؛ وعندما يمكن قبول دقة أقل، فإنه يقلل من الدقة لتوفير موارد الحوسبة، وزيادة سرعة التدريب، وتقليل استهلاك الذاكرة.

تحسين كفاءة الاستدلال

في مرحلة الاستدلال، قدمت DeepSeek تقنية التنبؤ بعدة رموز (Multi-token Prediction, MTP). الطريقة التقليدية للاستدلال تتم خطوة بخطوة، حيث يتم التنبؤ برمز واحد فقط في كل خطوة. بينما تقنية MTP قادرة على التنبؤ بعدة رموز دفعة واحدة، مما يزيد من سرعة الاستدلال بشكل كبير، ويقلل من تكلفة الاستدلال.

###突破 الخوارزمية التعلم المعزز

حسّنت الخوارزمية الجديدة للتعلّم المعزز GRPO (تحسين مكافأة العقوبة العامة) من DeepSeek عملية تدريب النموذج. يبدو أن التعلّم المعزز يزوّد النموذج بمدرّب، يقوم المدرّب بتوجيه النموذج لتعلّم سلوك أفضل من خلال المكافآت والعقوبات. قد تستهلك الخوارزميات التقليدية للتعلّم المعزز خلال هذه العملية الكثير من قوة الحوسبة، بينما تكون الخوارزمية الجديدة من DeepSeek أكثر كفاءة، حيث تستطيع تقليل الحسابات غير الضرورية مع ضمان تحسين أداء النموذج، وبالتالي تحقيق التوازن بين الأداء والتكلفة.

هذه الابتكارات ليست نقاط تقنية معزولة، بل تشكل نظامًا تقنيًا متكاملًا، حيث تقلل من متطلبات قوة الحوسبة عبر سلسلة كاملة من التدريب إلى الاستدلال. يمكن الآن لبطاقات الرسوميات العادية من فئة المستهلك تشغيل نماذج الذكاء الاصطناعي القوية، مما يقلل بشكل كبير من عتبة تطبيقات الذكاء الاصطناعي، ويمكّن المزيد من المطورين والشركات من المشاركة في الابتكار في مجال الذكاء الاصطناعي.

تأثير على شركات تصنيع الشريحة

يعتقد الكثير من الناس أن DeepSeek قد تجاوزت طبقة البرنامج من مصنعي وحدات معالجة الرسوميات، وبالتالي تخلصت من الاعتماد عليها. في الواقع، تقوم DeepSeek بتحسين الخوارزمية مباشرةً من خلال طبقة PTX (تنفيذ خيوط متوازية) لمصنعي وحدات معالجة الرسوميات. PTX هي لغة تمثيل وسيط تقع بين كود GPU عالي المستوى وتعليمات GPU الفعلية، ومن خلال التلاعب بهذه الطبقة، تستطيع DeepSeek تحقيق تحسينات دقيقة في الأداء.

إن تأثير ذلك على مصنّعي الرقائق هو تأثير مزدوج، من ناحية، فإن DeepSeek في الواقع مرتبط بشكل أعمق مع الأجهزة والبيئة، وانخفاض عتبة تطبيقات الذكاء الاصطناعي قد يؤدي إلى توسيع حجم السوق بشكل عام؛ من ناحية أخرى، قد تؤدي تحسينات الخوارزمية لـ DeepSeek إلى تغيير هيكل الطلب في السوق على الرقائق عالية الأداء، حيث أن بعض نماذج الذكاء الاصطناعي التي كانت تتطلب في الأصل وحدات معالجة رسومات عالية الأداء، يمكن الآن أن تعمل بكفاءة على بطاقات الرسوميات المتوسطة أو حتى الاستهلاكية.

أهمية صناعة الذكاء الاصطناعي في الصين

تحسين الخوارزمية لـ DeepSeek يوفر مسارًا تقنيًا للصناعة الصينية للذكاء الاصطناعي. في ظل القيود المفروضة على الشرائح عالية الجودة، فإن فكرة "البرمجيات تعوض عن الأجهزة" تقلل من الاعتماد على الشرائح المستوردة المتطورة.

في upstream، تقلل الخوارزمية الفعالة من ضغط طلب قوة الحوسبة، مما يمكّن مقدمي خدمات قوة الحوسبة من تحسين البرمجيات لتمديد دورة استخدام الأجهزة، وزيادة العائد على الاستثمار. في downstream، تقلل النماذج المفتوحة المصدر المحسّنة من عوائق تطوير تطبيقات الذكاء الاصطناعي. العديد من الشركات الصغيرة والمتوسطة لا تحتاج إلى موارد قوة حوسبة كبيرة، بل يمكنها تطوير تطبيقات تنافسية بناءً على نموذج DeepSeek، مما سيؤدي إلى ظهور المزيد من حلول الذكاء الاصطناعي في المجالات العمودية.

التأثير العميق لـ Web3 + AI

بنية تحتية للذكاء الاصطناعي اللامركزي

تقدم تحسينات الخوارزمية في DeepSeek دفعة جديدة لبنية Web3 التحتية للذكاء الاصطناعي، حيث تجعل الهيكلية المبتكرة، والخوارزمية الفعالة، واحتياجات قوة الحوسبة المنخفضة من الاستدلال الذكي الموزع ممكنًا. هيكلية MoE مناسبة بطبيعتها للنشر الموزع، حيث يمكن للنقاط المختلفة أن تمتلك شبكات خبراء مختلفة، دون الحاجة إلى تخزين نموذج كامل في نقطة واحدة، مما يقلل بشكل كبير من متطلبات التخزين والحوسبة في النقطة الواحدة، وبالتالي يعزز من مرونة وكفاءة النموذج.

إطار تدريب FP8 يقلل من متطلبات الموارد الحوسبية المتطورة، مما يسمح بمزيد من الموارد الحوسبية بالانضمام إلى شبكة العقد. هذا لا يقلل فقط من عتبة المشاركة في الحوسبة الذكية اللامركزية، بل يعزز أيضًا قدرة وكفاءة الحوسبة في الشبكة بأكملها.

نظام متعدد الوكلاء

  • تحسين استراتيجيات التداول الذكية: من خلال تحليل بيانات السوق في الوقت الفعلي بواسطة وكيل تحليل البيانات، ووكيل توقع تقلبات الأسعار على المدى القصير، ووكيل تنفيذ المعاملات على السلسلة، ووكيل مراقبة نتائج التداول، مما يساعد المستخدمين على تحقيق عوائد أعلى.

  • التنفيذ التلقائي للعقود الذكية: تعمل وكلاء مراقبة العقود الذكية، ووكلاء تنفيذ العقود الذكية، ووكلاء الإشراف على نتائج التنفيذ بشكل متعاون لتحقيق أتمتة منطق الأعمال الأكثر تعقيدًا.

  • إدارة محافظ الاستثمار الشخصية: تساعد الذكاء الاصطناعي المستخدمين في البحث عن أفضل فرص الرهن أو توفير السيولة في الوقت الحقيقي استنادًا إلى تفضيلات المخاطر وأهداف الاستثمار والظروف المالية للمستخدم.

DeepSeek تسعى من خلال الابتكار في الخوارزمية إلى تحقيق اختراقات ضمن قيود قوة الحوسبة، مما يفتح مسارات تطوير مميزة لصناعة الذكاء الاصطناعي في الصين. تخفيض عتبة الاستخدام، وتعزيز دمج Web3 مع الذكاء الاصطناعي، وتقليل الاعتماد على شرائح المعالجة المتطورة، وتمكين الابتكار المالي، هذه التأثيرات تعيد تشكيل ملامح الاقتصاد الرقمي. لن يكون تطوير الذكاء الاصطناعي في المستقبل مجرد سباق على قوة الحوسبة، بل ستكون المنافسة في تحسين التعاون بين قوة الحوسبة والخوارزمية. في هذه الحلبة الجديدة، يقوم مبتكرون مثل DeepSeek بإعادة تعريف قواعد اللعبة بحكمة صينية.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • 9
  • مشاركة
تعليق
0/400
ValidatorVikingvip
· منذ 6 س
بروتوكول مختبر في المعركة، قد يكون خوارزمية deepseek واعدة... لكن دعنا نرى تلك المقاييس الزمنية أولاً
شاهد النسخة الأصليةرد0
MoonMathMagicvip
· منذ 15 س
هذه هي الطريقة التي يتم بها اللعب.
شاهد النسخة الأصليةرد0
MetaverseLandlordvip
· منذ 17 س
ارتفع芯片!
شاهد النسخة الأصليةرد0
GateUser-e51e87c7vip
· منذ 17 س
يجب أن ننظر إلى العجوز هوانغ في الاستثمار!
شاهد النسخة الأصليةرد0
GetRichLeekvip
· منذ 17 س
فقط أسألكم من لا يزال لا يصدق ارتفاع سوق الرقائق
شاهد النسخة الأصليةرد0
OldLeekConfessionvip
· منذ 17 س
قوة الحوسبة هذه ليست هي المال؟~
شاهد النسخة الأصليةرد0
ChainComedianvip
· منذ 17 س
انتقل بسرعة إلى ترقية الصناعة!
شاهد النسخة الأصليةرد0
MetaRecktvip
· منذ 17 س
لا تتحدث كثيراً، المهم هو أن يتم دفع المال.
شاهد النسخة الأصليةرد0
SighingCashiervip
· منذ 17 س
لا يزال يرغب في تداول الشرائح. يفكر أكثر من اللازم.
شاهد النسخة الأصليةرد0
عرض المزيد
  • تثبيت