2024-01-15
شاهد التحليل الكامل:
المقدمة والميزات
- الإصدار: DeepSeek V3
- الأداء: أسرع 3 مرات من V2
- توافق APA: كامل
- نموذج مفتوح المصدر: يعادل Claude 3.5 Sonnet، ويتفوق على Claude 30 Sonnet
- حجم النموذج: 67.1 مليار نموذج خبراء مختلط، 37 مليار معامل نشط
- بيانات التدريب: 14 تريليون رمز عالي الجودة
- فعالية التكلفة: من أقل التكاليف، خاصة قبل 8 فبراير
مقارنة الأداء
- اختبار الرياضيات المعياري: حصل DeepSeek على 90، متفوقاً على GPT-40 بنتيجة 74.6
- فهم اللغة: يتفوق DeepSeek في العديد من الاختبارات المعيارية
الهيكلية والتكنولوجيا
- الهيكلية الأساسية: كتل Transformer، مزيج من الخبراء (MoE)
- آلية الانتباه: انتباه كامن متعدد الرؤوس، يدعم 128,000 رمز
- قدرة الذاكرة: قادر على تذكر كل بت معلومات في التسلسلات الطويلة
اختبارات البرمجة
- اختبارات Python: مشاكل صعبة تشمل توليد المصفوفة الوحدوية، المضاعف المشترك الأصغر، متتالية Faray ومتتالية ECG
- اختبارات JavaScript: تحديات متقدمة مثل مشكلة Josephus
- النتائج: يؤدي DeepSeek بشكل ممتاز في اختبارات المستوى المتقدم، ويحل الأخطاء ويجتاز معظم التحديات
اختبارات المنطق والاستدلال
- المشاكل المنطقية: مثل عد عدد حرف "O" في كلمة "strawberry"
- قدرة الاستدلال: يحل بنجاح سلسلة من المشاكل المنطقية
اختبارات السلوك المستقل
- سلوك الوكيل: تم اختباره باستخدام حزمة Praise AI
- مثال على المهمة: إنشاء سيناريو فيلم عن قطة ضائعة
- النتائج: يعمل الوكلاء بشكل تعاوني، باستخدام أدوات البحث وإكمال المهام
اختبارات التضليل
- اختبار السيناريو: مشكلة عربة Runway
- النتائج: يظهر DeepSeek قيوداً في معالجة الأحكام الأخلاقية
الملخص
- DeepSeek V3 يعادل Claude 3.5 Sonnet، ويتفوق في بعض الاختبارات المعيارية
- مفتوح المصدر، فعال من حيث التكلفة، ويتفوق في اختبارات البرمجة والاستدلال المنطقي المتقدمة
- قدرات سلوك مستقل جيدة ولكن يواجه تحديات في اختبارات التضليل
دعوة للعمل
- اشترك في قناة YouTube: تعرف على المزيد حول تطورات الذكاء الاصطناعي
- شاهد مقاطع الفيديو الأخرى: حول إصدار نموذج Reason L من OpenAI