الوصف
🖼️ اسم الأداة:
ساحة الدردشة الآلية
🔖 فئة الأداة:
منصة قياس وتقييم نماذج الذكاء الاصطناعي؛ وهي تندرج تحت فئة الذكاء الاصطناعي التوليدي وإنشاء الوسائط والعلوم والأبحاث.
✏️ ماذا تقدم هذه الأداة؟
منصة Chatbot Arena هي منصة تقييم مفتوحة ومفتوحة تعتمد على التعهيد الجماعي حيث يمكن للمستخدمين مقارنة الاستجابات من نماذج لغوية كبيرة مختلفة (LLMs) دون معرفة النموذج الذي أنتج أي مخرجات. تم تطويرها من قبل منظمة LMSYS (منظمة أنظمة النماذج الكبيرة)، وهي تتيح إجراء مقارنات مباشرة من خلال اختبارات عمياء لقياس أداء روبوتات الدردشة الآلية للذكاء الاصطناعي.
⭐ ما الذي تقدمه الأداة بالفعل بناءً على تجربة المستخدم؟
- المقارنة العمياء بين استجابتين من روبوتات الدردشة الآلية للذكاء الاصطناعي
- يصوّت المستخدمون لصالح الاستجابة الأفضل دون معرفة النموذج
- لوحة المتصدرين المجمّعة التي تصنّف أفضل روبوتات الدردشة الآلية (مثل GPT-4، كلود، ميسترال، جيميني، إلخ)
- تقييم شفاف يعتمد على المجتمع
- أمثلة محادثة حقيقية وتاريخ التقييم
- يتم تحديثها بانتظام بنماذج وإصدارات جديدة
🤖 هل يتضمن الأتمتة؟
نعم - نعم -
- الاقتران العشوائي لاستجابات النماذج
- إخفاء هوية الردود تلقائيًا (إخفاء أسماء النماذج)
- تحديثات فورية للوحة الصدارة مع تراكم الأصوات
- تسجيل الاستجابات وتقييم مقاييس الأداء
💰 نموذج التسعير:
مجاني
🆓 تفاصيل الخطة المجانية:
- وصول مجاني ومفتوح بنسبة 100%
- مقارنات وتصويت غير محدود
- الوصول إلى لوحة المتصدرين الكاملة وسجلات النماذج
💳 تفاصيل الخطة المدفوعة:
- لا يوجد (أكاديمية وموجهة نحو البحث، مدعومة من قبل LMSYS)
🧭 طريقة الوصول:
- تطبيق الويب
🔗 رابط التجربة:
