MAI-Voice-1: نموذج صوتي متقدم
أطلقت مايكروسوفت نموذج MAI-Voice-1 لتوليد الصوت بدقة عالية وسرعة فائقة، حيث يمكنه إنتاج دقيقة كاملة من الصوت في أقل من ثانية باستخدام وحدة معالجة رسومية واحدة فقط. هذا النموذج يُستخدم في ميزات مثل Copilot Daily لتقديم ملخصات يومية للأخبار بصوت افتراضي، كما يُستعمل في إنشاء حوارات تشبه البودكاست لشرح المواضيع المختلفة، ما يجعل تجربة المستخدم أكثر تفاعلية وحيوية.
تجربة المستخدم وتخصيص الصوت
يمكن للمستخدمين تجربة MAI-Voice-1 عبر منصة Copilot Labs، حيث يمكن إدخال نصوص واختيار أسلوب ونبرة الصوت بما يتناسب مع الهدف المطلوب. هذه القدرة على التخصيص تتيح للمستخدمين إنتاج محتوى صوتي شخصي ومناسب لمختلف الاستخدامات، من التغطية الإخبارية إلى المحتوى التعليمي والترفيهي، ما يعزز جاذبية المحتوى ويزيد من تفاعل المستمعين.
MAI-1-preview: نموذج لغوي شامل
إلى جانب الصوت، قدمت مايكروسوفت نموذج MAI-1-preview، وهو نموذج لغوي عام تم تدريبه باستخدام حوالي 15,000 وحدة معالجة رسومية من نوع Nvidia H100. يركز هذا النموذج على تقديم إجابات مفيدة وفعّالة للاستفسارات اليومية، مع تحسين تجربة المستخدم بشكل مستمر. مايكروسوفت بدأت اختبار هذا النموذج علنًا على منصة LMArena لقياس أدائه قبل دمجه تدريجيًا في ميزات Copilot المختلفة.
تطوير الذكاء الاصطناعي داخليًا
تُظهر هذه الخطوة التزام مايكروسوفت بتطوير تقنيات الذكاء الاصطناعي داخليًا، مما يقلل من الاعتماد على تقنيات خارجية مثل OpenAI. ومع ذلك، لا تزال الشركة تستخدم تقنيات OpenAI في بعض خدماتها، ما يشير إلى استمرار التعاون بين الشركتين لضمان تقديم أفضل تجربة للمستخدمين مع الاستفادة من قدرات كل طرف.
استكشاف وتجربة النماذج
للمهتمين بتجربة هذه النماذج أو استكشاف كيفية استخدامها في تطبيقات مختلفة، توفر مايكروسوفت منصة Copilot Labs التي تسمح للمستخدمين بالتفاعل مع النماذج الصوتية واللغوية مباشرة. هذه التجربة تمنح المستخدم فرصة لفهم الإمكانيات المتقدمة للنماذج، واختبار قدرتها على تلبية الاحتياجات اليومية أو المهنية بطريقة سلسة وفعّالة.
مايكروسوفت تكشف MAI-Voice-1 لنقل المحتوى الصوتي بدقة وسرعة فائقة.
