OpenAI تكشف عن نماذج صوتية جديدة للتفاعلات الصوتية والترجمة الفورية

الرئيسية|الأخبار التقنية|أخبار الإنترنت|OpenAI تكشف عن نماذج صوتية جديدة للتفاعلات الصوتية والترجمة الفورية

كشفت OpenAI عن ثلاثة نماذج صوتية جديدة تعمل بنحو لحظي، وهي تستهدف المطورين العاملين على تطبيقات المساعدات الصوتية، والترجمة الفورية، وتحويل الكلام إلى نصوص مباشرةً عبر واجهاتها البرمجية API.

وتضم المجموعة الجديدة نماذج GPT-Realtime-2 و GPT-Realtime-Translate و GPT-Realtime-Whisper، وتقول الشركة إنها توفّر تفاعلات صوتية طبيعية بنحو أكبر، مع دعم للترجمة الحية، وتحويل الكلام إلى نصوص بسرعة استجابة عالية.

ويُعد GPT-Realtime-2 أبرز هذه النماذج؛ إذ صُمم لإدارة المحادثات الصوتية المباشرة، مع القدرة على تحليل الطلبات، واستدعاء الأدوات، والتعامل مع التصحيحات، ومتابعة الحوار بصورة طبيعية.

وأضافت OpenAI عدة مزايا جديدة للنموذج، منها إمكانية تقديم عبارات تمهيدية قصيرة مثل “دعني أتحقق من ذلك” قبل تنفيذ المهمة، مع دعم استدعاء عدة أدوات بالتوازي مع إبقاء المستخدم على اطلاع بما يحدث.

وحسّنت الشركة آليات التعامل مع الأخطاء؛ إذ بات النموذج يستجيب بصورة أكثر سلاسة عند وقوع مشكلة بدل التوقف بصمت، فضلًا عن توسيع نافذة السياق من 32 ألف رمز إلى 128 ألف رمز.

وتقول OpenAI إن النموذج الجديد يقدّم فهمًا أفضل للمصطلحات المتخصصة والأسماء العلمية والمفردات الطبية، مع دعم التحكم في نبرة الحديث وفق طبيعة الموقف، كما يتيح للمطورين اختيار مستوى التفكير والاستدلال من عدة مستويات.

ويستهدف نموذج GPT-Realtime-Translate تجارب الترجمة الصوتية المتعددة اللغات ذات الأداء الفوري؛ إذ يدعم ترجمة أكثر من 70 لغة إدخال إلى 13 لغة إخراج. وتؤكد الشركة أن النموذج يحافظ على المعنى مع مواكبة سرعة المتحدث، حتى عند استخدام لهجات محلية أو مصطلحات متخصصة.

وأما GPT-Realtime-Whisper، فهو نموذج مخصص لتحويل الكلام إلى نصوص مباشرة مع زمن استجابة منخفض، ويستطيع تحويل الحديث إلى نصوص في أثناء الكلام، مما يجعله مناسبًا للترجمات الفورية، وتدوين الاجتماعات، والمحاضرات الدراسية، وغيرها.

وأتاحت OpenAI النماذج الثلاثة عبر واجهات Realtime API، مع تسعير يبدأ من 32 دولارًا لكل مليون رمز إدخال صوتي و 64 دولارًا لكل مليون رمز إخراج صوتي لنموذج GPT-Realtime-2، في حين تبلغ تكلفة GPT-Realtime-Translate نحو 0.034 دولار للدقيقة، وتكلفة GPT-Realtime-Whisper نحو 0.017 دولار للدقيقة.

وتشير الشركة إلى أن المطورين يستطيعون تجربة النماذج الجديدة عبر منصة Playground، وأنها ستواصل العمل على تحسين التجربة الصوتية داخل ChatGPT للمستخدمين العاديين.

الوسومOpenAI الذكاء الاصطناعي

نسخ الرابط

تم نسخ الرابط

8 مايو 2026آخر تحديث: 8 مايو 2026 دقيقة واحدة

تابعنا

جوجل تحسّن نتائج البحث بميزة "نصائح الخبراء"

جوجل تحسّن نتائج البحث بميزة "نصائح الخبراء"

xAI تطلق مساعد Grok للسيارات بنظام CarPlay

xAI تطلق مساعد Grok للسيارات بنظام CarPlay

ميتا تطوّر وكيل ذكاء اصطناعي للتسوّق داخل إنستاجرام

8 مايو 2026

AirPods ترى العالم.. آبل تطوّر سماعاتها بكاميرات وذكاء بصري

8 مايو 2026

OpenAI تمنح Codex القدرة على العمل داخل متصفح جوجل كروم

8 مايو 2026

ميتا تعيد تصميم تطبيق إنستاجرام في آيباد بعد انتقادات المستخدمين

8 مايو 2026

xAI تطلق مساعد Grok للسيارات بنظام CarPlay

8 مايو 2026

جوجل تحسّن نتائج البحث بميزة “نصائح الخبراء”

8 مايو 2026

جوجل تكشف عن Fitbit Air.. سوار ذكي بلا شاشة مدعوم بالذكاء الاصطناعي

8 مايو 2026

ChatGPT يستعين بالأصدقاء والعائلة عند رصد أزمات نفسية

8 مايو 2026

تطبيق “Fitbit” يختفي رسميًا.. وجوجل تكشف عن خدمة “Google Health” الصحية

8 مايو 2026

جوجل تنفي تقليد تصميم iOS الجديد في أندرويد

8 مايو 2026