برامج دقيقة تتحكم بالكومبيوتر.. بأوامر صوتية

تتميز بسرعة الأداء وتستطيع التمييز بين اللهجات

برامج التعرف على الاصوات تؤهل المعاقين للتعامل مع الكومببيوتر (كي آر تي)
TT

يعد توجيه الأوامر الصوتية للحاسبات أحد أهم الخيالات الجامحة للتكنولوجيا المتقدمة التي تطالعنا بها أفلام الخيال العلمي بين الفينة والأخرى كي تبهر بها عشاقها، ومنذ عرض فيلم «ستار ترك»، ونحن نحلم بأن نتمكن من القول «أيها الكومبيوتر، اعرض كل المصادر المعروفة عن البلورات في كراكسون نيبولا».

لكن حتى الآن، فإن أكثر ما تمكنا من الحصول عليه هو برنامج الإملاء باستخدام برنامج مثل «دراغون ناتشورالي سبيكنغ» Dragon Naturally Speaking للقيام بكل أمور الطباعة. وهو برنامج جديد يصلح لمن لا يرغبون في الكتابة، ويسمح بنطق أسماء أوامر القائمة وضغط الروابط على شبكة الإنترنت.

لكن ذلك لن يكون مثل إخبار الكومبيوتر بما بما يجب عليه القيام به إذا ما استخدمت لغة مثيرة للجدل. فحقيقة الأمر أن «ناتشورالي سبيكنغ 10» لا يزال يخطو خطواته الأولى في الاتجاه الصحيح، فلا تظن أنه سيحول جهازك إلى واحد من أولئك الذين شاهدتهم في «ستار ترك»، إذ انه لا يعرف ببساطة ما تعنيه بعبارة «اجعل هذا النص أصغر حجما وأفضل لغة». لكنه بطريقته المحافظة والخانعة يتلقى الأوامر الصوتية دونما خطأ، أشبه ما يكون بأوامر مقدسة. وعلى الرغم من أن المهمة الأساسية للبرنامج هي الكتابة وفق أي برنامج ويندوز مهما كان ما تقوله، فإن شركة «نويانس» Nuance المنتجة للبرنامج تزعم أنه حقق نسبة تقدم في مستوى الدقة بلغت 20 في المائة أكثر مما كانت عليه من قبل.

* اختبار البرنامج

* ولقد جهزت كومبيوتري بالبرنامج ووضعت سماعة الرأس وضغطت «ابدأ التدريب الأول»، (يتوجب عليك في الأيام الأولى للتعرف على الصوت قراءة نص للتدريب على البرنامج مدته 45 دقيقة ليتعرف على صوتك)، أما الآن فقد تطور البرنامج إلى حد بعيد وأصبح بإمكانك التخلي عن مرحلة التدريب كليةً.

وفي اختبار سريع قرأت 1000 كلمة بداية من كلمة «فريكونوميكس» «Freakonomics» إلى ويندوز. المثير للدهشة أن البرنامج استطاع كتابة كلمات مثل «كوكلوكس كلان» و«حرب قرطاجة»، لكنه أخطأ في كتابة سبع كلمات بسيطة فكتب على سبيل المثال كلمة «سورة» بدلاً من كلمة «صورة»، لكن نسبة الدقة التي تبلغ 99.3 في المائة من دون تدريب ليست بالأمر السيئ.

ثم بعد ذلك شرعت في اختبار آخر، حيث بدأت في قراءة أحد نصوص التدريب ومدته خمس دقائق (الذي كان يحتوي على إحدى خطب جون كيندي)، التي يوصي بها من أجل مزيد من الدقة. فقرأت مرة أخرى أول 1000 كلمة من «فريكونوميكس»، لكن البرنامج أخطأ هذه المرة في كتابة خمس كلمات. وبلغت نسبة الدقة هذه المرة 95.5 في المائة. وعندما تصحح الأخطاء صوتيا يقوم البرنامج بالتعلم، وسواء تجاوزت التدريب الأول أم لا، فإن الدقة تسير نحو الكمال بمرور الوقت.

ولقد ساعدت معرفة «نويانس»، بأن الأشخاص لا يتحدثون بصورة واحدة، على الارتقاء بالدقة، فالنسخة رقم 10 من البرنامج تستطيع التمييز بين ثماني لهجات: العامية، الاسترالية، البريطانية، الهندية، البحيرات العظمى (بوفالو إلى شيكاغو)، جنوب شرق آسيا، شرق الولايات المتحدة، والاسبانية، وإذا لم تحدد فإن البرنامج سيتعرف عليك تلقائيا. أوليس ذلك أمر سيئ؟ هل يتوجب على البرنامج أن يعاملك بصورة مختلفة بالاعتماد على الطريقة التي تتحدث بها؟.

* سرعة الأداء

* تعد السرعة احدى مميزات النسخة العاشرة، فالبرنامج في الماضي كان يتطلب توقفا في حديثك قبل الكتابة حتى يتمكن من استخدام السياق للاختيار، على سبيل المثال، بين الألفاظ المتجانسة، لكن تلك المدة انخفضت مع الجيل الجديد من البرنامج إلى النصف، حيث يظهر النص فور التوقف عن الحديث.

ثانيا، بدأ البرنامج في فهم أوامر اللغة الطبيعية. فعلى سبيل المثال، ففي النسخة القديمة من البرنامج كان وضع خط تحت كلمة كتبتها مثل «أسعار الغاز»، تستخدم لطلب ثلاثة أوامر مختلفة، أولا «اختر أسعار الغاز» ثم «ضع خطا تحت ذلك» وأخيرا «حرك اختيارك خطوة إلى الوراء»، حيث توقفت «اذهب إلى نهاية الوثيقة». لكن النسخة العاشرة من البرنامج تفي بالغرض، فعند وضع خط تحت «أسعار الغاز» يقوم البرنامج بالتغييرات الضرورية ويعود إلى حيث توقفت، إذ يتم كل ذلك في خلال لحظات. نفس الأمر يتم مع أفعال مثل «اكتب بخط سميك، ضع خطا، احذف، قص، وانسخ».

إضافة إلى ذلك تطور البرنامج وبإمكانه تلقي أوامر بحث بداية من ابحث داخل الكومبيوتر عن «...»، ابحث في الشبكة عن «...»، ابحث في البريد الإلكتروني عن «...»، وهكذا.

وعلى سبيل المثال إذا قلت ابحث في الخرائط عن مطاعم صينية، أو ابحث في الويكيبيديا عن «خليج الخنازير»، أو ابحث في الصور عن «جوانيث باليترو»، فإن تلك الاختصارات يمكن الاعتماد عليها 100% وتوفر الجهد والطباعة التي ستقوم بها.

قد تبرز بعض الأسئلة بشأن البرنامج الجديد هل يمكنه العمل على أجهزة ماكنتوش؟، نعم يمكنه ذلك، لكن إذا ما كانت تلك الأجهزة تستخدم برنامج ويندوز واستعملت سماعات رأس «يو إس بي». وربما كان من الأبسط شراء «ماك سبيتش دكتات»، وهو برنامج يستخدم تقنية «دراغون» للتعرف على الأصوات، والنسخة الحالية سريعة ودقيقة، لكنها لا ترقى إلى مستوى «نات سبيك» في السمات والقوة. إذ إنها لا تمكنك من التصحيح اللغوي بالصوت، وبالتالي فإنها تفتقر إلى الدقة، والنسخة 1.2 التي تمكّن من التصحيح عبر الصوت في طور الاختبار الآن.

* برامج صوتية

* وهناك أسئلة أخرى:

ـ هل يمكن للبرنامج أن يكتب مقابلة مسجلة؟، الإجابة: لا، فالبرنامج مصمم لتمييز صوت شخص واحد فقط، هو صوت مستخدمه.

ـ وأيضا: هل يمكنه أيضا الكتابة باستخدام مكالمة سماعة البلوتوث اللاسلكية؟، نعم يمكنه ذلك، والنماذج التي تمت تجربتها تؤكد ذلك.

ـ هل يمكن أن أسجل نصا ثم ينقله البرنامج بعد ذلك؟، نعم يمكن ذلك، فالبرنامج مصمم لذلك، بالرغم من أن بعض التسجيلات فقط تكون متناسقة من ثم يتطلب الأمر تسجيل 15 دقيقة كنوع من التدريب.

ـ وهل يمتلك ويندوز فيستا خاصية التعرف على الصوت؟، نعم هو جيد في تلك الناحية ويشبه إلى حد ما «نات سبيك»، لكن «نيوانس» تقول إن «فيستا» لم يؤثر في مبيعات برنامجها «نات سبيك». اعتقد أن الغموض جزء من السبب، فغالبية الناس لا يدركون أن برنامج فيستا يقدم نفس السمات، لكنه لا يتوافق مع السماعات المطلوبة أيضا، كذلك لا يقدم البرنامج ذات الدقة أو السمات أو القوة التي يوفرها «نات سبيك»، كما أنه غير متوفر بلغات أخرى كالفرنسية والإيطالية والألمانية والإسبانية والهولندية وهكذا.

و«نات سبيك» متاح في عدد من الأجيال، لكن النسخة المعيارية التي تبلغ قيمتها 100 دولار لها نفس الدقة كالأخريات، لكن لكي تحصل على النسخة المتقدمة التي جاءت في هذا المقال ـ التي تتلقى أوامر صوتية أو تسجل من أجهزة التسجيل أو سماعات البلوتوث ـ فأنت بحاجة إلى النسخة المفضلة التي يبلغ سعرها 200 دولار، كما توجد نسخ طبية وقانونية (1.600 دولار و1.200 دولار)، كما أن هناك نسخة احترافية (900 دولار) للمديرين الذين يرغبون في استخدام العديد من تطبيقات «نات سبيك» من المشغل الرئيسي. والنسخة المتقدمة تتعامل مع أوامر اللغة الطبيعية لـ«مايكروسوفت أوتلوك» مثل «أرسل بريدا إلكترونيا» أو «حدد لي موعدا مع باراك أوباما» و«جون ماك كين».

وبغض النظر عن فيستا، فإن «نات سبيك» ليس له منافس، فقد فشل برنامج فيليبس في السوق الأميركية، أما برنامج «آي بي إم» فلم يتم تحديثه منذ 2003 وموزعه الوحيد «نيوانس».

ربما يكون ذلك هو السبب الذي يجعل «نيوانس» تقوم بتغييرات بسيطة وواثقة من نسخة إلى أخرى في برنامجها «نات سبيك». فمع غياب المنافسين يمكن أن يؤثر ذلك في ميزة البرنامج. ونتيجة لذلك يمكن لمن لديهم نسخ من البرنامج تخطي التي تليها للحصول على الأحدث، فمن يملكون النسخة رقم 8 من البرنامج يمكنهم شراء النسخة رقم 10، إلا أن من يمتلكون النسخة رقم 9 غير مضطرين لشراء نسخة أحدث (النسخة العاشرة).

* خدمة «نيويورك تايمز»