تكنولوجيا إدراك الكلام

أجهزة المستقبل الرقمية تسمع وتطيع وتتواصل مع مستخدمها

TT

الابتكار يحتاج عادة إلى وقت ليتعمق. وهو وقت لتحويل الفكرة الى شيء عملي، ووقت لوضعها في السوق، ووقت للناس لكي يقرروا قبولها. وقد تعمقت تكنولوجيا ادراك الكلام منذ زمن بعيد. ويتذكر مايك فيليبس انه في ثمانينات القرن الماضي، وعندما كان طالبا في كارنيجي ميلون يحاول تطوير انظمة ادراك أساسي للكلام «بدا الأمر مستحيلا تقريبا».

وفي الوقت الحالي بدأت وسائل ادراك الكلام توفر في أسواق الانتاج الواسع بفضل مقاولين من أمثال فيليبس. فهو مسؤول التكنولوجيا الرئيسي والمؤسس المشارك لشركة فلينغو Vlingo، التي بدأت عملها منذ 18 شهرا في كمبريدج بولاية ماساشوسيتس، وهي تبيع الخدمات لشركات الهواتف الجوالة وشركات برامج كومبيوترية أخرى تريد أن تمنح زبائنها القدرة على جعل أفواههم تقوم بتوجيه الكلام والبحث.

وتوفر خدمة فلينغو للناس أن يتحدثوا بصورة طبيعية، بدلا من جعلهم يستخدمون عددا محدودا من العبارات. وقد جسد ديف غرانان، المدير التنفيذي للشركة، تطبيق اكتشاف فلينغو بأن طلب من هاتفه أغنية لجون هيرت، وتحديد موقع المخبز المحلي والبحث في شبكة الانترنت عن منتج استهلاكي. وكان كل ذلك سريعا ومناسبا. وفلينغو معدة للتكيف الى صوت مستخدمها الأساسي، ولكنني كنت أيضا قادرا على استخدام هاتف غرانان للاستدلال على عنوان.

وتطبيق الاكتشاف في مرحلة الاختبار النهائي في «آي.تي.أند تي وسبرنت. ويمكن للزبائن الذين يستخدمون هواتف جوالة معينة من تلك الشركات ان يخزنوا برنامج التطبيق من موقع vlingo.com.

وأنفق فيليبس اكثر من 15 عاما في خنادق الشركات التي عملت في مجال ادراك الكلام. وفي عام 1994 كان واحدا من مؤسسي سبيتشووركس Speechworks التي طورت أنظمة استجابة صوتية مبكرة، وهي الخدمات المؤتمتة التي تجيب عندما نتصل بشركة. وفي عام 2000 جرى شراء سبيتشووركس من جانب سكانسوفت ScanSoft التي اشترت بعد خمسة اعوام نوانس كوميونيكيشنز Nuance Communications. وغادر فيليبس في ذلك العام ليعمل في معهد ماساشوسيتس للتكنولوجيا كباحث زائر. وفي عام 2006 بدأ وزميله جون نغوين من سكانسوفت، تأسيس فلينغو لأنهما كانا يعتقدان أن تكنولوجيا ادراك الكلام والشبكات الخليوية والهواتف، أصبحت جميعها من القوة، بحيث انها توفر أنظمة الملاحة الصوتية على الهواتف الجوالة. ويقول انه «لم يكن بوسعنا القيام بهذا قبل خمس سنوات».

ويخوض فيليبس في الوقت الحالي، سباقا للحصول على حصة في السوق. وتقوم شركة اخرى تحمل اسم يابYap Inc وتتخذ من تشارلوت في كارولاينا الشمالية باختبار نهائي لخدمتها، التي هي مماثلة لخدمة فلينغو، ولكن فيها خدمة الرسائل النصية. وقرر ايغور وفكتور جابلوكوف، المؤسسان المشاركان لشركة ياب، البدء بالشركة، لأنهما شاهدا شقيقتهما الصبية وهي ترسل الرسائل النصية، عندما كانت في السيارة. ولم تكن تقود السيارة في ذلك الوقت، لكن ايغور جابلوكوف يقول ان شركات الهواتف الجوالة تبلغه في اللقاءات، ان ثلثي زبائنها من المراهقين، كانوا قد بعثوا او قرأوا رسالة نصية وهم يقودون السيارة. وتعتبر مايكروسوفت منافسا قويا محتملا، وهذا يعود جزئيا إلى شرائها لـ«TellMe Networks» في مارس الماضي. ويقدم «TellMe» تطبيقات للبحث بواسطة الكلام للهواتف الجوالة المتوفرة لزبائن «AT& T» و«Sprint». وأنشئ نظام «TellMe» على الهاتف الجديد «Mysto» من شركة هيليو.

وبشكل عام، حقق إدراك الكلام دخلا في عام 2007 إلى 1.6 مليار دولار، حسب مركز بحوث أوباس الذي تنبأ بتحقق نمو سنوي يصل إلى 14.5 في المائة سنويا، خلال السنوات الثلاث المقبلة. وقال دان ميللر المحلل في مركز أوباس إن الشركات التي تمتلك تكنولوجيا إدراك الكلام ستكون ذات دخل أسرع مع تزايد عدد المستخدمين لهذه التكنولوجيا. ويعد سوق الهواتف الجوالة الأكثر قدرة في تحقيق الجزء الاكبر من الأرباح، بسبب الاقبال عليها حيث تباع منها بالمليارات لكن منتجي الهواتف الجوالة ما زالوا يعملون على وضع نموذج لهذا النمط من الخدمات.

يمكن القول إن تكنولوجيا إدراك الكلام أصبحت متوفرة على الكومبيوترات منذ عام 2001 في تطبيقات مايكروسوفت أوفيس، لكن القليل من الناس يستخدمونها. لكن هذه التكنولوجيا في طور الزيادة الهائلة مع الهواتف الخليوية، حسبما قال بيل مايسل محرر صحيفة أخبار استراتيجية الكلام. وبدأ استخدام تكنولوجيا الكلام في أنظمة تحديد المواقع العالمي المستخدمة في السيارات الفاخرة، مثل كاديلاك ولكسوس، وهي تنتشر الآن في السيارات الأرخص ثمنا.

وتم تطوير نظام إدراك الكلام من قبل مايكروسوفت لصالح شركة سيارات فورد وقال ديفيد ناهامو رئيس البحث في شركة سيارات آي.بي.أم، إن الشركة وضعت أنظمة إدراك الكلام لمساعدة السواق على إيجاد الأغاني بسرعة، بينما هو وراء المقود، وبذلك لن تكون هناك حاجة للضغط على الزر.

ثم توجد هناك شركة سيمول سكرايب المتمركزة في نيويورك، والتي تستخدم تكنولوجيا إدراك الكلام لتحويل الرسالة الصوتية إلى رسالة الكترونية (إي ـ ميل). وقال جيمس سيمينوف رئيس الشركة التنفيذي: «تطورت تكنولوجيا إدراك الكلام إلى النقطة التي أصبحنا معها قادرين على استخدامها في تطبيقات محددة».

أما جيمس غلاس كبير الباحثين في شركة «ساينس ومختبر الذكاء الاصطناعي» الكومبيوترية، فقال إن تكنولوجيا إدراك الكلام «ستصبح في نهاية المطاف مستخدمة في أي مجال يستخدم الكلام فيه». وقال إن التحسن في قدرات المكائن لإدراك طرائق الكلام البشري حتى مع لكنات صعبة، وهذا ما سيساعد على زيادة عدد المستخدمين لها.

لكن ذلك لا يعني أن الناس يختارون دائما أسلوب الكلام. وقالت جنيفيف بيل مديرة قسم الخدمات الرقمية في شركة انتل، إن الأفراد لن يستخدموا الكلام للتعامل مع حساباتهم المالية على الأقل في الأماكن العامة. ولعل ذلك لن يعمل بشكل جيد في غرفة الجلوس.

وقالت بيل مازحة، إنها ستصرخ بكلمة «كريكت» لعبتها المفضلة، كلما دخلت إلى غرفة فيها تلفزيون، فتظهر لك اللعبة على الشاشة.

* خدمة «نيويورك تايمز»