تقنية التعرف على الصوت: «أندرويد» مقابل «سيري»

«أبل» تتمتع بالأفضلية لكن الفجوة بين النظامين تتضاءل

نظام الأوامر الصوتية في أجهزة أندرويد و نظام «سيري» للأوامر الصوتية في أجهزة «أبل»
TT

هل أوامر الصوت الخاصة بـ«أندرويد» لا تزال غير ملائمة مقارنة بنظام «سيري». لكي أتأكد من الإجابة على هذا السؤال، انغمست أسبوعين في دراسة سمة التعرف على الصوت. حملت «آي فون»، وهاتفا يعمل بنظام التشغيل «أندرويد» الخاص بـ«غوغل» معي في كل مكان. كنت أستخدم الهاتفين معا. أردت أن أعرف الفروق بينهما ومواطن القوة والضعف.

حينما يتحدث الناس عن التعرف على الصوت، فإنهم يعنون، وغالبا ما يخلطون بين ثلاث وظائف مختلفة. هناك الإملاء، الذي يحول من خلاله الهاتف الكلام إلى نص؛ ثم الأوامر بحيث يمكنك تشغيل الهاتف عن طريق الكلام؛ ثم إجراء عمليات بحث عن معلومات عن الإنترنت.

ثمة أوجه اختلاف كبيرة بين نجاحات الوظائف الثلاث. على سبيل المثال، لا تزال ميزة التعرف على الكلام «الإملاء» على سبيل المثال ضعيفة نسبيا في كلا النظامين. كما أن هاتفي «أندرويد» و«سيري»، وهي تقنية التعرف على الصوت في «آي فون»، يقعان في الكثير من أخطاء ترجمة الصوت إلى نص. حينما تسمع أناسا يعبرون عن ضجرهم من ترجمة الكلام إلى نص على الهواتف الجوالة، قائلين: «لقد يئسنا منها»، فهم عادة ما يشيرون إلى سمة الإملاء.

هذا أمر يمكن التغاضي عنه، لكن انظر. إنك تطلب من هاتفك أن يفهم النبرات المختلفة على مسافات متباينة من ميكروفونك، في غرف تتباين فيها درجة الصوت في الخلفية. من العجيب أن هذه السمة تعمل بالأساس.

* مقارنة النظم

* إن أحدث نسخة من «أندرويد» لا تتطلب اتصالا بالإنترنت للقيام بعملية الإملاء الأساسية. وفي «أندرويد»، تظهر الكلمات على الشاشة عندما تنطقها؛ أما «سيري»، فلا يقوم بترجمة الكلام إلى نص إلى أن تتوقف عن الكلام.

على الجانب الآخر، يفهم «سيري» عناصر التحكم في التنسيق مثل «حرف كبير» (capital) و«كتابة كل الأحرف كبيرة» (all caps) و«عدم ترك مسافة» (no space)، إضافة إلى كل أنواع الترقيم - «النقطتان المتراكبتان» و«الشرطة» و«العلامة النجمية» و«علامات الكلام المحذوف في الجملة» وما إلى ذلك.

لا يفهم «أندرويد» سوى الرموز الأساسية، مثل «نقطة انتهاء الجملة» و«الفاصلة» و«علامة التعجب».

وتعتبر الفئة الثانية، وهي أوامر التحكم في الهاتف، أكثر نجاحا بدرجة كبيرة بالنسبة لعدد ضخم من الناس. وتتمثل في توجيهك عبارات مثل: «اتصل بأمي»، «أرسل رسالة نصية إلى زميلي»، «أيقظني الساعة 7:30»، «شغل بعض أغاني بيلي جويل»، «ذكرني بإطعام القطة عندما أعود للمنزل»، وغير ذلك.

إن التحكم في هاتفك من دون لمسه مهم لسلامتك بالطبع. إذا تحتم عليك التفاعل مع هاتفك أثناء القيادة، فبالتأكيد يبدو حديثك إليه أكثر أمانا من تطلعك له.

لكن لا تنس عامل الملاءمة. من الأسرع أن تقول «افتح أنغري بيردز» عن أن تقلب في شاشات مليئة بالأيقونات. ويعتبر توجيهك عبارة «اضبط منبهي على الساعة الثامنة صباحا» أسرع بقيمة 375 ضغطة بإصبعك عن استخدام تطبيق المنبه.

هنا، أصبح «سيري» يتمتع بميزة. على سبيل المثال، إذا سمعت أثناء القيادة صوت الرسالة المقبلة، يمكنك أن تقول: «اقرأ رسائلي الجديدة»، وسيقوم «سيري» بقراءتها بصوت مرتفع. بل إنه يدعوك لإملاء رد، من دون حتى رفع عينيك عن الطريق. ولا يستطيع «أندرويد» القيام بهذا.

* التطبيقات والإنترنت

* بإمكان كلا النظامين الاستفادة من بعض التطبيقات الخاصة بالهاتف. إنهما يتعرفان على أوامر مثل «اعقد اجتماعا مع السيد فلان ظهيرة يوم الخميس» (تفاعل تقويمي)، «أعد ملحوظة لسداد الأموال إلى هارولد»، «أرسل رسالة بريد إلكتروني إلى داني كوبر» (بريد) و«ما عنوان منزل ستيف ألبر؟» (جهات اتصال).

وعلى الرغم من ذلك، يستغنى «أندرويد» عن نظام التشغيل «آي أو إس»، في عمليات البحث على الإنترنت. يقوم كلا النوعين من الهواتف بمهمة مذهلة في جلب تحديثات الطقس (كيف سيكون الطقس في ديترويت نهاية هذا الأسبوع؟) وتحديثات الوقت (ما الوقت في بلجيكا؟)، وأسعار الأسهم ومعلومات عن الرياضات (ما لعبة رعاة البقر المقبلة) المحادثات (ما قيمة 32 يورو بالدولارات)، الحسابات (كم عدد الأيام المتبقية قبل حلول العيد المقبل؟) وكل أنواع الأسئلة الخاصة بالبحث على الإنترنت (كم عدد السعرات الحرارية في قطعة شوكولاته «هيرشي»؟ متى سيكون كسوف الشمس المقبل؟ كيف تتهجى كلمة schadenfreud؟ اعرض لي صورا لكورفيت 1985، وغير ذلك).

لكن العنصر الأساسي في «غوغل» هو عمليات البحث على الإنترنت، ومن ثم، عادة ما تكون استجابات «أندرويد» أكثر وأسرع. (لتجربة هذا الأسلوب على جهاز «آي فون»، قم بتنزيل تطبيق «غوغل سيرش»).

يعتبر «أندرويد» مذهلا على وجه الخصوص في الاتصال بأماكن من دون الحاجة للبحث عنها (اتصال بماسيز في شارع 34) واتجاهات (وصلني إلى مطار لا غارديا بالمواصلات العامة)، نظرا لأن تطبيق «ماب» (الخرائط) المضمن فيه رائع على نحو لا يمكن تصديقه. إضافة إلى ذلك، فإنه أيضا أكثر ذكاء فيما يتعلق بربط سؤال بآخر. إذا كان أول سؤال طرحته هو: «من هي هيلاري كلينتون؟»، فيمكنك أن تتبعه بسؤال: «من زوجها»؟

ويشتمل «غوغل» على سمة مضمنة خاصة بالتعرف على الموسيقى، مثل تطبيق «شازام». اضغط على أيقونة التعرف على الصوت، ودع الهاتف يستمع لأي أغنية تشغلها، وسوف تندهش من تعرفه على الفور على الأغنية والمغني.

* «سيري» و«أندرويد»

* لسوء الحظ، يشتمل «أندرويد» على عقب أخيل - فعليا، أقرب إلى ساق أخيل كاملة. ولإصدار أوامر شفهية، يتعين عليك أن تضغط على أيقونة الميكروفون على شريط بحث «غوغل». وهي موجودة فقط على الشاشة الرئيسة أو شاشة «غوغل ناو» (قم بالإدخال من أعلى لأسفل). بهذا، لا يمكنك أن توجه أوامر كلامية عندما يكون هاتفك مغلقا، أو عندما تكون داخل تطبيق آخر.

على «آي فون»، استمر في الضغط على زر Home أو على زر تحكم عن بعد على سلك سماعات أذنيك، بحيث يمكن أن تعمل سمة التحكم في الصوت عندما يكون الهاتف مغلقا أو في أي تطبيق.

بعبارة أخرى، لاستخدام سمات الحديث الخاصة بهاتف «أندرويد»، يتعين عليك أن تنتقيها بشكل متكرر، ودائما ما يتعين عليك أن تنظر إليها، الأمر الذي يقوض الجزء الأكبر من غرض تلك السمات. الاستثناء: يمكن ضبط هواتف «موتورولا» الجديدة، مثل «موتو إكس» بحيث تستمع إلى الكلام طوال الوقت.

يكون «سيري» أفضل مع المطاعم والأفلام أيضا. يفهم كلا الهاتفين عبارات مثل: «المطاعم الهندية الجيدة في المنطقة». لكن «سيري» يمكنه أيضا أن يسجل حجوزات، بفضل تكامله مع موقع OpenTable.com. على سبيل المثال، يمكنك أن تقول: «قم بالحجز في مطعم إيطالي رخيص ليلة السبت الساعة السابعة».

بالمثل، يوفر «سيري» شاشات إجابات جذابة مضمنة لأسئلة مثل: «ما الأفلام التي يعرض أول عرض لها هذا الأسبوع؟»، «أعطني تقييمات لفيلم ‹The Way, Way Back» أو «ما أوقات عرض (السنافر 2)». عرض لك «أندرويد» للتو فقط نتائج بحثك على «غوغل».

بعد ذلك، تأتي مسألة الشخصية. يشتمل «سيري» على تلك السمة، في حين لا يشتمل عليها «أندرويد». نحن نتحدث عن الملاحظات البارعة والنكات والموقف، من خلال مخاطبتك باسمك. إذا وجهت سؤالك لـ«سيري» قائلا: «من والدك؟» لأجابك: «أنت. هل يمكننا العودة إلى العمل الآن؟».

الآن، على ساحة المعركة الكبرى لحرب المعجبين بين «أبل» و«غوغل»، لا تزال الدعابة أمرا غير ذي أهمية. يفتح كارهو «أبل» أعينهم عن آخرها عندما تشير إلى الطابع المميز لسيري. وتأتي إجابتهم: «إنه ليس مفيدا! إنها خدعة! إنه يستنزفك لتجنب التجاوز في وصف مدى الغباء الذي تبدو عليه!».

وهذا أمر جيد. ولهذا، هناك خيار: معسكران في هذه المدرسة الفلسفية. (حسنا، هناك أيضا «ويندوز فون» و«بلاك بيري»، ولكن خاصية التعرف على الصوت بهما بدائية).

إذن: ضع سيفك في غمده. كلا النظامين مفيد إلى حد بعيد، بمجرد أن تخصص الوقت لتعلمهما. (هناك موقع إلكتروني يضم قائمة جيدة من أوامر الصوت الخاصة بـ«أندرويد»: j.mp/12kEFDo. وهناك آخر لـ«سيري»: j.mp/16Yy4yy.).

على الرغم من أن «سيري» يتمتع بالأفضلية، فإن الفجوة بينهما قد أغلقت بالكامل، وكلا النظامين يتطور بسرعة. على سبيل المثال، حتى وقت قريب، لم يكن «أندرويد» يتضمن سمات تحكم في الصوت على الإطلاق - عمليات بحث على الإنترنت فقط. وفي تحديث هذا الخريف لنظام iOS 7، سوف يكتسب «سيري» صوتا حديثا أكثر عذوبة، وعمليات بحث أسرع وقدرة على تغيير الإعدادات بالصوت (قم بتشغيل Airplane Mode، «شغل سمة الوضوح»، «شغل بلو توث» - شيء لا يمكن لأي هاتف القيام به الآن. ويعتبر هذا واضحا: سمة التعرف على الصوت بالهاتف الخلوي تتحسن بسرعة. عما قريب، سوف يقل حديثنا عبر هواتفنا، فيما سيزيد حديثنا إليها!

* خدمة «نيويورك تايمز»