صندوق الأدوات

كتابة الرموز بصوت عالٍ

المبرمِجون يلجأون إلى استخدام أدوات الأوامر الصوتية؛ لإراحة أيديهم.

آنا نووجرودزكي
  • Published online:

ILLUSTRATION BY THE PROJECT TWINS

دائمًا ما تُعَدّ آلام اليد الواهنة أمرًا سيئًا، ولكن بالنسبة إلى هارولد بيمينتيل كان هذا أمرًا بغيضًا بشكل خاص؛ فقد كان عمله - كطالب دكتوراة في البيولوجيا الحوسبية - ينطوي على الكتابة المستمرة على الحاسوب، وهو شخص وُلد بذراع واحدة فقط. يتذكر بيمينتيل قائلًا: "ذات مرة، قال لي مستشاري مازحًا: «ألا تستطيع أن تفعل هذا عن طريق الصوت؟»" والآن، بعد مرور ثلاثة أعوام، هذا هو ما يفعله بيمينتيل بالضبط خلال عمله كباحث في مرحلة ما بعد الدكتوراة في علم الجينوم الحوسبي بجامعة ستانفورد في كاليفورنيا.

 كان بيمينتيل يعاني من متلازمة النفق الرسغي، التي تأتي كإصابة ناجمة عن الإجهاد المتكرر. تحدث المتلازمة عندما يصبح العصب الزندي، الذي يمتد إلى أسفل على طول الحافة الخارجية للذراع، منضغطًا عند الكوع؛ فيتسبب في الخَدَر، والألم، وفقدان التحكم الحركي الدقيق في الكفين والأصابع. ويُمكن للإصابة الناجمة عن الإجهاد المتكرر أن تكون سببًا في عرقلة المسار المهني لعلماء البيولوجيا الحوسبية، وغيرهم من العلماء العاملين في مجال الترميز. في الوقت الحالي، قامت مجموعة علمية صغيرة - لكنها في طريقها إلى التوسع - بالتوصل إلى حل بديل، ألا وهو الترميز بالأوامر الصوتية. يستغرق الأمر ما لا يقل عن شهر من التدريب المُضني، والمُحبِط أحيانًا، حتى يصبح جاهزًا للاستخدام، إلا أن الترميز بالصوت يساعد هؤلاء المبرمِجين على الاستمرار في أداء وظائفهم، أو مواصلة دراساتهم. ويقول هؤلاء المبرمجون إن هناك مزايا غير متوقعة لهذا الأمر. 

إلهام من اليوتيوب

 ينسحب الترميز الصوتي على مجموعة واسعة من العلوم، ولذا، يمكن لأي باحث يقوم بكتابة الرموز أن يَستخدِمه. يَستخدِم ماثيو سولومونسون - وهو مهندس برمجيات بمعهد برود، التابع لمعهد ماساتشوستس للتقنية، وجامعة هارفارد، بمدينة كامبريدج في ولاية ماساتشوستس - الترميز الصوتي لإنشاء تطبيقات على الإنترنت، مثل قاعدة بيانات تجميع الجينوم (gnomAD)، التي تُستخدم لاستكشاف البيانات الجينومية. يقول سولومونسون :«تُتيح تلك التطبيقات بيانات مأخوذة من بعض دراسات التسلسل الكبرى في العالم».

تُعانِي ناعومي سافرا - طالبة دكتوراة في الإدراك والحوسبة اللغويين في جامعة إدنبرة بالمملكة المتحدة - من الاعتلال العصبي فى الألياف الصغيرة، وهو اعتلال لا يُعرف سببه. وهذا الاعتلال عبارة عن حالة مزمنة في الأعصاب التي تربط الدماغ بالأيدي والأقدام، وتتسبب هذه الحالة في نقل الأعصاب للألم، كرَدّ فعل لأحاسيس تُعتبر - في العادة - غير مؤلمة. تَستخدِم سافرا الترميز الخاص بها لاستكشاف عملية التدريب المتعلقة بنماذج اللغة العصبية. ويدرس بيمينتيل الكيفية التي يحدد بها احتجاز الأقسام التي لا تقوم بالتشفير في الحمض النووي الريبي تخصص الأنسجة، وقابلية الإصابة بالأمراض.

 وكما هو الحال بالنسبة إلى العديد من العلماء الآخرين، أدرك بيمينتيل وسافرا أن الترميز الصوتي أصبح أمرًا ممكنًا بفضل مقطع للفيديو، قام فيه تاڨيز رود – الذي يعمل الآن مديرًا للتقنيات في شركة تطوير مواقع الإنترنت «أنباونس»Unbounce  – بتقديم شرح مباشر للعملية لمستخدمي لغة البرمجة »بايثون« Python خلال مؤتمر »بايكون« PyCon لعام 2013. 

في هذا الفيديو، وصف رود صراعه مع الإصابة الناجمة عن الإجهاد المتكرر – التي جاءت نتيجة للترميز المستمر عبر محرر النصوص «إيماكس» emacs، وهي حالة يُسمِّيها رود حالة "خِنصر إيماكس"،  ويشرح كذلك استراتيجيته للتغلب عليها. قام رود بالتوصل إلى حل عبر شهور من العمل الدءوب، وأطلق على هذا الحل "الوحش ثلاثي الرؤوس"، لأنه يُدير ثلاثة من أنظمة التشغيل من حاسوب محمول واحد. وأمام الحضور في المؤتمر، استخدم رود طريقته لإملاء رموز تعطي تعليمات لحاسوبه المحمول بأنْ يقرأ بصوتٍ عالٍ مقتطَفًا من مشهد "الببغاء الميت" من مسلسل المشاهد الهزلية «مونتي بايثون» Monty Python.

 يقول بيمينتيل: «كان الأمر مُلهِمًا للغاية»، إلا أن بيمينتيل يشير إلى أن العملية كانت أيضًا "مليئة  بالأخطاء البرمجية"، وكانت تفتقر إلى مجتمع نشط من المستخدِمين؛ للمساعدة في إصلاح أوجه الخلل. وعليه، بدأ بيمينتيل في البحث عن بدائل، وهذا ما فعلته سافرا أيضًا. 

يتطلب الترميز بالأوامر الصوتية نوعين من البرامج: محرِّكًا للتعرف على الكلام، ومنصة للترميز الصوتي. ويُعَدّ «دراجون» Dragon، الذي أصدرته شركة «نيوانس» – وهي شركة لتطوير برامج التعرف على الكلام، مقرها برلينجتون بولاية ماساتشوستس – محرِّكًا متقدمًا، يُستخدم على نطاق واسع في البرمجة بالصوت، وهو محرك متاح منه إصداران، أحدهما لنظام «ويندوز»، والآخر لنظام «ماك». ويوجد لدى نظام «ويندوز» أيضًا منظومة مُدمجة فيه؛ للتعرف على الكلام. أما بالنسبة إلى المنصة، فتحظى منصة «ڨويس كود» VoiceCode، التي طَوّرها المُبرمج بين ماير، ومنصة «تالون» Talon، التي طَوّرها المُبرمج رايان هايلمان بشعبية كبيرة (وكلتاهما تعملان مع نظام التشغيل «ماك» فقط).

 وثمة مِنصّتان أخريان للبرمجة الصوتية، هما «كاستر» Caster و«آينيا» Aenea، وتلك الأخيرة تعمل على نظام التشغيل «لينوكس» Linux. وكلتا المنصتين متاحتان بشكل مجاني، ورموز المصدر الأصلية الخاصة بهما مفتوحة، وكلتاهما تُمكِّنان الأداء الوظيفي للبرمجة الصوتية في «دراجون فلاي» Dragonfly، وهو إطار مفتوح المصدر بلغة «بايثون»، يقوم بربط الأفعال بالأوامر الصوتية المُكتشَفة بواسطة أحد محرّكات التعرف على الكلام. قامت سافرا بتجريب «دراجون فلاي»، ولكنها اكتشفت أن تنصيبه تَطَلَّب أن تَستخدِم يديها بشكل يفوق ما كانت تستطيع تحَمُّله. 

تعمل جميع تلك المنصات الخاصة بالأوامر الصوتية بشكل مستقل عن لغة الترميز ومحرر النصوص، ولهذا، يمكن استخدامها أيضًا في مهام خارج نطاق البرمجة. وعلى سبيل المثال، يَستخدِم بيمينتيل خاصية  التعرف على الصوت في كتابة رسائل البريد الإلكتروني، وهو يجد هذا الأمر أسهل، وأسرع، وأكثر طبيعية من الكتابة باستخدام لوحة المفاتيح.

 دفقات صوتية متقطعة 

يبدو الترميز بالأوامر الصوتية للأُذُن غير المدرَّبة كدفقات صوتية متقطعة بلغة مبهمة. يمتليء مقطع الفيديو الخاص برود بمصطلحات معينة، مثل "اصفع Slap"، (أي "اضغط على زر الرجوع")، و"Sup"، (أي "ابحث عن هذا Search up")، و"مارا Mara"، (أي "قم بوسم الفقرة Mark paragraph").

 وعلى عكس برامج المساعدين الشخصيين الافتراضيين، كبرنامج «سيري» Siri، الخاص بشركة «آبل»، أو برنامج «أليكسا» Alexa، الخاص بشركة «جوجل»، لا تقوم منصّتا «ڨويس كود»، و«تالون» بمعالجة اللغة الطبيعية، ولذا، يجب أن تكون التعليمات المنطوقة متطابقة بدقة مع الأوامر التي يعرفها النظام بالفعل، ولكنّ كلتا المنصتين تستخدمان خاصية تمييز الأوامر المتواصلة، ولذلك، لا يتعين على المستخدمين التمهل قليلًا بين إصدار كل أمر وآخَر، كما هو الحال مع برنامج «سيري»، وبرنامج «أليكسا». 

تَستخدِم أوامر «ڨويس كود»، عادة، كلمات ليست موجودة في اللغة الإنجليزية، وذلك لأنك إذا استخدمتَ كلمة إنجليزية مثل كلمة "عُد return" كأحد الأوامر، فهذا يعني أنك لن تستطيع كتابة تلك الكلمة أبدًا. وفي المقابل، توفّر منصات «تالون»، و«آينيا»، و«كاستر» قواعد لغوية تتسم بالديناميكية، من خلال أداة تقوم بالتحديث المستمر لنوعية لكلمات التي يمكن للبرنامج أن يتعرف عليها على أساس نوعية التطبيقات المفتوحة. وهذا يعني أن المستخدمين يمكنهم استخدام كلمات إنجليزية كأوامر، دون أن يتسبب هذا في حدوث ارتباك.

 وبالإضافة إلى التعرف على الأصوات، يمكن لمنصة «تالون» أيضًا أن تستبدل فأرة الحاسوب بخاصية التتبع بالعين، وهو ما يتطلب متتبِّع أعين من النوع «توبياي فور سي» Tobii 4c (يبلغ سعره 150 دولارًا أمريكيًّا). وبشكل عام، تتطلب الأنظمة الأخرى المُستخدَمة في التحريك البصري لمؤشر فأرة الحاسوب كلًّا من أجهزة التتبع بالأعين، وأجهزة التتبع بالرأس، مثل جهاز «تراك آي آر» TrackIR، الذي أصدرته شركة «ناتشيورال بوينت» NaturalPoint. يقول هايلمان: "أريد أن أجعل من استخدام جميع أجزاء الحاسوب المكتبي بدون الحاجة إلى اليدين أمرًا واقعًا"، فهناك أيضًا بدائل أخرى للفأرة. ويستخدم بيمينتيل أحد هذه البدائل، الذي يُسمى «سمارت ناف» SmartNav. 

تتطلب الأوامر الصوتية، على الأقل، سماعات للرأس، أو ميكروفونًا على درجة مناسبة من الجودة. ويختار مستخدِمون كثيرون استخدام ميكروفون أحادي الاتجاه؛ حتى يمكن للآخرين التحدث إليهم، بينما يقومون هم بإملاء الرموز. يقول بيمينتيل إنّ أحد هذه الميكروفونات، وهو ميكروفون له شكل "قلب"، يتطلب تجهيزات خاصة للإمداد بالطاقة، وقد تصل تكلفة المعدات إلى 400 دولار أمريكي.

 قد يُكلِّف شراء البرامج عدة مئات من الدولارات أيضًا. يبلغ سعر محرك التعرف على الكلام «دراجون بروفيشنال» Dragon Professional ثلاثمائة دولار أمريكي، وهو سعر «ڨويس كود» نفسه. ومنصّتا «كاستر»، و«آينيا» متاحتان مجانًا، ورموز المصدر الأصلية الخاصة بهما مفتوحة كذلك. ومنصة «تالون» متاحة مجانًا أيضًا، ولكنها تتطلب محركًا منفصلًا؛ للتعرف على الكلام. وهناك حاليًّا إصدار تجريبي من منصة «تالون» بمحرك مُدمج للتعرف على الكلام، وهذا الإصدار متاح لمتابعي هايلمان على موقع «باتريون» Patreon، مقابل 15 دولارًا أمريكيًّا شهريًّا. يقول هايلمان: "يحتاج هذا النوع من التقنية إلى أنْ يكون مجانيًّا، وواسع الانتشار قدر الإمكان، لأنني أرى أننا نشهد وباءً آخذًا في الانتشار فيما يتعلق بالإصابات الناجمة عن الإجهاد المتكرر، ولا أحد يتحدث عن هذا الأمر". ويردف هايلمان قائلًا إنّ "هدفًا عظيمًا من أهدافه يكمن في إقناع كثيرين ممن لا يعانون من هذه المشكلات بعد". 

يتطلب الأمر تضافر الجميع

 قد يكون البدء في البرمجة باستخدام الصوت أمرًا صعبًا، أو باعثًا على الإحباط، سواءً أكان المستخدمون يعانون من إصابات ناجمة عن الإجهاد المتكرر، أم لا. وحسب قول بيمينتيل، استغرق الأمر معه شهرًا ونصف الشهر، حتى تَمَكَّن من الوصول إلى السرعة المطلوبة، وكانت هناك أيام أوشك فيها على الاستسلام. وبعدها، قام بيمينتيل بطباعة 40 صفحة تحتوي على الأوامر، وأجبر نفسه على النظر إليها، حتى انتهى به الأمر إلى تعَلُّمها. احتاجت سافرا إلى شهرين من الترميز – لفترة قصيرة كل يوم – حتى تصل إلى الشعور بأن الأمر كان "تجربة ممتعة تمامًا، وتوصلت إلى تصوُّر، مفاده أن هذا أمر يمكنني أن أقوم به لكسب لقمة العيش". 

«لا يمكنك استخدام تلك الأدوات دون الانخراط العميق مع المجتمعات الخاصة بها».

بعد الانتهاء من منحنى التعلُّم المبدئي، يقوم المستخدمون غالبًا بإنشاء مُوجِّهات مُصممة حسب الحاجة إلى الأوامر شائعة الاستخدام، كلما دعت الحاجة إلى ذلك. وقد كتبت سافرا مُوجِّهات خاصة بعمل الكسور، ضِمن نظام »ليتيك« LaTeX الخاص بكتابة نصوص الرياضيات.

 وغالبًا ما يشارك المستخدمون ملفات التعريف وتفاصيل التنصيب الخاصة بهم على مواقع معينة، مثل موقع »جِت هَب« GitHub، وموقع »سلاك« Slack. وتحتوي القناة الخاصة بـ»ڨويس كود« على موقع »سلاك« على ما يزيد على 250 مستخدِمًا، ربما يكون 40 منهم نشِطِين، وذلك حسب تقديرات بيمينتيل. أما القناة الخاصة بـ» تالون «على موقع »سلاك«، فلديها أكثر من 100 مستخدِم، وبعض المستخدمين موجودون في القناتين معًا. تقول سافرا: «المجتمعات مهمة للغاية بالنسبة إلى هاتين المنصّتين على حدّ سواء، فهي ليست أدوات يمكنك استخدامها دون الانخراط العميق مع المجتمعات الخاصة بها». 

وجدير بالذكر أنّ بيمينتيل وسافرا من الولايات المتحدة، وكذلك معظم المبرمجين مستخدمي خاصية التعرف على الصوت الذين يعرفهما بيمينتيل وسافرا. وعادةً ما يكون أداء البرنامج أسوأ فيما يتعلق بتفسير كلام المتحدثين بلهجة مختلفة عن اللهجة الأمريكية السائدة. ووفقًا لأحد التحليلات (انظر: go.nature.com/2ffx78z)، الذي أجرته عالمة البيانات ريتشيل تاتمان، هناك على الأقل بعض الأدوات التي تَنْتُج عنها أخطاء أكثر مع أصوات النساء. تقول سافرا: «إذا لم تكن لهجتك هي اللهجة الأمريكية السائدة، أو إذا كنتَ امرأة؛ فسوف تكون العملية أصعب بكثير، لكنْ حتى في ظل هذا، لا تسير الأمور بهذا السوء».

 وثمة جوانب سلبية أخرى، فعلى سبيل المثال، يعاني بيمينتيل من مشكلات في الحلق، ويحتاج إلى أخذ فترات راحة متكررة. يقول بيمينتيل: «إنني أشرب الكثير من الماء». ويفكر بيمينتيل في الحصول على تدريب صوتي؛ ليتعلم ألا يتسبب في الكثير من الإجهاد لصوته. 

ويشعر بيمينتيل أنه يفتقد تلك الأوقات التي كان يمكنه فيها العمل داخل إحدى المكتبات الهادئة، في حين أن سافرا تفتقد الأوقات التي كانت قادرة فيها على إحداث قَدْر أكبر من الضجيج. تقول سافرا: «اعتدتُ الاستماع إلى الموسيقى، أو الغناء لنفسي أثناء قيامي بالترميز، وكنت أقوم بإطلاق السباب. والآن، لم يعد بإمكاني فعل ذلك».

ومع ذلك، هم يُقَدِّرون الفوائد أيضًا. تقول سافرا، التي تلجأ إلى الكتابة باليد، فقط إذا كان هناك شىء يصعب إملاؤه بالصوت: «أفكِّر في الكثير من الأحيان في أنني إذا استيقظتُ يومًا ما، وكانت حالة يداي على ما يرام؛ فإنني سأستمر في إملاء الرموز بالصوت. أعتقدُ أن كثيرين من البشر يمكنهم الاستفادة من الإملاء الصوتي». وتشير سافرا إلى أن استخدام الأوامر الصوتية قد يكون أمرًا مريحًا، فهي تستطيع أن تجلس في وضع مريح، بدلًا من أن تجلس منكفِئة على لوحة المفاتيح.

وبالرغم من هذا، يُحتمل أن تكون الفائدة الإضافية الأعظم غير ملموسة بدرجة أكبر من هذا. يقول بيمينتيل: «الآن أفكر مليًّا قبل أن أقول أي شيء، أو أنفذ أي شيء. ويبدو أن رموزي قد باتت تحتوي على عدد أقل من الأخطاء». وتضيف سافرا: «أشعر بالتمكُّن من أدواتي الخاصة بطريقة لم يكن لديّ الحافز لاكتسابها قبل هذا».

آنا نووجرودزكي كاتبة حرة تقيم بالقرب من مدينة بوسطن بولاية ماساتشوستس.