تكشف الشكاوى الأخيرة في كينيا عن التكاليف البشرية للذكاء الاصطناعي وتعديل الويب ، المخبأة في سلاسل من الاستعانة بمصادر خارجية.
تبدأ القصة في مايو 2022 في كينيا: قام دانيال موتاونج ، وهو مشرف محتوى سابق من شركة Samasource Ltd المحلية ، بتقديم ملف شكوى ضد قادتها ، وكذلك مديريهم ، العديد من عمالقة الويب ، بما في ذلك Meta (الشركة الأم لـ Facebook).
في هذه الشكوى ، يتهم دانيال موتاونغ سما وميتا بالاتجار بالبشر وتفكيك النقابات والفشل في توفير الدعم الكافي للصحة العقلية.
سما - رائدة في مجال الشروح - توظف "الملصقات"، الذي تتمثل مهمته في عرض المحتوى الانتقائي للغاية ووضع علامات عليه ، غالبًا ما يكون مروعًا ، وأحيانًا عنيفًا للغاية ، من مختلف الشبكات الاجتماعية والإنترنت. الهدف: تعديل المحتوى على الشبكات الاجتماعية وتوفير قواعد بيانات متوازنة لتعلم الذكاء الاصطناعي.
بعد تسعة أشهر ، في 6 فبراير 2023 ، أصدر القاضي أول قرار تاريخي الكيني جاكوب جاكري : حكمت الأخيرة على حقيقة أن المحاكم الكينية مختصة بمقاضاة الشركات الأجنبية التي تقع شركاتها التابعة في كينيا ، وكذلك مسؤولية الرؤساء. الإجراء جاري لجلسات استماع جديدة.
هذه هي المرة الأولى التي يتم فيها الحكم على مثل هذه القضية في البلدان التي يعيش فيها هؤلاء "المدانون الرقميون" ، ويتم إصدار الحكم وفقًا لشروط الشكوى المقدمة. طريقة لتعريض الكوكب بأسره للتكاليف البشرية للتكنولوجيا الرقمية.
شروط الشكوى
وهكذا توظف سما الآلاف من المشغلين من جميع أنحاء أفريقيا جنوب الصحراء لتعديل وتسمية المحتوى من عمالقة الويب مثل Meta و Microsoft و OpenAI (الشركة التي تقف وراء ChatGPT) في إطار "شراكات التعهيد". علاوة على ذلك ، فإن هذا الأخير مؤكد أن موظفي سما ساعدوه في تصفية بعض المحتويات السامة.
وصدق القاضي على شروط الالتماس الخاص بانتهاك الحقوق الدستورية لهؤلاء المشغلين ، مستنكرًا بذلك الظروف المادية والنفسية المؤسفة التي يعملون فيها.
وبهذا القرار ، وافق القاضي أيضًا على مزايا شروط الطلب التي توضح عدم كفاية الرواتب للعيش الكريم في نيروبي ، بشأن الضائقة النفسية للموظفين (مقدم الطلب الذي يعاني من اضطراب ما بعد الصدمة - وفقًا له. المشورة) وحول تعريف مفوضية الأمم المتحدة السامية لحقوق الإنسان (مفوضية الأمم المتحدة السامية لحقوق الإنسان) ، أكدت أن الوضع الذي يعاني منه العاملون يمكن أن يوصف بأنه استغلال لتحقيق مكاسب اقتصادية ، وبعبارة أخرى ، "الاتجار بالبشر" ... خاصة وأن الدعم النفسي المعلن عنه بموجب العقد لم يتم تنفيذه أبدًا (مرة أخرى ، وفقًا لـ تلاوة العريضة وشروط محامي المدعي).
وحاول ميتا استئناف قرار القاضي جاكيري لتفادي المحاكمة ولكن دون جدوى. بالإضافة إلى ذلك ، عقب قرار القاضي غاكري ، أُلغي عقد سما مع ميتا ، وزُعم أن المشتري ، ماجوريل ، حاول وضع علامات سما على القائمة السوداء. وتقدم مئتان منهم بشكوى ضد ميتا وساما بالفصل التعسفي ، في إجراء آخر.
يمكّن تصنيف البيانات خدمات الإشراف على الويب وأنظمة تعلم الذكاء الاصطناعي
قد يكون لهذا القرار الصادر عن القاضي غاكري - والقرارات التالية - تأثير كبير على خدمات الاعتدال التي توفرها منصات الإنترنت الرئيسية ، ولا سيما تلك التي تستخدم الذكاء الاصطناعي.
في الواقع ، فإنيعد وضع العلامات الدقيقة للبيانات أمرًا ضروريًا لخوارزميات الذكاء الاصطناعي لتعلم نتائجها والتحكيم فيها بشكل صحيح : على سبيل المثال ، إذا تم تصنيف صورة على أنها "طريق" عندما تكون جدارًا ، فقد يرتكب الذكاء الاصطناعي الذي يجهز سيارة ذاتية القيادة خطأ ويسبب حادثًا.
يتعلق تصنيف البيانات بتوفير المعلومات لمساعدة الآلات على التعلم من البيانات الأولية مثل الصور والملفات النصية ومقاطع الفيديو. لكن، أنواع مختلفة من التعلم موجودة (خاضعة للإشراف ، شبه خاضعة للإشراف ، من خلال التعزيز ...) ونحتاج إلى بيانات أكثر أو أقل اعتمادًا على تجربة المستخدم المتوقعة.
يعد تصنيف البيانات مصدرًا ذا قيمة للمشغلين الرقميين
تأتي هذه المعلومات من قواعد البيانات التي جمعتها عمالقة الإنترنت أثناء وضع العلامات و الاعتدال في المحتوى. تهدف هذه إلى منع وحماية جميع الأفراد من الوصول غير المرغوب فيه إلى بيانات معينة - مثل مقطع فيديو قطع الرأس ، على سبيل المثال - من خلال إنشاء واستكمال البيانات الوصفية، البيانات التي تبلغ عن محتويات الملف المرتبط. مكنت هذه المنهجية من إنشاء قواعد بيانات ضخمة من البيانات الوصفية ، ومعرفة - وإعلام - في الوقت الحقيقي بطبيعة المحتوى الذي يمر عبر الشبكات.
البيانات الوصفية تجعل الارتباط بين المحتوى والمعلومات ، مما جعل من الممكن تجديد النموذج الاقتصادي لمشغلات الويب و الشبكاتالذي صنع ال قيمة هذه البيانات الوصفية. في الواقع ، يمكن استخدام هذه لتدريب بعض خوارزميات الذكاء الاصطناعي: ليس من قبيل المصادفة أن Facebook غير اسمه إلى Meta. تكاليف الاعتدال هائلة ، لأنه لكي تكون خوارزميات الاعتدال دقيقة وفعالة ، يجب التحكم في البيانات ووصفها بعناية - وهي مهمة تتطلب تحليلًا عالي الجودة وبالتالي مكلفة - والأهم من ذلك أنه يجب أن يخضع لعمليات تحقق متعددة من أجل تجنبه تحيز الوسم.
مع مراعاة الحفاظ على الجودة ، فقد تحولت هذه التكاليف إلى قيمة لعمالقة الإنترنت. في الواقع ، يمكن أن تصبح خوارزمية سيئة التدريب بسرعة سام, متحيزة أو حتى إنتاجها الهلوسة (أي إنشاء نتائج لا تتطابق مع أي بيانات تم تدريب الخوارزمية عليها ، أو اتباع أي نمط آخر يمكن تمييزه). يؤدي ذلك إلى تدهور الثقة في المحتوى مما يؤثر على الجمهور وبالتالي على اهتمام المعلنين.
أما بالنسبة لخوارزميات التعلم لأنظمة الذكاء الاصطناعي ، مثل تعتمد المصداقية قبل كل شيء على القدرة على تقديم إجابات معقولة ودقيقةو مهمة مستحيلة بدون بيانات مصنفة بشكل صحيح.
لهذه الأسباب المختلفة ، تتطلب جودة الملصقات الجيدة عددًا كبيرًا من أدوات الملصقات. بعبارة أخرى ، هذا الصناعة كثيفة العمالة... خاصة على الأقل منذ ذلك الحين 10٪ إلى 15٪ من البيانات التي يتم إنشاؤها كل يوم جديدة وفريدة من نوعها.
ما هو النموذج الاقتصادي لوضع العلامات؟
يسعى المصنعون إلى إيجاد توازن بين الحاجة إلى الابتكار وتكلفة هذا الابتكار. على سبيل المثال ، ملف تشغيل ChatGPT يكلف 700 دولار في اليوم دون إدخال تحسينات على النموذج، بينما يشجع تبني للأداة الرقمية ، يُعتبر عمومًا أن السعر يجب أن يكون معتدلاً للمستخدم (حوالي 20 يورو شهريًا لـ ChatGPT + على سبيل المثال).
تكاليف العمالة (وضع العلامات) هي أ جزء كبير من الإنفاق في هذا القطاع. في نهج أ بت عفا عليها الزمن لتقسيم العمل وخفض التكلفة ، تم التعاقد من الباطن مع شركات متخصصة مثل Sama في الولايات المتحدة أو Majorel في لوكسمبورغ ، والتي لديها شركات تابعة في كينيا.
يتضمن هذا العمل التعرض المستمر للصور والأصوات والمحتوى الذي لا يطاق في بعض الأحيان. في حالة Sama ، حصل على 1,5 يورو للساعة بعد الضريبة - أقل من نصف متوسط الراتب في قطاع تكنولوجيا المعلومات في كينيا ، وهو 4,3 يورو للساعة.
هذه هي شروط هذا التعاقد من الباطن والتي هي أصل قرار القاضي غاكيري.
آثار قرارات القضاة
تكمن أصالة هذه القراءة القانونية في حقيقة أنها تقوض الإستراتيجية المعتادة للشركات في قطاع تكنولوجيا المعلومات ، والتي هي في الواقع شركات كثيفة العمالة ، لكنها ترفض أن تكون مؤهلة على هذا النحو وتخفي احتياجاتها البشرية المهمة وراء سلسلة. من الباطن - بعيدًا عن إنتاجات بدون بشر تم تخيلها في نهاية القرن العشرين.


Photomatters / ويكيبيديا, CC BY-SA
هذه الممارسة هي هراء اقتصادينظرًا لأن المعرفة والتحكم في جميع مراحل عمليات الإنتاج وتحسينها هو الذي يسمح بتوحيد الهوامش واستدامة النماذج المعنية.
ربما سيوفر موقف القاضي غاكري للشركات متعددة الجنسيات على شبكة الإنترنت مساعدة قيمة في تحسين ربحيتها ونموذج أعمالها. ومع ذلك ، من الآن فصاعدًا ، سيكون المدير مسؤولاً وقابلاً للمقاضاة مثل مزود الخدمة الخاص به من حيث ظروف العمل ، أو حتى أكثر من ذلك.
اليوم ، نقوم بفحص الأثر البيئي للهيكل في جميع تشعباته الكوكبية. هل سيتم تقييم المسؤولية الاجتماعية للشركات بنفس الطريقة غدًا ، مع الأخذ في الاعتبار عملية إنتاج تكنولوجيا المعلومات ككل معولم؟
إلى جانب أخلاقيات استخدامات الذكاء الاصطناعي ، هل يجب علينا اختراع أخلاقيات عمليات تصنيعه؟
يثير استخدام تقنيات الذكاء الاصطناعي بالفعل أسئلة أخلاقية ، على سبيل المثالما إذا كان سيتم استخدام القرار الخوارزمي لإنشاء مطالبات لسداد الفوائد الاجتماعية أم لا.
يمكننا الآن أن نرى الحاجة الماسة إلى ملف أخلاق إنتاج أنظمة الذكاء الاصطناعي، لأن غياب الأخلاقيات هنا يعيق الجودة والثقة التي يمكن أن يتمتع بها المرء في الخوارزميات المنتجة. اذا كان خوارزمية سيئة التدريب هل يمكن أن يعرقل قطار أو خط إنتاج غدًا عن مساره ، فإن جودة التعليق التوضيحي تصبح غير قابلة للتفاوض - وهذا النشاط يتطلب أفضل وأكثر من الظروف الموجودة في كينيا.
المحاكمة الجارية منذ مارس / آذار (بما أن القاضي صادق على اختصاص المحاكم الكينية في هذه المنطقة) قد يغير الوضع. القطاعات الأخرى التي واجهت هذه القضايا ، مثل الموضة ، لديها تحسين ممارساتهم وشفافية مورديهم ومنهجيات إنتاجهم، على وجه الخصوص بسبب عمليات "الاسم والعار" الضخمة التي قام بها المجتمع المدني ، والتي أدت بالتدريج إلى ابتعاد المستخدمين النهائيين عن العلامات التجارية غير الفاضلة (دون أن تصبح هذه الأخيرة كذلك).
ليس من المؤكد أنه في مجال تكنولوجيا المعلومات والذكاء الاصطناعي ، يمكن للمستخدم النهائي أن يقوم بهذا النوع من المقايضة ، حيث أصبحت بشكل متزايد جزءًا لا يتجزأ من أدوات الإنتاجية.حاسب يستخدمه الجميع يوميًا. بالإضافة إلى ذلك ، لا يزال يتعين اختراع المعايير التي تشكل عمليات الإنتاج الأخلاقية للذكاء الاصطناعي. هل يمكن أن تكون الحالة الحالية دافعًا جيدًا للتفكير في الحالة الأخيرة؟
كارولين جانز كومب، أستاذ مشارك البيانات ، الاقتصاد القياسي ، الأخلاق ، تعليم OMNES
تم إعادة نشر هذه المقالة من المحادثة بموجب رخصة المشاع الإبداعي. إقرأ الالمادة الأصلية.