By Ahmed Hani – Sr. Principal Data Scientist at Finaira
ثمة نمط يتكرر في الصناعة على مدار السنوات القليلة الماضية. تحصل فرقة على إمكانية الوصول إلى نموذج لغوي قوي، وتبني شيئًا مثيرًا للإعجاب في غضون أسابيع قليلة، وتعرضه على القيادة، ويتحمس الجميع. ثم تأتي المرحلة الصعبة: الشحن الفعلي للمنتج، وإدراك القيمة والأثر الحقيقي على طريقة حل المشكلات المالية. هذه الفجوة بين “يعمل في العرض التجريبي” و”يعمل في بيئة الإنتاج” هي المكان الذي تتعثر فيه معظم مبادرات الذكاء الاصطناعي التوليدي في أنظمة التكنولوجيا المالية.
الجزء السهل أُنجز بالفعل
لا تتخلَّ عن الأساسيات
قبل المضي قدمًا، ثمة شيء لا يُقال بما يكفي في النقاشات الحالية حول الذكاء الاصطناعي التوليدي: التعلم الآلي الكلاسيكي والنمذجة التنبؤية لن تختفيا، وفي أنظمة التكنولوجيا المالية، غالبًا ما تظل الأداة الأنسب للمهمة.
التنبؤ بالسيولة، وتقدير مخاطر الائتمان، وكشف الشذوذات في المعاملات، ونمذجة سلوك العملاء عبر الزمن، هذه مشكلات تتعامل معها النماذج التنبؤية المنظمة والمهندسة جيدًا بمستوى من الدقة وقابلية التفسير والكفاءة الحسابية لا يضاهيه أي نموذج لغوي اليوم. حين تسأل لجنة المخاطر عن سبب وضع نموذج ما علامة على حساب معين، يقدم نموذج تعزيز التدرج على سبيل المثال إجابةً أوضح وأكثر قابليةً للدفاع من أي نموذج لغوي.
دورة الضجيج لها قدرة على جعل الفرق تشعر بأنها بحاجة للتحول إلى الذكاء الاصطناعي التوليدي في كل شيء. هذا خطأ
معرفة متى لا تستخدم نموذجًا لغويًا هي، بصراحة، من أكثر المهارات التي تُقدَّر بأقل من قيمتها في هذا المجال الآن.
ينبغي النظر إلى الذكاء الاصطناعي التوليدي والتعلم الآلي التنبؤي باعتبارهما متكاملَين لا متنافسَين. لكل منهما مكانه. التنبؤ بالسلاسل الزمنية، والتصنيف، وكشف الشذوذات، هذه لا تزال العمود الفقري للذكاء الاصطناعي المالي الجاد. يمتد الذكاء الاصطناعي التوليدي بما هو ممكن فوق هذا الأساس، ولا يحل محله.
ابدأ بالتقييم
أحد أوائل الأسئلة التي ينبغي طرحها عند تقييم أي نظام ذكاء اصطناعي توليدي بسيط: كيف تعرف أنه يعمل؟
يبدو واضحًا. لكن الإجابة الصادقة من معظم الفرق هي نسخة من “يبدو صحيحًا” أو “المستخدمون لم يشكووا بعد.” هذا غير كافٍ، ليس بشكل عام، وبالتأكيد ليس في خدمات التكنولوجيا المالية.
التقييم ليس مرحلة في دورة التطوير. ليس شيئًا تفعله في النهاية قبل الشحن. إنه محور العملية بأكملها. الآلية التي من خلالها تتحقق صحة كل قرار آخر. بدونه، أنت لا تهندس نظامًا، بل تخمن وتأمل.
كيف يبدو التقييم الجاد فعلًا؟ يبدأ بالتعريف. قبل كتابة سطر واحد من الكود، تحتاج إلى أن تكون دقيقًا بشأن ما يُفترض أن يفعله النظام وكيف يبدو الفشل. ليس بعبارات مبهمة، بل بعبارات قابلة للقياس. ما الذي يُعدّ إجابة صحيحة؟ وما الذي يُعدّ ضارًا؟ أين الحد الفاصل بين الدقة المقبولة والخطأ الكبير؟ هذه الأسئلة أصعب مما تبدو، وتجاهلها هو المكان الذي تخطئ فيه معظم الفرق.
التقييم لا يتوقف عند الإطلاق. الأنظمة التي تصمد مع الوقت هي تلك التي تمتلك خطوط تقييم مستمرة، وفحوصات آلية تعمل مع كل تحديث للنموذج، وكل تغيير في الأوامر، وكل تحول في البيانات الأساسية. النماذج اللغوية ليست ثابتة. يمكن أن يتغير سلوكها بطرق خفية لا تظهر إلا في ظروف محددة. الطريقة الوحيدة للبقاء أمام ذلك هي الاستمرار في القياس.
في أنظمة التكنولوجيا المالية، ثمة بُعد إضافي يجعل هذا أكثر أهمية: المساءلة. حين يُشكَّك في قرار مدعوم بالذكاء الاصطناعي، من قبل عميل أو مدقق أو أي أصحاب مصلحة في الحلقة، لا يمكن أن تكون الإجابة “النموذج قال ذلك.” لا بد من وجود سلسلة واضحة وقابلة للتتبع من المدخلات إلى المخرجات، مؤسَّسة على نظام تم اختباره والتحقق منه باستمرار. التقييم هو ما يجعل ذلك ممكنًا. هو ما يحول نظام الذكاء الاصطناعي من صندوق أسود إلى شيء يمكن للمؤسسة أن تقف خلفه فعلًا.
الرهان أكثرAgentic AI يرفع الذكاء الاصطناعي العامل
تنتقل المحادثة من “الذكاء الاصطناعي الذي يجيب على الأسئلة” إلى “الذكاء الاصطناعي الذي يتخذ إجراءات.” الأنظمة العاملة التي يمكنها استرداد المعلومات، وتنفيذ سير العمل، والعمل باستقلالية ما، مثيرة للإعجاب حقًا، وتُدخل فئة مختلفة تمامًا من المخاطر.
حين يقتصر نظام الذكاء الاصطناعي على توليد النصوص، فإن الإجابة الخاطئة مشكلة قابلة للتعافي. حين يتصرف نيابة عن مستخدم أو مؤسسة، تصبح عواقب الفشل أكثر خطورة. قرارات المعمارية تصبح أكثر أهمية. الضمانات تصبح أكثر أهمية.
الرهان الجدير بالمخاطرة
سيعيد الذكاء الاصطناعي التوليدي تشكيل طريقة عمل أنظمة التكنولوجيا المالية، وكيفية خدمة العملاء، وكيفية اتخاذ القرارات. هذه ليست تنبؤًا جدليًا، بل هو يحدث بالفعل!
السؤال هو من سيفعل ذلك بشكل صحيح. لن تكون الفرق التي تحركت بأسرع ما يمكن في السنة الأولى. بل ستكون الفرق التي طرحت أسئلة أصعب مبكرًا: حول التقييم، وحول المراقبة، وحول ما يعنيه فعلًا نشر الذكاء الاصطناعي بمسؤولية في بيئة عالية المخاطر.
هذا هو الرهان والفرصة! ليس فقط بناء الذكاء الاصطناعي، بل بناؤه بشكل صحيح، بدءًا من إثباتات المفهوم وحتى الحل الكامل القابل للتوسع.