في إنجاز علمي جديد يقرب البشر من عالم الأحياء البحرية، أعلنت شركة جوجل، بالتعاون مع باحثين من معهد جورجيا للتكنولوجيا ومؤسسة Wild Dolphin Project (WDP)، عن تطوير نموذج ذكاء اصطناعي مبتكر يدعى DolphinGemma، وهو مصمم لفهم بنية الأصوات المعقدة التي تصدرها الدلافين، بل وابتكار تسلسلات صوتية جديدة تشبهها.
الإعلان يأتي تزامناً مع اليوم العالمي للدلافين، ويعد خطوة واعدة نحو تحقيق التواصل بين الإنسان والكائنات البحرية الذكية، وذلك من خلال توظيف تقنيات متقدمة في معالجة الصوت والتعلم العميق.
أكثر من ثلاثة عقود من البحث الميداني في مجتمع الدلافين
منذ عام 1985، تقود مؤسسة WDP أطول مشروع بحثي ميداني تحت الماء لدراسة مجموعة محددة من دلافين الأطلسي المرقطة (Stenella frontalis) في مياه جزر البهاما.
يعتمد المشروع على منهج غير تدخلي شعاره: "في عالمهم، بشروطهم"، ما مكّنه من توثيق آلاف الساعات من الفيديو والصوت تحت الماء، مقترنة ببيانات دقيقة عن هوية كل دلفين، وتاريخه السلوكي، وتفاعلاته الاجتماعية.
من أبرز أهداف المشروع تحليل أنماط تواصل الدلافين وسلوكها الاجتماعي، حيث لاحظ الباحثون ارتباط أنواع معينة من الأصوات بسلوكيات محددة، مثل الصفارات المميزة التي تشبه "الأسماء" الخاصة وتستخدمها الأمهات والعجول للعثور على بعضهم، وأصوات "الصرير النبضي" وهي غالباً ما تسمع خلال الصراعات أو المواجهات، ونقرات "الطنين التي تصدر أثناء المغازلة أو مطاردة أسماك القرش.
نموذج DolphinGemma
يعتمد النموذج الجديد على تقنيات "جوجل" الصوتية مثل SoundStream لترميز الأصوات، ويعالجها باستخدام نموذج معماري بقدرة 400 مليون متغير، مصمم للعمل مباشرة على هواتف Pixel الميدانية التي يستخدمها الباحثون.
تم تدريب النموذج على قاعدة بيانات ضخمة من أصوات دلافين WDP، ويعمل بطريقة "الصوت-إلى-الصوت"، أي يمكنه الاستماع إلى تسلسل صوتي وتحليل بنيته والتنبؤ بالصوت التالي، بطريقة شبيهة بنماذج اللغة التي تتنبأ بالكلمة التالية في الجملة.
ومن خلال التعرف على الأنماط والتسلسلات المتكررة، يمكن للنموذج كشف البنية الخفية وربما المعاني داخل تواصل الدلافين، وهي مهمة كانت تتطلب جهداً بشرياً هائلاً في السابق
. كما قد يساهم في بناء مفردات مشتركة بين البشر والدلافين باستخدام أصوات اصطناعية تشير إلى أشياء تحبها الدلافين مثل الطحالب أو الأوشحة.
نحو تواصل تفاعلي حقيقي
بجانب التحليل، تطور WDP نظاماً موازياً يُعرف باسم CHAT (تقنية تعزيز السمع الحيتاني)، بالتعاون مع معهد جورجيا للتكنولوجيا، وهو كمبيوتر تحت الماء لا يهدف إلى ترجمة اللغة الطبيعية للدلافين بل إلى إنشاء مفردات بسيطة ومشتركة.
يعمل النظام من خلال إنشاء صفارات اصطناعية جديدة مرتبطة بأشياء ملموسة تحبها الدلافين، على أمل أن تتعلم الدلافين تقليدها لطلب تلك الأشياء.
ويقوم هاتف Pixel 6 بتحليل الأصوات في الزمن الحقيقي، بينما سيُستخدم هاتف Pixel 9 هذا الصيف لتوفير قدرات أوسع تشمل تشغيل النماذج والرد التفاعلي بشكل أسرع وأكثر دقة.
فوائد ميدانية وتقنيات مفتوحة المصدر
باستخدام هاتف Pixel، تقل الحاجة للأجهزة المتخصصة، مما يحسن من كفاءة النظام، ويقلل التكلفة والحجم، ويزيد من ملاءمته للأبحاث الميدانية في البحر.
وتخطط جوجل لإتاحة DolphinGemma كنموذج مفتوح هذا الصيف، ما سيفتح المجال أمام الباحثين حول العالم لدراسته وتطويره حسب نوع الدلافين في مناطقهم، سواء كانت من نوع "الدلافين الدوارة" أو "الدلافين ذات الأنف القاروري".
نحو فهم أعمق لعقول المحيط
لا يهدف هذا التعاون بين الذكاء الاصطناعي والبحث الميداني فقط إلى "الاستماع" للدلافين، بل لفهم أنماط تواصلها، وفتح آفاق جديدة في علم الأحياء البحرية، وربما، في المستقبل، تحقيق تواصل حقيقي بين الإنسان والدلافين.