غوغل تطلق نموذج “نانو بانانا” لتعديل الصور بدقة غير مسبوقة

01/09/2025 محمد

في عالم تتسارع فيه تقنيات الذكاء الاصطناعي بوتيرة مذهلة، كشفت شركة غوغل عن أحدث ابتكاراتها في مجال تعديل الصور بالذكاء الاصطناعي، وهو النموذج المعروف باسم “نانو بانانا” (Nano Banana). ورغم غرابة الاسم، فإن قدرات هذا النموذج المبتكر أثارت ضجة عالمية منذ الإعلان عنه أواخر أغسطس 2025، إذ يقدم نقلة نوعية في كيفية التعامل مع الصور الرقمية من حيث تعديلها، دمجها، والحفاظ على تفاصيلها الأصلية.

النموذج الجديد يأتي امتدادًا لتجارب غوغل السابقة مع Gemini 2.5 Flash Image، لكنه يقدم تحسينات ملموسة تجعله منافسًا مباشرًا لتطبيقات شهيرة مثل فوتوشوب وأدوات الذكاء الاصطناعي الأخرى. فما الذي يميز “نانو بانانا” عن غيره؟ وكيف يمكن أن يغير طريقة تعاملنا مع الصور الرقمية في المستقبل؟

خلفية إطلاق النموذج

لطالما سعت غوغل إلى تعزيز مكانتها في عالم الذكاء الاصطناعي التطبيقي، سواء في معالجة النصوص أو توليد الصور. ومنذ بداية 2024، ركزت الشركة على تطوير أدوات متقدمة تتيح للمستخدمين العاديين التفاعل مع الصور بسهولة عبر الأوامر النصية دون الحاجة إلى خبرة تقنية.

في وقت سابق من هذا العام، أطلقت غوغل نموذجها Gemini 2.5 Flash Image كجزء من مشروع جيميناي الشهير. ورغم أن هذا النموذج لاقى استحسانًا كبيرًا، فإنه واجه تحديات فيما يتعلق بفقدان تفاصيل الصور عند تعديلها بشكل متكرر. ومن هنا، جاء تطوير “نانو بانانا” كنسخة محسّنة قادرة على التغلب على هذه العقبة، مع التركيز على الحفاظ على دقة التفاصيل واستمرارية الهوية البصرية للصورة حتى بعد إدخال تغييرات متكررة.

ما الذي يقدمه “نانو بانانا”؟

1. حفظ التفاصيل بشكل استثنائي

أبرز ما يميز “نانو بانانا” هو قدرته على الاحتفاظ بجميع التفاصيل الدقيقة للصورة الأصلية حتى بعد إدخال عدة تعديلات متتابعة. على سبيل المثال:

يمكن تعديل ملابس شخص في صورة ما عدة مرات، ومع ذلك يحتفظ النموذج بشكل الوجه وتفاصيل الملامح دون تشويه.
يمكن تغيير خلفيات الصور بشكل متكرر (من مكتب إلى شاطئ إلى جبل ثلجي)، مع الاحتفاظ بجودة الأشخاص والعناصر الأساسية.

هذا الأمر يمثل قفزة نوعية مقارنة بالعديد من أدوات الذكاء الاصطناعي المنافسة، التي غالبًا ما تُنتج صورًا مختلفة تمامًا عن الأصل بعد جولات التعديل.

2. القدرة على التنبؤ والتحويل

من القدرات المدهشة التي يوفرها “نانو بانانا” إمكانية تخيل أشكال الأشخاص عبر الزمن. يستطيع المستخدم، عبر تزويد النموذج بصورة لشخص، أن يطلب منه تخيل ملامحه بعد 10 أو 20 عامًا، أو حتى في مراحل عمرية أصغر.

هذا الاستخدام يفتح الباب أمام تطبيقات متعددة في مجالات مثل:

الطب الشرعي: تخيل ملامح المفقودين بعد سنوات.
الترفيه والإبداع الفني: تخيل شكل نجوم السينما في المستقبل.
الأبحاث العلمية: دراسة مراحل الشيخوخة بصريًا.

3. دمج الصور بذكاء

أحد أبرز الاستخدامات التي استعرضتها غوغل خلال العرض التجريبي للنموذج كان دمج صور متعددة. على سبيل المثال، قام “نانو بانانا” بدمج صورة امرأة مع كلبها ثم وضعهما في خلفية جديدة (ملعب كرة سلة). والنتيجة كانت صورة واقعية تمامًا حافظت على جميع تفاصيل الشخص والحيوان والخلفية.

هذا النوع من التوليد يتيح لمجال التصميم والإعلانات أدوات غير مسبوقة، حيث يمكن إنتاج محتوى تسويقي مبتكر بسرعة وكفاءة دون الحاجة إلى جلسات تصوير مكلفة.

4. الاستجابة للأوامر المتتالية

ما يجعل “نانو بانانا” أكثر مرونة هو قدرته على تنفيذ سلسلة أوامر متتابعة على نفس الصورة. يمكن للمستخدم أن يبدأ بتعديل لون الملابس، ثم يطلب تغيير الخلفية، ثم يضيف عناصر جديدة، وكل ذلك دون فقدان تفاصيل الصورة الأصلية.

هذا الأسلوب التفاعلي يجعل التجربة أقرب إلى العمل مع مساعد شخصي ذكي لفن التصميم.

استخدامات عملية للنموذج

1. في مجال الأزياء والتسوق الإلكتروني

يمكن للمستخدمين تجربة ملابس بألوان وتصاميم مختلفة على صورهم الخاصة دون الحاجة فعليًا إلى ارتداء هذه الملابس. هذه التقنية قد تعيد صياغة طريقة عمل منصات التجارة الإلكترونية، حيث يمكن للزبائن رؤية أنفسهم بالمنتج قبل شرائه.

2. في صناعة السينما والألعاب

بفضل قدرته على توليد شخصيات جديدة مبنية على أشخاص حقيقيين، يمكن إدخال هذه الشخصيات إلى أدوات تحريك مثل Runaway Act 2 لمنحها حياة جديدة. هذه الخطوة قد تختصر الكثير من الوقت والميزانيات في صناعة الأفلام وألعاب الفيديو.

3. في التعليم والبحث العلمي

يتيح “نانو بانانا” إمكانية إنشاء صور تعليمية دقيقة أو تعديل صور حقيقية بغرض التوضيح. يمكن أن يستخدم في كتب التعليم، العروض التفاعلية، وحتى الأبحاث التي تحتاج صور محاكاة دقيقة.

4. في الطب والعلوم الطبية

قد يساعد في محاكاة العمليات الجراحية أو إعادة بناء ملامح الأشخاص بعد الحوادث لأغراض علاجية أو تجميلية.

المقارنة مع الأدوات الأخرى

رغم وجود العديد من الأدوات المنافسة مثل MidJourney و Stable Diffusion، إلا أن “نانو بانانا” يتفوق في:

الاحتفاظ بالتفاصيل بدلاً من إعادة توليد الصورة من الصفر.
السهولة في الاستخدام عبر أوامر نصية بسيطة.
التكامل مع منظومة غوغل، مما يجعله مرتبطًا بخدمات أخرى مثل Google Photos و Google Drive.

التحديات والمخاوف

مع كل هذه القدرات، تثار أيضًا تساؤلات حول أخلاقيات الاستخدام:

هل يمكن استخدام النموذج لتوليد صور مزيفة (Deepfake)؟
كيف ستتعامل غوغل مع قضايا الخصوصية إذا استُخدم لتوليد صور أشخاص دون إذنهم؟
ما هي القيود التي ستضعها الشركة لضمان الاستخدام الإيجابي للتقنية؟

غوغل أكدت أنها ستدمج ضوابط تقنية وأخلاقية صارمة لمنع الاستخدامات الضارة، لكن يبقى السؤال: هل ستكون هذه الضوابط كافية؟

الخلاصة

يشكل “نانو بانانا” من غوغل ثورة جديدة في عالم تعديل الصور بالذكاء الاصطناعي. بفضل دقته العالية، وقدرته على الحفاظ على التفاصيل، وتعدد استخداماته، فإنه يفتح آفاقًا واسعة أمام المستخدمين من الأفراد والشركات على حد سواء.

لكن في الوقت نفسه، يفرض هذا الابتكار تحديات كبرى في مجالات الخصوصية، الأخلاقيات، وتنظيم استخدام الذكاء الاصطناعي. وبينما يتسابق العالم للاستفادة من مزايا هذه التقنية، يبقى على الشركات والحكومات والمستخدمين التفكير بعمق في كيفية توظيفها بما يخدم الإنسانية دون أن يضر بها.

هل تم تسريب بياناتك على باي بال ؟ خطوات حماية الحساب

الجزيرة.. غوغل تتخلى عن 35% من مديري الفرق الصغيرة إعادة هيكلة أم بداية مرحلة جديدة؟