التعرّف على الطُرز المتوافقة

بالنسبة إلى تطبيقات الويب والتطبيقات المتوافقة مع الأجهزة الجوّالة، تتيح لك Vertex AI in Firebase حِزم تطوير البرامج (SDK) التفاعل مع Gemini النماذج المتوافقة مباشرةً من تطبيقك.

تُعدّ نماذج Gemini متعددة الوسائط لأنّها قادرة على معالجة وسائط متعددة، بل وإنشاءها، بما في ذلك النصوص والرموز البرمجية وملفات PDF والصور والفيديوهات والمحتوى الصوتي.

في ما يلي نظرة عامة موجزة على الطُرز المتوافقة مع Vertex AI in Firebase وأحدث إصداراتها الثابتة. تقدّم الأقسام في صفحات هذه الصفحة مقارنةً ومعلومات أكثر تفصيلاً.

الطراز الإدخال الناتج محسَّنة لـ
نماذج Gemini
Gemini 2.0 Flash
gemini-2.0-flash-001
النصوص والرموز البرمجية وملفات PDF والصور والفيديوهات والملفات الصوتية النص والرمز البرمجي وJSON
(ستتوفّر الصور والصوت قريبًا)
ميزات الجيل التالي والسرعة وإنشاء المحتوى باستخدام وسائط متعددة لتنفيذ مجموعة متنوعة من المهام
Gemini 1.5 Pro
gemini-1.5-pro-002
النصوص والرموز البرمجية وملفات PDF والصور والفيديوهات والملفات الصوتية نص، رمز، JSON مهام التفكير المعقدة التي تتطلّب ذكاءً أكبر
Gemini 1.5 Flash
gemini-1.5-flash-002
النصوص والرموز البرمجية وملفات PDF والصور والفيديوهات والملفات الصوتية نص، رمز، تنسيق JSON أداء سريع ومتعدد الاستخدامات في مجموعة متنوعة من المهام


تقدّم بقية هذه الصفحة معلومات تفصيلية عن الطُرز المتوافقة مع Vertex AI in Firebase:

  • مقارنة النماذج:

    • الإدخال والإخراج المتوافقان
    • مقارنة عالية المستوى للإمكانات المتاحة
    • المواصفات والقيود، مثل الحد الأقصى لرموز الإدخال أو الحد الأقصى لطول الفيديو الذي يتم إدخاله
  • وصف طريقة إصدار النماذج، ولا سيما إصدارات الإصدار الثابت والإصدار التلقائي والإصدار التجريبي

  • قوائم بأسماء النماذج المتاحة لتضمينها في الرمز البرمجي أثناء الإعداد

  • قوائم اللغات المتاحة لطُرز الأجهزة

في أسفل هذه الصفحة، يمكنك الاطّلاع على معلومات تفصيلية عن الطُرز القديمة.



مقارنة النماذج

ولكل نموذج إمكانات مختلفة لاستخدامه في حالات مختلفة. يُرجى العِلم أنّه يصف كل جدول في هذا القسم كل نموذج عند استخدامه مع Vertex AI in Firebase. قد يكون لكل نموذج ميزات إضافية لا تتوفّر عند استخدام حِزم SDK.

يمكنك الاطّلاع على مزيد من المعلومات حول كل من نماذج Gemini في مستندات Google Cloud.

الإدخال والإخراج المتوافقان

في ما يلي أنواع الإدخال والإخراج المتوافقة عند استخدام كل نموذج مع Vertex AI in Firebase:

Gemini 2.0 Flash Gemini 1.5 Pro Gemini 1.5 Flash
أنواع الإدخال
Text
الرمز
المستندات (ملفات PDF أو نص عادي)
الصور والفيديوهات والصوت
الصوت (البث) قريبًا
أنواع النتائج
Text
إخراج منظَّم (مثل ملف JSON)
الرمز
الصور قريبًا
الصوت قريبًا
الصوت (البث) قريبًا

للاطّلاع على أنواع الملفات المتوافقة، يُرجى الاطّلاع على مقالة ملفات الإدخال المتوافقة ومتطلبات Vertex AI Gemini API.

الإمكانات والميزات المتاحة

في ما يلي الإمكانات والميزات المتاحة عند استخدام كل نموذج مع Vertex AI in Firebase:

Gemini 2.0 Flash Gemini 1.5 Pro Gemini 1.5 Flash
إنشاء نص من مدخلات نصية أو مدخلات متعددة الوسائط
إنشاء صور قريبًا
إنشاء محتوى صوتي قريبًا
إنشاء إخراج منظَّم (مثل ملف JSON)
تحليل الصور والفيديوهات (الرؤية)
تحليل الصوت
تحليل المستندات (ملفات PDF أو نص عادي)
المحادثة المتعدّدة المقاطع
استدعاء الدوالّ (الأدوات)
استدعاء الدوالّ الأساسية
استدعاء الدوالّ بشكل موازٍ
وضع استدعاء الدوال
احتساب الرموز والحروف التي يتم تحصيل رسومها
تعليمات النظام
Multimodal Live API (البث المباشر ثنائي الاتجاه) قريبًا

المواصفات والقيود

في ما يلي المواصفات والقيود عند استخدام كل نموذج مع Vertex AI in Firebase:

الموقع Gemini 2.0 Flash Gemini 1.5 Pro Gemini 1.5 Flash
نافذة السياق *
الحد الأقصى لعدد الرموز (المدخلات + المخرجات المجمّعة)
1,048,576 رمزًا مميزًا 2,097,152 رمزًا مميّزًا 1,048,576 رمزًا مميزًا
الحد الأقصى لعدد الرموز المميّزة للإخراج * 8,192 رمزًا مميّزًا 8,192 رمزًا مميّزًا 8,192 رمزًا مميّزًا
تاريخ الإيقاف النهائي لميزة "المعرفة" حزيران (يونيو) 2024 أيار (مايو) 2024 أيار (مايو) 2024
الصور (لكل طلب)
الحد الأقصى لعدد صور الإدخال 3,000 صورة 3,000 صورة 3,000 صورة
الحد الأقصى لعدد صور الإخراج قريبًا --- ---
الحد الأقصى لحجم كل صورة مشفَّرة بترميز base64 ‫7 ميغابايت ‫7 ميغابايت ‫7 ميغابايت
ملفات PDF (حسب الطلب)
الحد الأقصى لعدد ملفات PDF التي يتم إدخالها ** 3,000 ملف 3,000 ملف 3,000 ملف
الحد الأقصى لعدد الصفحات لكل ملف PDF مُدخل ** 1,000 صفحة 1,000 صفحة 1,000 صفحة
الحد الأقصى لحجم ملف PDF الإدخال 50 ميغابايت 50 ميغابايت 50 ميغابايت
فيديو (عند الطلب)
الحد الأقصى لعدد ملفات الفيديو التي يمكن إدخالها 10 ملفات 10 ملفات 10 ملفات
الحد الأقصى لطول كل الفيديوهات المُدخلة (الإطارات فقط) 60 دقيقة تقريبًا 60 دقيقة تقريبًا 60 دقيقة تقريبًا
الحد الأقصى لمدة كل الفيديوهات المُدخلة (اللقطات والصوت) ‫45 دقيقة تقريبًا ‫45 دقيقة تقريبًا ‫45 دقيقة تقريبًا
الصوت (عند الطلب)
الحد الأقصى لعدد ملفات الصوت المُدخلة ملف واحد ملف واحد ملف واحد
الحد الأقصى لعدد ملفات الصوت المخرجة قريبًا --- ---
الحد الأقصى لمدة كل محتوى صوتي مُرسَل ‫8.4 ساعة تقريبًا ‫8.4 ساعة تقريبًا ‫8.4 ساعة تقريبًا
الحد الأقصى لمدة كل محتوى صوتي يتم إخراجه قريبًا --- ---

* بالنسبة إلى جميع النماذج، يعادل الرمز المميّز 4 أحرف تقريبًا، لذا فإنّ 100 رمز مميّز تقريبًا تتراوح بين 60 و80 كلمة باللغة الإنجليزية. بالنسبة إلى نماذج Gemini، يمكنك تحديد إجمالي عدد الرموز المميّزة في طلباتك باستخدام countTokens.

** يتم التعامل مع ملفات PDF كصور، لذا يتم التعامل مع صفحة واحدة من ملف PDF ك صورة واحدة. يقتصر عدد الصفحات المسموح به في الطلب على عدد الصور التي يمكن للنموذج التعامل معها.

العثور على معلومات تفصيلية إضافية



نماذج تحديد الإصدارات وأنماط التسمية

تتوفّر النماذج في إصدارات ثابتة وتتم تحديثها تلقائيًا وإصدارات معاينة.

  • تُعتبر الإصدارات الثابتة متاحة للجمهور العام.

    • تحتوي الإصدارات الثابتة على أسماء طُرز مُلحقة بأحد أرقام الإصدار المحدّدة المكونة من ثلاثة أرقام، على سبيل المثال gemini-2.0-flash-001 .
  • تشير الإصدارات التي يتم تحديثها تلقائيًا دائمًا إلى أحدث إصدار ثابت من هذا النموذج. وفي حال طرح إصدار ثابت جديد، سيبدأ الإصدار التي يتم تحديثها تلقائيًا بالإشارة تلقائيًا إلى هذا الإصدار الثابت الجديد.

    • تحتوي الإصدارات التي يتم تحديثها تلقائيًا على أسماء طُرز بدون لاحقة، على سبيل المثال gemini-2.0-flash.
  • تتضمّن إصدارات الإصدار التجريبي إمكانات جديدة وتعتبر غير ثابتة. يُرجى العِلم أنّ إصدارات المعاينة تشير دائمًا إلى أحدث إصدار من هذا النموذج. وفي حال طرح إصدار جديد من المعاينة، سيبدأ أي إصدار حالي من المعاينة بالإشارة تلقائيًا إلى هذا الإصدار الجديد من المعاينة.

    • تحتوي الإصدارات التجريبية على أسماء الطُرز مع إضافة -preview بالإضافة إلى تاريخ الإصدار الأولي للنموذج (-MMDD)، على سبيل المثال gemini-1.5-pro-preview-0409 (تم إصداره في 9 نيسان (أبريل) 2024).

اطّلِع على مزيد من المعلومات حول إصدارات النماذج المتاحة ومراحل نشاطها (Gemini) في مستندات Google Cloud.



أسماء الطُرز المتاحة

أسماء النماذج هي القيم الصريحة التي تُدرِجها في الرمز البرمجي أثناء تهيئة النموذج التوليدي (وهي خطوة مطلوبة لاستدعاء Gemini API).

يمكنك استخدام نقطة نهاية publishers.models.list لعرض قائمة بجميع أسماء النماذج المتاحة. يُرجى العِلم أنّ هذه القائمة المعروضة ستتضمّن جميع الطُرز المتوافقة مع Vertex AI، ولكن لا يتوافق Vertex AI in Firebase إلا مع طُرز Gemini الموضّحة في هذه الصفحة. يُرجى العلم أيضًا أنّه لا يتم إدراج الإصدارات التي يتم تحديثها تلقائيًا (مثل gemini-2.0-flash) لأنّها عبارة عن اسم بديل ملائم للإصدار الأساسي الثابت.

أسماء طُرز Gemini

للحصول على أمثلة على عملية الإعداد بلغتك، يُرجى الاطّلاع على دليل البدء.

أسماء طُرز Gemini 2.0 Flash

اسم الطراز الوصف مرحلة الإصدار التاريخ الأولي للإصدار تاريخ الإيقاف
الإصدارات الثابتة
gemini-2.0-flash-001 أحدث إصدار ثابت من Gemini 2.0 Flash مرحلة التوفّر للجمهور العام 2025-02-05 لم يحدد بعد
الإصدار الذي يتم تحديثه تلقائيًا
gemini-2.0-flash يشير إلى أحدث إصدار ثابت من Flash 2.0
(الإصدار الحالي هو gemini-2.0-flash-001)
مرحلة التوفّر للجمهور العام 2025-02-10 ---

أسماء نماذج Gemini 1.5 Pro

اسم الطراز الوصف مرحلة الإصدار التاريخ الأولي للإصدار تاريخ الإيقاف
الإصدارات الثابتة
gemini-1.5-pro-002 أحدث إصدار ثابت من Gemini 1.5 Pro مرحلة التوفّر للجمهور العام 2024-09-24 لا يجوز أن يكون تاريخ الإصدار أقدم من ‎24-09-2025.
gemini-1.5-pro-001 الإصدار الثابت الأولي من Gemini 1.5 Pro مرحلة التوفّر للجمهور العام 2024-05-24 لا يجوز أن يكون تاريخ الإصدار قبل ‎24‏/05‏/2025.
الإصدار الذي يتم تحديثه تلقائيًا
gemini-1.5-pro يشير إلى أحدث إصدار ثابت من الإصدار 1.5 Pro
(الإصدار الحالي هو gemini-1.5-pro-002)
مرحلة التوفّر للجمهور العام 2024-09-24 ---

أسماء طُرز Gemini 1.5 Flash

اسم الطراز الوصف مرحلة الإصدار التاريخ الأولي للإصدار تاريخ الإيقاف
الإصدارات الثابتة
gemini-1.5-flash-002 أحدث إصدار ثابت من Gemini 1.5 Flash مرحلة التوفّر للجمهور العام 2024-09-24 لا يجوز أن يكون تاريخ الإصدار أقدم من ‎24-09-2025.
gemini-1.5-flash-001 الإصدار الثابت الأولي من Gemini 1.5 Flash مرحلة التوفّر للجمهور العام 2024-05-24 لا يجوز أن يكون تاريخ الإصدار قبل ‎24‏/05‏/2025.
الإصدار الذي يتم تحديثه تلقائيًا
gemini-1.5-flash يشير إلى أحدث إصدار ثابت من Flash 1.5
(الإصدار الحالي هو gemini-1.5-flash-002)
مرحلة التوفّر للجمهور العام 2024-09-24 ---



اللغات المتاحة

Gemini

  • يمكن لجميع نماذج Gemini فهم الطلبات والردّ عليها بالكلمات التالية:

    العربية (ar)، البنغالية (bn)، البلغارية (bg)، الصينية المبسّطة والتقليدية (zh)، الكرواتية (hr)، التشيكية (cs)، الدانمركية (da)، الهولندية (nl)، الإنجليزية (en)، الإستونية (et)، الفنلندية (fi)، الفرنسية (fr)، الألمانية (de)، اليونانية (el)، العبرية (iw)، الهندية (hi)، المجرية (hu)، الإندونيسية (id)، الإيطالية (it)، اليابانية (ja)، الكورية (ko)، اللاتفية (lv)، اللتوانية (lt)، النرويجية (no)، البولندية (pl)، البرتغالية (pt)، الرومانية (ro)، الروسية (ru)، الصربية (sr)، السلوفاكية (sk)، السلوفينية (sl)، الإسبانية (es)، السواحيلية (sw)، السويدية (sv)، التايلاندية (th)، التركية (tr)، الأوكرانية (uk)، الفيتنامية (vi)

  • يمكن للنماذج Gemini 1.5 Pro وGemini 1.5 Flash فهم اللغات الإضافية التالية والردّ بها:

    الأفريقانية (af)، الأمهرية (am)، الأسامية (as)، الأذربيجانية (az)، البيلاروسية (be)، البوسنية (bs)، الكتالانية (ca)، السيبيانو (ceb)، الكورسيكية (co)، الويلزية (cy)، الديفيهية (dv)، الإسبرانتو (eo)، الباسكية (eu)، الفارسية (fa)، الفيليبينية (التاغالوغ) (fil)، الفريزية (fy)، الأيرلندية (ga)، الغيلية الاسكتلندية (gd)، الغاليسية (gl)، الغوجاراتية (gu)، الهوسا (ha)، الهوائية (haw)، الهمونغ (hmn)، الكريولية الهايتية (ht)، الأرمينية (hy)، الإيغبو (ig)، الأيسلندية (is)، الجاوية (jv)، الجورجية (ka)، الكازاخستانية (kk)، الخمير (km)، الكانادا (kn)، الكريو (kri)، الكردي (ku)، القيرغيزية (ky)، اللاتينية (la)، اللوكسمبورجية (lb)، اللاوية (lo)، المالاغاشية (mg)، الماوري (mi)، المقدونية (mk)، المالايالام (ml)، المنغولية (mn)، المايتيلون (المانيبوري) (mni-Mtei)، الماراثية (mr)، الماليزية (ms)، المالطية (mt)، الميانمار (البورمية) (my)، النيبالية (ne)، النيانجا (تشيتشوا) (ny)، الأودية (الأوريا) (or)، البنجابية (pa)، البشتوية (ps)، السندية (sd)، السنهالية (السنهالية) (si)، الساموا (sm)، الشونا (sn)، الصومالية (so)، الألبانية (sq)، السواحلية (st)، السواحيلية (su)، التاميلية (ta)، التيلوغو (te)، الطاجيكية (tg)، الأويغورية (ug)، الأوردية (ur)، الأوزبكية (uz)، الزولو (xh)، اليديشية (yi)، اليوروبا (yo)، الزولوية (zu)



معلومات عن الطُرز القديمة

تتوافق Vertex AI in Firebase مع جميع طُرز Gemini، بما في ذلك طُرز Gemini 1.0 Pro وGemini 1.0 Pro Vision القديمة. ومع ذلك، ننصحك بشدة باستخدام طراز أحدث مع حِزم SDK. تقترب نماذج Gemini القديمة هذه من تاريخ إيقافها نهائيًا، ولا تقدّم جميع إمكانات النماذج الأحدث.



الخطوات التالية

تجربة إمكانات Gemini API