מודל היצירה הרב-מודאלי של Google — שם החשיבה של Gemini פוגשת את היכולת ליצור. צרו וערכו וידאו מטקסט, תמונות, וידאו או אודיו בשפה טבעית. כל עריכה נבנית על הקודמת. נסו בחינם עם FireRed Image Edit.
Gemini Omni הוא מודל היצירה הרב-מודאלי של Google DeepMind, שהוכרז ב-Google I/O 2025. הוא משלב את יכולת החשיבה של Gemini עם מערכות מדיה גנרטיביות, ומאפשר יצירה ועריכה של וידאו שחורגת מפלט פשוט של פרומפט-לוידאו. המודל מבין סצנות, פעולות, סביבות, התנהגות פיזיקלית והקשר מהעולם האמיתי — ומייצר תוצאות שמרגישות מכוונות ולא אקראיות. Gemini Omni Flash הוא המודל הראשון במשפחת Omni, שנבנה לזרימות עבודה מעשיות של יצירה ועריכת וידאו שבהן משתמשים יכולים לשנות צילומים, להנחות תוצאות עם רפרנסים ולשפר סצנות דרך שיחה בשפה טבעית.

קלט רב-מודאלי, עריכה שיחתית, טרנספורמציית סגנון וידע מהעולם האמיתי — הכל במודל אחד
Gemini Omni מציג גישה שונה מהותית לעריכת וידאו. במקום להתחיל מאפס בכל יצירה, תוכלו לשפר את הוידאו שלכם דרך סדרה של הוראות בשפה טבעית. שנו את הרקע, התאימו את הפעולה, החליפו אובייקטים, שנו זווית מצלמה או הוסיפו אפקטים חזותיים — הכל תוך שמירה על יציבות שאר הוידאו. זרימת עבודה שיחתית זו מאפשרת לכם להתקדם לעבר החזון שלכם צעד אחר צעד, בדיוק כמו עריכת מסמך עם מעקב שינויים.
ערכו במספר שלבים: קודם הקימו את הסצנה, אז שנו את זווית המצלמה, ואז הוסיפו אפקטים אטמוספריים — תוך שמירה על עקביות לאורך כל הדרך
עריכה רב-שלבית שומרת על קוהרנטיות הסצנה לאורך שינויים רציפים
קודם להקים את הסצנה עם אדם בחדר, אז לשנות את התאורה לשעת הזהב, אז להוסיף גשם על החלון — כל עריכה מבוססת על הקודמת
שינויי סביבה רציפים מדגימים שיפור שיחתי
Gemini Omni יכול לשנות את הסגנון החזותי של כל וידאו קלט תוך שמירה על התנועה, המבנה והקומפוזיציה הבסיסיים. תארו את האסתטיקה הרצויה — משטחים מתכתיים, סקיצות מצוירות ביד, בובות לבד, הקרנות הולוגרפיות, אמנות ווקסל — והמודל מיישם את הטרנספורמציה בצורה קוהרנטית על כל פריים. תנועת המצלמה המקורית, פעולות הדמויות והיחסים המרחביים נשמרים, ויוצרים העברת סגנון חלקה שחורגת הרבה מעבר לפילטרים פשוטים.
כשהאדם נוגע במראה, גרום למראה להתנודד בצורה יפה כמו נוזל, וזרוע האדם הופכת לחומר מראה מחזיר אור
טרנספורמציית סגנון שומרת על תנועה תוך שינוי מוחלט של האסתטיקה החזותית
כשהאדם נוגע במראה, כל הסביבה הופכת לאמנות ווקסל תלת-ממדית עם צורות גיאומטריות מרובעות
טרנספורמציה מלאה של הסביבה לאמנות ווקסל תוך שמירה על המבנה המרחבי
בניגוד למודלים שמקבלים רק טקסט או תמונה בודדת, Gemini Omni יכול לעבד מספר סוגי קלט בו-זמנית. ספקו טקסט לכיוון, תמונות לרפרנס חזותי, וידאו להנחיית תנועה ואודיו לסנכרון דיבור או צליל. המודל מסנתז את כל הקלטים לפלט וידאו מגובש אחד. זה הופך אותו למעשי עבור זרימות עבודה יצירתיות אמיתיות שבהן ההשראה מגיעה ממקורות מרובים — סקיצת סטוריבורד, קליפ רפרנס, הקלטת קול ותיאור כתוב יכולים כולם לתרום לתוצאה הסופית.
הוסיפו צלילי נבל מסונכרנים לרגע שבו אני נוגע בכל עלה שרך. שנו את מבנה העלים לצמחייה ביולומינסצנטית עם גחליליות מעופפות מסביב
שילוב קלט וידאו עם הוראות טקסט ורפרנס אודיו לפלט מסונכרן
להמחיש את תהליך קיפול החלבונים באמצעות ידע מדעי אמיתי, מעובד בסגנון קליימיישן עם התנהגות מולקולרית מדויקת
ידע מהעולם האמיתי מיושם על הדמיה מדעית עם סגנון יצירתי
Gemini Omni FAQ
Gemini Omni הוא מודל היצירה הרב-מודאלי של Google DeepMind שמשלב את יכולת החשיבה של Gemini עם יצירת וידאו. בניגוד למודלי טקסט-לוידאו מסורתיים, Gemini Omni תומך בעריכה שיחתית רב-שלבית (כל עריכה נבנית על הקודמת), מקבל מספר סוגי קלט בו-זמנית (טקסט, תמונות, וידאו, אודיו) ומיישם ידע מהעולם האמיתי כדי לייצר תוצאות משמעותיות בהקשרן.
Gemini Omni מקבל פרומפטים טקסטואליים, עד 7 תמונות רפרנס, קליפ וידאו אחד (עד 100MB, 30 שניות) ומזהי אודיו. ניתן לשלב מספר סוגי קלט ביצירה אחת — למשל, לספק וידאו רפרנס בתוספת הוראות טקסט כדי לשנות את הסצנה תוך שמירה על התנועה המקורית.
כן. FireRed Image Edit מציע קרדיטים ליצירת סרטונים עם Gemini Omni. משתמשים חדשים מקבלים קרדיטים חינמיים כדי להתחיל ליצור מיד. המודל תומך במשכים של 4/6/8/10 שניות עם יחסי מסך 16:9 ו-9:16.
כן. Gemini Omni מצטיין בעריכת וידאו דרך שפה טבעית. העלו וידאו מקור ותארו מה אתם רוצים לשנות — שנו את הסביבה, החליפו אובייקטים, שנו סגנון, התאימו פרספקטיבת מצלמה או הוסיפו אפקטים. המודל שומר על אלמנטים שלא הזכרתם תוך יישום השינויים המבוקשים.
קבצי וידאו קלט חייבים להיות מתחת ל-100MB ולא ארוכים מ-30 שניות. טווח החיתוך השמיש (התחלה עד סוף) לא יכול לעלות על 10 שניות. קבצי תמונה חייבים להיות מתחת ל-20MB כל אחד, עם מקסימום 7 תמונות ליצירה. סרטונים שנוצרים יכולים להיות באורך 4, 6, 8 או 10 שניות.
עריכה רב-שלבית פירושה שכל יצירה יכולה להיבנות על התוצאה הקודמת. אתם מתחילים עם יצירה ראשונית ואז משפרים אותה דרך הוראות המשך — שנו זווית, הוסיפו אפקטים, שנו את הפעולה, התאימו תאורה — בזמן שהמודל שומר על עקביות עם מה שהיה קודם. זה דומה לאופן שבו תערכו מסמך דרך מספר גרסאות.
כן. סרטונים שנוצרו דרך FireRed Image Edit מגיעים עם זכויות שימוש מסחרי. Gemini Omni מורשה לשימוש מסחרי, מה שהופך אותו למתאים לתוכן שיווקי, רשתות חברתיות, הצגות מוצר, חומרים חינוכיים והפקת וידאו מקצועית.
"העריכה הרב-שלבית היא מה שמבדיל את Gemini Omni. אני יכולה לשפר סצנה צעד אחר צעד במקום ליצור מחדש מאפס בכל פעם. זה באמת מרגיש כמו בימוי ולא כמו כתיבת פרומפטים."
מנהלת קריאייטיב
"העריכה הרב-שלבית היא מה שמבדיל את Gemini Omni. אני יכולה לשפר סצנה צעד אחר צעד במקום ליצור מחדש מאפס בכל פעם. זה באמת מרגיש כמו בימוי ולא כמו כתיבת פרומפטים."
מנהלת קריאייטיב
חוו את העוצמה של Gemini Omni — בחינם אונליין