כך יוצרים תנועות מורכבות עם בינה מלאכותית
מי שעוסק ביצירת סרטוני AI באופן מקצועי מכיר את הרגעים האלו היטב – הרגעים הקטנים האלה שבהם הבינה פשוט לא מבינה מה רוצים ממנה. זה יכול להיות משהו קטן: איך להחזיק מוצר, איך לבצע תנועה מדויקת, או אפילו איך לצייר קו פשוט.
וכאשר נתקלים בבעיות שכאלו, מריצים את הפרומפט שוב ושוב. מנסים לדייק אותו ולעשות אותו יותר מדויק מהשעונים האטומיים. אבל זה פשוט לא עובד ואתם מאבדים את השערות.
אבל הנה החדשות הטובות:
מה שנראה בלתי אפשרי לפני כמה חודשים, הפך היום לא רק לאפשרי – אלא גם נגיש, מהיר, ובעיקר… חכם יותר. במאמר הזה נצלול לשיטה שעוזרת לפתור בדיוק את הבעיה הזו: יצירת תנועות מורכבות באמצעות בינה מלאכותית.
למה אי אפשר “לעגל פינות” ביצירת וידאו עם AI
כשעובדים על סרטוני AI ללקוחות, אין מקום לפשרות. הכל חייב להתאים לדרישות הלקוח, ויש פעולות מסוימות שחייבות להתבצע בצורה מסוימת – יש פעולות שחייבות להתבצע בצורה מסוימת — אחרת זה פשוט לא נראה אמין.
לדוגמה:
- הדגמה של מוצר שדורשת אחיזה מדויקת או לחיצה על הכפתור הנכון.
- תנועת יד מסוימת או אפילו הבעה ספציפית בפנים.
- אינטראקציה עם אובייקט כמו כניסה לרכב מהדלת הנכונה.
וכאן בדיוק מתחילה הבעיה. המודלים יודעים לייצר תמונה יפה, סצנה מרשימה ואפילו תנועה כללית – אבל כשזה מגיע לפרטים הקטנים… הם הולכים לאיבוד. כל מי שיוצר סרטי ai לעסקים נתקל בסיטואציות שכאלו.
הפתרון: לא לבקש מה-AI “לדמיין” - אלא להראות לו
עד היום התרגלתם לעשות את הכל בפרומפט, אבל כדאי שתדעו שניתן להסביר לבינה המלאכותית בדיוק מה אתם רוצים, ולפעמים בכלל בלי לרשום פרומפט אחד. כלומר אם חשבתם שהבעיה היא לדייק את הפרומפט, אפשר פשוט לוותר עליו.
הגישה היעילה יותר היא פשוטה:
👉 לתת לבינה המלאכותית וידאו רפרנס.
במקום לבקש ממנה לייצר תנועה מאפס, אתם מציגים בפני הבינה המלאכותית סרט וידאו עם תנועה קיימת והיא לומדת אותה. זהו יכול להיות סרט ai אחר שעשיתם, סרט שצילמתם או סרט ממקור אחר כמו יוטיוב.
כך אתם שומרים על דיוק, טבעיות ושליטה מלאה בתוצאה תחת הסביבה החדשה והדמות שיצרתם.
Kling Motion ו-Kling Edit — הדור החדש של שליטה בתנועה
כאן נכנסים לתמונה הכלים המרכזיים שיעזרו לנו להשיג את המטרה.
Kling Motion — מתמקד בתנועות גוף מלא
Kling Edit — מדויק יותר לתנועות ידיים ופעולות קטנות
שני הכלים עובדים על אותו מנוע, אבל ההבדל ביניהם חשוב מאוד כשמדובר בדיוק.
הרעיון פשוט:
- מצלמים וידאו קצר (אפילו עם אייפון)
- מעלים אותו למערכת של קלינג. אני עובד באמצעות היגספילד, אך ניתן לעשות זאת ישירות בקלינג או באמצעות פלטפורמות אחרות.
- מעלים את התמונה החדשה שעליה רוצים לעשות את האנימציה.
- הבינה המלאכותית תלמד את התנועה ותיצור אותה ברמת דיוק גבוהה מאוד.
רגע, זה לא מה שהוליווד עשתה?
אז מה עדיף – מצלמה או בינה מלאכותית?
דומה, אבל יחי ההבדל הקטן. הטכנולוגיה הזו מזכירה מאוד את מה שהוליווד עושה כבר שנים — Motion Capture.
בעבר, זה היה תהליך מורכב ויקר אשר כלל שחקנים עם חליפות חיישנים, מצלמות מיוחדים וצוות CGI גדול שעשה את העבודה של הבינה המלאכותית באופן ידני. אולפנים מיוחדים התמחו בזה והמחירים היו בשמיים – כלומר נדרש תקציב הוליוודי.
והיום, התחום הזה נגיש לכל אחד מאיתנו באמצעות הבינה המלאכותית. אין צורך בצוות טכני גדול, ואין צורך בצוות של שחקנים עם ציוד מיוחד. בשורה התחתונה כלי שהיה זמין רק לאולפנים בעלי תקציבי ענק, היום זמין לכל אחד בין אם זה לשימוש אישי או סרט ai לעסק.
איפה זה באמת משנה את המשחק?
הבינה המלאכותית מתפתחת בקצב מטורף ומה שהיה בלתי אפשרי לפני כמה חודשים הוא היום אפשרי. אבל יחד עם זאת עדיין ישנן נקודות מסוימות בהן ישנו קושי.
כתיבה וציור – לעתים ישנו צורך לצייר. אני באופן אישי נתקלתי בזה כאשר הגשתי סרט לתחרות ai. רציתי דמות של חייזר שתצייר עיגול על המסך. כמובן שהצלחתי, אבל זה עלה לי בהרבה ניסיונות והרבה מאוד זמן יקר. ואני לא היחידי, ראיתי שאלות בנושא גם בפורומים שעוסקים ביצירת סרטונים באמצעות בינה מלאכותית. נראה כי הבינה המלאכותית לא יכולה להתאים את צורת העט להופעת הטקסט ואין שום התאמה ביניהם.
מחוות ידיים והבעות פנים מיוחדות – הבינה המלאכותית יכולה לבצע מחוות ידיים והבעות פנים, והיא בהחלט מבינה מה זה הבעה שמחה או עצובה. ועם השילוב של תמונת רפרנס, אפשר לדלג על רבים מהמכשולים. אך במהלך עבודתי נתקלתי בקשיים במקומות מפתיעים, כמו למשל כאשר ביקשתי מהבינה המלאכותית לסמן תנועת לב עם אצבעות הידיים. מחוות מהסוג הזה, רצף של תנועות והבעות פנים מיוחדות הן בעייתיות מאוד ליצירה. וכאן, כלים כמו kling motion control, מביאים את הפתרון עבור יוצרי ai מקצועיים.
תנועות מורכבות (כמו ריקוד) – כאשר התחלתי ללמוד בינה מלאכותית יצאו המודלים הניסיוניים שאיפשרו ריקוד. רצפים מהירים ועשירים של תנועה תמיד היו אתגר. וזה היה מדליק לראות את הבינה המלאכותית מנסה להתמודד עם זה. זה היה ניסיון יפה, אבל לא מושלם ובטח שלא מספק לצרכים מקצועיים. לשמחתי חלה התפתחות אדירה והבינה המלאכותית יודעת גם לרקוד בסגנונות שונים. אבל מה לעשות כאשר ישנן תנועות ריקוד מדויקות שצריך לבצע, ולא סגנון כללי? במקרה זה הפתרון היחידי הוא kling motion. כלי שימושי מאוד כאשר יוצרים סרטי ai לסושיאל.