The Electric Puma

השוואת פרומפט זהה על פני מודלים שונים

כאשר התחלתי ללמוד איך עושים סרטים עם בינה מלאכותית, מייד ראיתי שיש מודלים שונים. והשאלה הראשונה ששאלתי את עצמי היא אם איזה מודל כדאי לעבוד? 

אז התשובה ״זה תלוי…״ יכולה להיות מעצבנת לפעמים, אבל זו האמת. לכל מודל יכולות אחרות ותוצאות אחרות. מי שעושה את הצעדים הראשונים בהחלט צריך להתנסות עם מודלים שונים ולהתחיל לראות את ההבדלים, כך הוא ילמד במהירות איזה מודל הכי מתאים לסוג העבודה שהוא רוצה לעשות באותו הרגע. 

ישנן שאלות שונות שאתם צריכים לשאול את עצמכם בעת בחירת המודל? כיצד הוא מתמודד עם דיבור, כיצד הוא מתמודד עם תנועות מצלמה ? כיצד הוא מתמודד עם הוראות מאוד מדויקות ועוד… אבל בשורה התחתונה תצטרכו לבזבז קרדיטים בשביל ללמוד. וזה לא הולך להיגמר, כי כל הזמן מודלים משתפרים ומשתנים, וצריך להמשיך לחקור. 

ללמוד ai וידאו - ניסוי שעשיתי בשבילכם

אז הפעם, על מנת לחסוך לכם זמן וקרדיטים, עשיתי קצת ניסויים בעצמי. אני מודה שלקחתי פרומפט פשוט ולא משהו מסובך, אבל כאשר מנסים ללמוד יכולות של מודל כדאי תמיד לפרק אותן לדברים פשוטים. 

ועכשיו סקירה של התוצאות לפי הסדר שהן מופיעות בסרטון :

קלינג 3 – את הסרטון הראשון עשיתי עם קלינג 3, אחד המודלים החזקים בתחום הווידאו. הוא מאפשר סרטונים של 3-15 שניות, ונותן גם אודיו. יש לו עוד תכונות חזקות ומתקדמות בתחום של שמירת דמות קבועה, אבל הן פחות רלוונטיות לסוג זה של סרטונים. סך הכל התוצאה טובה. נראה כי פתיחת הפה קצת לא טבעית בהתחלה, אך נראה כי ניתן לדייק זאת במסגרת הפרומפט. 

קלינג 3 מולטי שוט – זהו אותו המודל, אך ניתן להגדיר לו מולטישוט. כלומר צילום הסצנה מזוויות שונות, תוך כדי שמירה מדויקת על הדמות והסביבה. במקרה הזה השתמשתי במולטי שוט אוטומטי, אך לחלופין ניתן היה לפרט מה בדיוק רואים בכל שוט. גם כאן התוצאות הן די טובות. 

Seedance 1.5 – כולם מדברים על seedance 2, אבל לפי דעתי גם הגרסה הקודמת היא אחת הטובות ואולי פחות מוערכות. נראה לי שמודל זה הביא את התוצאה הטובה ביותר מבחינת ההתאמה בין הפרומפט לבין התוצאה שרציתי. 

Minimax haliuo – המודל הזה קיים בהיגספילד, והאמת מעולם לא התרשמתי ממנו. אבל אני מניח שהוא קיים מאיזה סיבה, אז מידי פעם אני נותן לו סיכוי. לא ראיתי משהו מיוחד בתוצאות שלו, ובאופן כללי אני מרגיש שהוא תמיד מעניק מראה קצת סינתטי. 

Grok – אחד המודלים האוהבים ביותר עליי, וכפי שאני רואה בפורומים העוסקים בסרטוני ai, לא רק עליי. ושתי סיבות לכך, האחת היא שכולם אוהבים דברים חינם. אמנם כבר לא… אבל במשך זמן רב המודל הציע אפשרויות שימוש די נדיבות למשתמשים חינמיים. והסיבה השנייה היא הדמיון החופשי של גרוק. הוא בנוי בצורה אחרת והוא יכול ליצור דברים מעולים רק על סמך תמונה בלי פרומפט! פחות שימושי בעבודה מקצועית, אבל בהחלט הביא תוצאות טובות ואף החליט להגדיל ראש ולהוסיף עוד עכביש. נראה שהייתה לו הבנה טובה של כל הסיטואציה. 

Kling 2.6 – מודל מעולה שמתאים לעבודה עם תמונה אחת וגם יודע לתת אודיו (במקרה הזה לא שמתי לב שכיבתי את כפתור האודיו בעת מתן הפרומפט וחבל). הוא יותר זול מקלינג 3 ויכול להתאים כאשר מחפשים איכות שאין בה משהו טכני מסובך. במקרה הזה הייתי מאוכזב מהתוצאה, השניה הראשונה שבה היא פותחת את הפה אינה נראית טבעית. אבל מה שקורה אחר כך פשוט מעולה. אני בטוח שניתן לסדר את זה עם פרומפט json שיגדיר היטב את ההתרחשות. 

Seedream 2 – למודל הזה יש יכולות מטורפות, אבל בפרומפטים פשוטים מהסוג הזה הן לא באות לידי ביטוי. זהו מודל יקר, ולהשתמש בו עבור משהו פשוט שכזה זה יהיה בזבוז זמן. זה כמו לקנות רכב שטח ארבע על ארבע, רק בשביל נסיעות קצרות בשכונה. 

מקווה שהמדריך תרם לכם, ואם יש לכם שאלות תמיד אפשר לכתוב לי. אני גם מזמין אתכם לעקוב אחרי ברשתות החברתיות ולהמשיך ללמוד דברים חדשים. 

Add Your Heading Text Here