הדרכה והשוואה של יצירת תמונה בינה מלאכותית: Dall-e VS Diffusion Stable VS Canva (טקסט לתמונה)

עם הפופולריות התקשורתית הנוכחית של ChatGPT זו הזדמנות לדבר גם על DALL-E, בינה מלאכותית נוספת שתוכננה גם על ידי פתח AI ! ובאופן כללי יותר בינה מלאכותית ליצירת תמונות. כאשר ChatGPT מסוגל ליצור טקסט כתוב בקלות מדאיגה, DALL-E ודומיו הוכשרו ליצור תמונות מתוך בקשה כתובה פשוטה מהמשתמש.

בואו נסתכל על איך הם עובדים, את היכולות שלהם, אבל גם את הגבולות שלהם עם מאמר השוואתי זה של AI יצירת תמונות.

אבל דרך אגב, איך עובד AI?

שאלה טובה מאוד שאולי מעניין לחזור אליה מהר, במיוחד מכיוון שלא התייחסנו אליה במאמר הקודם שלנו על ChatGPT. כששומעים את "בינה מלאכותית" קשה שלא לזכור רובוטים דמויי אדם כאלה כפי שראינו אותם בסרטים. זה מה שה-AI עצמם מייצרים כאשר הם מתבקשים לקבל תמונה המתאימה לחיפוש של מילות מפתח אלו, כמו תמונת ההיכרות של מאמר זה.

הנוף הזה לא קיים, הוא 100% מלאכותי שנוצר על ידי AI

אולם במציאות, לרבים מה-AI הקיימים אין מעטפת פיזית. ואכן, לרוב, מדובר בתוכנות מחשב המבוססות על אלגוריתמים ספציפיים אשר אומנו על ידי בני אדם לבצע משימות מסוימות יותר או פחות מורכבות.

יצירת תמונות היא משימה שניתן להקצות ל-AI אחד (או יותר! כדי ללמוד עוד על שיטות יצירת תמונות על ידי AI, אל תהססו לצפות בסרטון הבא:

בואו ניצור את התמונות הראשונות שלנו עם בינה מלאכותית

כדי לעשות זאת, שום דבר לא יכול להיות פשוט יותר ממבט ראשון, מכיוון שכל מה שאתה צריך לעשות הוא לתאר טקסטואלית ל-AI את התמונה שאתה רוצה להשיג. עבור מאמר זה החלטנו להשוות את התמונות שניתנו על ידי שלושה מחוללי AI:

  • DALL-E
  • דיפוזיה יציבה
  • Canva (טקסט לתמונה)

כמובן, יש אחרים שלא תהסס לבדוק גם. הנה אחד רשימה לא ממצה.

אם אתה קצת יצירתי, אנו בטוחים שתמצא שפע של רעיונות ליצירת תמונות. אבל למי שזה יהיה קצת יותר מורכב עבורם אפשר לבקש... ChatGPT קצת עזרה. כן, השתמשנו בבינה מלאכותית כדי להשתמש בבינה מלאכותית אחרת...

התשובה של ChatGPT לשאלה: אני חייב לכתוב מאמר ב-dall.e, האם יש לך רעיונות לתמונות שניתן ליצור עם מודל AI זה?

כמובן, כמודל ליצירת תמונות, DALL-E יכול ליצור מגוון רחב של תמונות. הנה כמה רעיונות לתמונות שתוכל ליצור עם DALL-E:

  1. חיות פנטזיה: בקש מ-DALL-E ליצור תמונות של חיות דמיוניות, כמו דרקון עם כנפי פרפר או נחש עם רגליים.
  2. מאכלים מוזרים: בקש מ-DALL-E ליצור תמונות של מאכלים יוצאי דופן, כמו פיצה שוקולד או המבורגר עם פרוסות אבטיח.
  3. בגדים יוצאי דופן: בקש מ-DALL-E ליצור תמונות של בגדים מוזרים, כגון כובע בצורת מגדל אייפל או נעליים עם כנפיים.
  4. נופים דמיוניים: בקש מ-DALL-E ליצור תמונות של נופי פנטזיה, כגון עיר מרחפת בעננים או יער של פטריות ענק.
  5. אובייקטים היברידיים: בקש מ-DALL-E ליצור תמונות של אובייקטים שהם שילוב של שני דברים שונים, כמו מיטה שנראית כמו ערסל או מכונית עם כנפי ציפורים.
  6. דיוקנאות מפורסמים: בקש מ-DALL-E ליצור תמונות של דיוקנאות מפורסמים שלא קיימים, כמו גרסה חלופית של מרילין מונרו עם קעקועים.
  7. מכוניות עתידניות: בקש מ-DALL-E ליצור תמונות של מכוניות עתידניות, כגון מכונית שיכולה להפוך למטוס או מכונית שיכולה לטוס.
  8. ארכיטקטורת פנטזיה: בקש מ-DALL-E ליצור תמונות של ארכיטקטורת פנטזיה, כגון גורד שחקים בצורת דרקון או בית שנראה כמו עץ.

הרעיונות האלה הם רק הצעות כדי לתת לך מושג מה DALL-E יכול לעשות. ישנם אלפי רעיונות תמונה אחרים שאתה יכול ליצור עם תבנית AI זו.

לכל AI יש סגנון משלו

בעזרת רשימה זו, בואו נראה יחד כיצד ליצור את התמונות שלנו, ואיזו מהתוכנות השונות שנבחרו עושה את הטוב ביותר.

קראו גם:  הגירה חדשה forum phpBB 2.0.x כדי phpBB 3.1!

לתמונה הראשונה שלנו בחרנו לייצג את הדרקון עם כנפי פרפר. כדי להוסיף קצת הקשר, אנחנו גם מבקשים שזה יתואר ב"יער פנטזיה מהאגדות". בהתאם ל-IAs, שפת הבקשה יכולה להשפיע על התוצאה. אז מצאנו את זה במהירות עבור DALL-E ו-Stable Diffusion אנגלית הייתה השפה שהעניקה את התוצאות הטובות ביותר. לעומת זאת, אפליקציית הטקסט לתמונה של Canva בדרך כלל עובדת טוב יותר בצרפתית.

1. DALL-E יצר תמונות של דרקון בעל כנפי פרפר

2. דרקונים שנוצרו על ידי דיפוזיה יציבה

3. ולבסוף את זה שבחרנו לשמור עבור הכלי Canva

הדבר הראשון שאנו יכולים לראות מהר מאוד: עבור אותה בקשה, לכל AI יש את הסגנון שלו!

  • ל-DALL-E יש צד "דמיוני", למרות שיער "אגדות" מעט חשוך לפיות, כנפי הפרפר מיוצגות היטב ומסודרות. זה בסגנון אומנות דיגיטלית.
  • ב-Stable Diffusion הסגנון יותר "שמח", קצת ילדותי. אנו מדמיינים היטב את התמונות הללו הממחישות סיפור לילדים. כאן הדרקונים נראים בבירור ומזכירים את סין, שהיא הסמל שלה. מצד שני, הבינה המלאכותית הסתירה לחלוטין את כנפי הפרפר ובחרה בפתרון הקל בכך שגרמה לפרפרים אמיתיים להופיע לצד הדרקונים שלנו.
  • לבסוף עבור כלי Canva, בחרנו את התמונה היחידה המתאימה לבקשתנו מתוך הבחירה. עם זאת, שני האלמנטים (דרקון וכנפיים נמצאים כאן). בעוד שכל התמונות הן בנושא ואפשרות לפעולה, Canva עושה את הטוב ביותר בביצוע נאמנה של הבקשה ולכן זוכה כאן בנקודה ראשונה.

מהן אפשרויות הסגנון האמנותי של התמונה המבוקשת?

אם לא מתבקשים פרטים על סגנון האמנות, אזי ה-AI יבחרו אותם עבורכם כמו בדוגמה של הדרקונים.

עם זאת, ב-Dall-e למשל, ניתן להגדיר את הסגנונות הבאים:

  • ציור שמן : Dall-e יכול ליצור ציורי שמן מתיאור הצבעים והמרקמים שאתה רוצה לראות בציור.
  • צילום : Dall-e יכול ליצור תמונות על סמך הצבעים, המרקמים והפרטים שאתה רוצה לראות בתמונה.
  • אמנות דיגיטלית : Dall-e יכול לייצר יצירות אמנות דיגיטליות מתבנית שתוכננה מראש או מתיאור הצבעים והפרטים שברצונך לראות ביצירה.
  • אמנות מופשטת : Dall-e יכול לייצר עבודות מופשטות המבוססות על התנועות, הצבעים והצורות שתרצו לראות ביצירה.
  • דסין : Dall-e יכול ליצור עיצובים המבוססים על הצבעים והצורות שאתה רוצה לראות בעיצוב.
  • אמנות וקטורית : Dall-e יכול ליצור תמונות וקטוריות מתבנית מוגדרת מראש או מתיאור הצבעים והפרטים שברצונך לראות בתמונה.

הדוגמאות של דרקון נעשו אפריורית בסגנון אמנות דיגיטלית. הסגנון ישפיע מאוד על התמונה הסופית שנוצרת.

חזק יותר, אפשר לבקש סגנונות של כמה אמנים מפורסמים. אז יצרנו צ'אט בסגנון פיקאסו, ואן גוך ודאלי ! והתוצאות... מדהימות למדי!

החתול המצויר בבינה מלאכותית שלנו בסגנונות של 3 אומני ציור גדולים

  1. חתול בסגנון פיקאסו
  2. חתול בסגנון ואן גוך
  3. חתול בסגנון דאלי

עדיף, אז ביקשנו " חתול בסגנון פיקאסו ודאלי ואן גוך וקיבלנו את זה:

גם אנחנו ביקשנו "חזיר בסגנון פיקאסו" והתוצאה הייתה מרשימה באותה מידה, אם לא יותר...

בינה מלאכותית צפויה (יעשה) מהפכה בתחום האמנות והאינטרנט בשנים הקרובות, מה שכבר קורה עם NFTs ספקולטיביים.

קראו גם:  מיל משפטי: נתונים משפטיים חשמל ממקורות מתחדשים באירופה

אנו מבינים את חוסר אמון באנשי מקצוע של אמנות מול AIs אמנותיים אלה, הפחדים שלהם זהים לאלה של פרסום ויצירה ספרותית מול צ'אטבוטים כמו ChatGPT! הם צודקים, כל החששות הללו, לדעתנו, מוצדקים!

מהן השיטות השונות לבקש יצירת תמונה עם Dall-e?

ניתן להשתמש במספר שיטות לציון יצירת תמונה עם Dalle-e, כולל שיטות גרפיות לתוצאה מהירה יותר התואמת לצרכים שלך:

  • יצירת תמונות ממילות מפתח : אתה יכול להזין מילת מפתח ו-Dall-e יפיק תמונה על סמך מילות המפתח שהזנת.
  • הפקת תמונות ממשפטים : אתה יכול להזין משפט שלם ו-Dall-e יפיק תמונה על סמך המשפט שהזנת.
  • הפקת תמונות מתיאורי תמונות : Dall-e יכול ליצור תמונות מתיאור מפורט של הצבעים, הצורות והאובייקטים שאתה רוצה לראות בתמונה.
  • הפקת תמונות מסצנות : Dall-e יכול ליצור תמונות תלת מימד מתיאור מלא של סצנה.
  • יצירת תמונות מדפוסים : Dall-e יכול ליצור תמונות מתבניות שאתה מזין.
  • יצירת תמונות מתבניות : אתה יכול לספק ל-Dall-e תבנית מוגדרת מראש והיא תפיק תמונות על סמך התבנית שסיפקת.
  • יצירת תמונות מרצפים מונפשים : Dall-e יכול ליצור רצפים מונפשים מתיאור התנועות, הצבעים והצלילים שאתה רוצה לראות ברצף.

תמונות מציאותיות אך בלתי סבירות

לאחר מכן ביקשנו ממחוללי ה-AI שלנו לצייר אותנו סלט עם עיניים : שני אלמנטים שבמבט ראשון לא הולכים ביחד. אולם בשלב זה, 3 הגנרטורים שלנו עברו ללא כל קושי ניכר.

1. ארבעת התמונות, של סלט עם עיניים, שהוצעו על ידי DALL-E

2. שתי התמונות המתאימות לבקשתנו שנוצרה על ידי Stable Diffusion

3. ושתי התמונות המתאימות לכלי Canva

גם כאן, לכל תמונה יש סגנון משלה, אבל מה שמרשים במיוחד הוא הריאליזם של התמונות השונות: ה-AI השתמשו בסגנון הצילום.

אנו מזהים מאכלים היטב, עד כדי כך שאולי נרצה לשחזר את הרעיונות השונים המוצעים במטבח. אם Canva בולטת במקוריות שלה בכך שהיא מציעה בכל זאת תמונה עם השראות "אמוטייקון", זה כאן DALL-E שזוכה בנקודה עם ארבע תמונות שונות והכל בנושא המבוקש.

בין הפלופים של Stable Diffusion, לאחת התמונות עדיין שווה לחזור אליה

ואכן, על תמונה זו שנמחקה מכיוון שהיא אינה כוללת עיניים, אנו רואים מצד שני את המאמץ של הריאליזם של ה-AI בייצוג תוכנית העבודה.

ה-AI שלנו אכן מסוגלים לקשר את המילה "סלט" לסביבה המקבילה. זה כבר היה המקרה בתמונות למעלה עם הייצוג של צלחות, מזלגות ואלמנטים נוספים הקשורים לתחום הקולינרי.

פלופים שעדיין נשארים רגילים

למרות היעילות הכללית שלהם, ה-AI שלנו עדיין מייצרים כמות טובה דימויים בינוניים ושגויים רואים לגמרי לא בקצב הביקוש. זה היה המקרה שלנו כובע בצורת מגדל אייפל.

DALL-E מנצח את הנקודה עם התמונה היחידה שלו שמתקרבת לבקשתנו: כובע לבן, מעליו מגדל מיניאטורי שהיינו מדמיינים בצורה מושלמת על ראש ז'נב דה פונטנאי !

מלבד הצחקוק הקטן הזה שהציעה ה-AI של Open AI, התמונות האחרות היו מציאותיות מדי, פשוט ייצגו את אחד האלמנטים תוך הסתרת הצד השני:

בתמונה הראשונה Stable Diffusion מייצגת את המגדל, בעוד שבתמונה השנייה בחרה DALL-E לשלוח לנו ערימה של כובעים, מה שמטשטש גם את החלק השני של בקשתנו.

או שהייתה להם הבנה שגויה של הבקשה כמו בשתי התמונות האלה שבהן DALL-E מייצג דווקא פסלונים למזכרת של מגדל אייפל:

קראו גם:  Ma-Bonne-Action.com, שיווק סולידריות, הומניטרי וצדק

לבסוף, חלק מהתמונות הן לפעמים לא אופטימיות לחלוטין, כפי שהיה במקרה של תמונה זו שאמורה לייצג "אדם מדמיונה של IA Stable Diffusion" אשר אז בחר להוסיף באופן ספונטני ציטוט בשפה לא ידועה...קרוב מאנגלית...

רגישות שלפעמים משתנה מילה למילה

על ידי ביצוע הבדיקות, אנו מבינים במהירות שלעיתים די ב-AI שלנו כדי לתקן את המצב במקרה של תוצאות לא מספקות. אז כשאנו שואלים את הבינה המלאכותית שלנו בפעם הראשונה "עיר צפה בשמים מעוננים" על ידי בחירת התמונה הטובה ביותר עבור כל אחת מהן, אנו מקבלים את התוצאה הבאה:

בהתאמה מלמעלה למטה, התוצאות של Stable Diffusion, DALL-E ו-Canva

תמונות יפות מאוד, אך אינן באמת משקפות את הקונוטציה ה"לא אמיתית" של הבקשה שלנו המובנת לבני אדם אך כנראה לא על ידי המחוללים שלנו. כל מה שצריך הוא שינוי עדין בביקוש כדי לקבל תוצאות שונות לחלוטין.

אז עם המשפט "עיר פנטסטית מרחפת בשמים מעוננים" נקבל הפעם:

1. דימויים הרבה יותר דמיוניים מ-DALL-E

2. ערים די פנטסטיות מאוד מ-Stable Diffusion שעם זאת משמיט לחלוטין את החלק של "צף בשמיים מעוננים"

3. כמה סצנות שיכולות להילקח ממשחק וידאו (Minecraft או Lego Worlds למשל) על ידי Canva

כאן נוכל להעניק נקודה ל-DALL-E ול-Canva, ששניהם הצליחו, באמצעות אחת או אחרת מהבקשות שלנו, לגרום לעיר שלנו לצוף בעננים.

אבל אז, איזה עתיד לדור התמונות?

מול פתרון שעובד די טוב בסך הכל, אפשר לתהות מה עשויים להיות השימושים העתידיים של יצירת תמונות על ידי בינה מלאכותית. כמובן שמפתה לצטט כאן את יצירת הכשלים באינטרנט, אל תהססו לבוא פרסם אצלנו forum כאלה שאולי כבר נתקלת בהם באינטרנט.

אבל אנחנו יכולים גם לדמיין שימושים רציניים יותר. לפיכך התוצאות שהושגו על ידי בקשת הכלי Canva ליצור תמונה של "עץ שהוא למעשה בית" יכולות בקלות לתת רעיונות לאדריכל האחראי על יצירת בתי גידול שיכולים להשתלב בטבע!

אבל אז, מי משלושת מחוללי התמונות שלנו עושה הכי טוב?

עבור העץ שיהיה גם בית, אנו נותנים נקודה בקלות לכל כלי!

דוגמאות לתמונות שהוצעו בהתאמה על ידי DALL-E, Stable Diffusion ואז הכלי Canva

המכונית עם כנפי הציפור אתגרה את כל ה-AI שלנו, אבל המכונית שיכולה לעוף אפשרה ל-Canva ול-Stable Diffusion להתבלט עם כמה עיבודים עתידניים די מציאותיים:

בהתאמה דיפוזיה יציבה מלמעלה וקנבה מלמטה.

לבסוף DALL-E הוכיח את עצמו כיעיל למדי בניין בצורת דרקון (שנשאר בבנייה, עם זאת), וקנבה הצליחה לענות בצורה הטובה ביותר על הבקשה לדיוקן ששינינו במידת מה על ידי החלפת הידוען ב"אדם מדמיונו של הבינה המלאכותית".

למרות כמה אלמנטים המצביעים על יצירת התמונה מאחורי שני דיוקנאות Canva, הריאליזם עדיין בולט.

בספירה הסופית, אלה הם אפוא הכלי של DALL-E ושל Canva שזוכים בהתאמה ל-5 נקודות כל אחד.

בדרך כלל הם מסוגלים לספק תוצאות בהתאם לרוב בקשות המשתמשים.

Canva בולט בריאליזם שלו בעוד ש-DALL-E נראה רלוונטי יותר ברגע שהבקשה דורשת דמיון או תחום הציור.

עם זאת, למרות 2 נקודות בלבד, Stable Diffusion לא נכשל באיכות התמונה שהיא מסוגלת לספק! החיסרון טמון בהבנתו את בקשות המשתמשים מכיוון שלעתים קרובות הוא נוטה להישאר מאוד ארצי. עם זאת, זה נשאר מאוד מעניין לגלות גם כן.

בכל מקרה, אנו יכולים לצפות בשנים הקרובות לראות את הבינה המלאכותית מחוללת מהפכה במגזרי פעילות רבים. ובוודאי מהר יותר ממה שחלק חושבים מאז ספרים שנכתבו, בחלקם או במלואם, על ידי AIs כבר מוצעים למכירה באמזון...דיווח הסרטון הקצר הזה מ-BFMTV דיבר על זה לפני כמה ימים:

לכל הערה או שאלה, בקר בנושא של forum מוקדש ל-AI.

השאירו תגובה

כתובת הדוא"ל שלך לא תפורסם. שדות חובה מסומנים *