גוגל מציעה מערכי מטא-נתונים בחינם עם מעט למידה עמוקה של AI ואלגוריתמים של למידת מכונה למיון תמונות מהיר ויעיל ב- TensorFlow ו- PyTorch

טק / גוגל מציעה מערכי מטא-נתונים בחינם עם מעט למידה עמוקה של AI ואלגוריתמים של למידת מכונה למיון תמונות מהיר ויעיל ב- TensorFlow ו- PyTorch קריאה של 2 דקות

גוגל פיקסל 5?



לגוגל יש הודיעה על זמינותם של מערכי נתונים מרובים המורכב מתמונות טבעיות מגוונות אך מוגבלות. ענקית החיפוש בטוחה שהנתונים הזמינים לציבור יניעו את הקצב של למידת מכונה ובינה מלאכותית תוך צמצום הזמן שנדרש להכשרת דגמי ה- AI בכמות מינימלית של נתונים. גוגל מכנה את היוזמה החדשה 'מערכי מטא-נתונים חופשיים' שיעזרו למודלים של AI 'ללמוד' על פחות נתונים. ה- 'Few-Shot AI' של החברה מותאם בכדי להבטיח ש- AI ילמד שיעורים חדשים מכמה תמונות מייצגות בלבד.

מתוך הבנה של הצורך להכשיר במהירות מודלים של AI ו- Machine Learning עם פחות מערכי נתונים, גוגל השיקה את 'Meta-Dataset', אוסף קטן של תמונות שאמור לעזור להפחית את כמות הנתונים הדרושה לשיפור דיוק האלגוריתמים. החברה טוענת כי שימוש בטכניקות סיווג תמונות מעטות, דגמי ה- AI וה- ML יזכו לאותן תובנות מהרבה פחות תמונות מייצגות.



גוגל AI מכריזה על מטא נתונים: מערך נתונים של מערכי נתונים למידה מועטה:

למידה עמוקה עבור AI ו- Machine Learning צומחת באופן אקספונאלי מזה זמן רב. עם זאת, דרישת הליבה היא זמינות נתונים איכותיים וגם זה בכמויות גדולות. את הכמויות הגדולות של נתוני האימון המסומנים באופן ידני קשה לעתים קרובות להשיג ולעיתים הם גם לא אמינים. בהבנת הסיכונים של מערכי נתונים גדולים, גוגל הודיעה על זמינותו של אוסף של מטה-נתונים.



דרך ' Meta-Dataset: מערך נתונים של מערכי נתונים ללימוד ללמוד ממעט דוגמאות '(הוצג ב כיל 2020 ), גוגל הציעה אמת מידה רחבת היקף ומגוונת למדידת הכשירות של מודלים שונים של סיווג תמונות בסביבה מעט ריאלית ומאתגרת, ומציעה מסגרת בה ניתן לחקור כמה היבטים חשובים של סיווג מעט תמונות. בעיקרו של דבר, גוגל מציעה 10 זמינות לציבור ובחינם להשתמש בערכות נתונים של תמונות טבעיות. מערכי נתונים אלה כוללים ImageNet, CUB-200-2011, Fungi, דמויות בכתב יד ושרבוטים. הקוד הוא פּוּמְבֵּי וכולל א מחברת המדגים כיצד ניתן להשתמש ב- Meta-Dataset TensorFlow ו PyTorch .



סיווג מעט זריקות חורג מה- מודלים להכשרה רגילה ולמידה עמוקה . נדרשת הכללה לשיעורים חדשים לחלוטין בזמן המבחן. במילים אחרות, התמונות ששימשו במהלך הבדיקה לא נראו באימונים. בסיווג של כמה זריקות, מערך האימונים מכיל שיעורים המופרדים לחלוטין מאלו שיופיעו בזמן המבחן. כל משימת בדיקה מכילה סט תמיכה של כמה תמונות שכותרתו מהן יכול המודל ללמוד על הכיתות החדשות ועל הפרדה ערכת שאילתות דוגמאות שהמודל מתבקש לסווג אחר כך.

מערך נתונים מטא הוא מרכיב גדול שבו המודל לומד הכללה למערכי נתונים חדשים לחלוטין , שממנו לא נראו אימונים מכל כיתה באימונים. זאת בנוסף לאתגר ההכללה הקשה לשיעורים חדשים הטמונים במערך הלמידה המעט.

כיצד מטא-מערך נתונים עוזר ללמידה עמוקה למודלים של AI ולימוד מכונה?

Meta-Dataset מייצג את מידת הסדר המאורגנת בקנה מידה הגדול ביותר לסיווג תמונות צולב-מערך, עם כמה תמונות. הוא מציג גם אלגוריתם דגימה ליצירת משימות בעלות מאפיינים וקושי משתנים, על ידי שינוי מספר הכיתות בכל משימה, מספר הדוגמאות הזמינות בכל כיתה, הכנסת חוסר איזון בכיתות, ולגבי מערכי נתונים שונים, שינוי מידת הדמיון בין שיעורים של כל משימה.



Meta-Dataset אכן מציג אתגרים חדשים לסיווג של כמה זריקות. המחקר של גוגל עדיין ראשוני ויש הרבה אדמות לחיפוי. עם זאת, ענקית החיפוש טענה כי החוקרים חווים הצלחה. חלק מהדוגמאות הבולטות כוללות שימוש בעיצוב חכם מְשִׁימָה הַתנָיָה , יותר מתוחכם כוונון היפר-פרמטר , ל ' מטא-בסיס 'המשלב את היתרונות של אימון מקדים ומטא-למידה, ולבסוף שימוש בחירת תכונות להתמחות בייצוג אוניברסלי לכל משימה.

תגים גוגל