גוגל מדברת על החשיבות של קוד פתוח ונתונים פתוחים בפוסט בבלוג אחרון

טק / גוגל מדברת על החשיבות של קוד פתוח ונתונים פתוחים בפוסט בבלוג אחרון 3 דקות קריאה

גוגל



גוגל כחברה תמיד תמכה בתוכנות קוד פתוח ונתונים, בעמדתם לפחות. זו כמעט מגמה עם חברות גדולות כעת כיוון שגם גוגל וגם מיקרוסופט תרמו תרומות בולטות לסצנת הקוד הפתוח. ' גוגל היא גם תורמת משמעותית לתוכנות קוד פתוח. דוגמאות עיקריות לכך כוללות דְמוּי אָדָם , מערכת ההפעלה של הטלפון החכם שלנו, כְּרוֹם , בסיס הקוד לדפדפן Chrome שלנו (עכשיו גם הכוח של מתחרים רבים ), ו TensorFlow , מערכת למידת המכונה שלנו. המהדורה של גוגל של מושלים שינה אירוח ענן לנצח, ואיפשר חדשנות ותחרות בענף הענן. גוגל היא גם התורמת הגדולה ביותר לקוד קוד פתוח ל- GitHub , מאגר משותף לפיתוח תוכנה. בשנת 2017 גוגלרים ביצעו יותר מ -250,000 שינויים בעשרות אלפי פרויקטים ב- GitHub בלבד. '

ברוב המקרים, זה לא באמת מתוך נדיבות אלא יותר ליהנות מהפיתוח החופשי ואז להרוויח מאימוץ נרחב. בלי קשר, תרומות אלה סייעו לאלפי חוקרים והובילו את פיתוח התוכנה בצורה אחידה, ויש לחגוג אותה. גוגל שפורסמו לאחרונה בבלוג הדגישו את תרומתם לנתונים פתוחים ולתוכנות קוד פתוח.



עם כניסתו של מעקב בזמן אמת ופיתוח מכוניות ללא נהג, נערכים מחקרים רבים בראייה ממוחשבת וגוגל היא אחת החברות בחזית Visual Tech.



המחויבות שלנו לקוד פתוח ולנתונים פתוחים הובילה אותנו לשתף מערכי נתונים, שירותים ותוכנות עם כולם. לדוגמה, גוגל שחררה את פתח את מערך תמונות של 36.5 מיליון תמונות המכילות כמעט 20,000 קטגוריות של חפצים עם תווית אנושית. בעזרת נתונים אלה, חוקרי ראיית מחשב יכולים להכשיר מערכות לזיהוי תמונות. באופן דומה, מיליוני הסרטונים המבוארים ב YouTube-8M ניתן להשתמש באוסף לאימון זיהוי וידאו.



- דבר משתנה

כלכלן ראשי, גוגל

גוגל יושבת גם על הרבה נתונים שיכולים לעזור במחקר NLP ולעזור למחשבים להבין טוב יותר את הדיבור האנושי. בפוסט בבלוג, גוגל הדגישה את השיתוף של מסד נתונים מרכזי המציין ' ביחס לעיבוד שפה, חלקנו את שאלות טבעיות מסד נתונים המכיל 307,373 שאלות ותשובות שנוצרו על ידי בני אדם. הענקנו גם את טריליון מילים קורפוס , המבוסס על מילים המשמשות בדפי אינטרנט ציבוריים, ועל Ngram Viewer , שניתן להשתמש בהם כדי לחקור את למעלה מ- 25 מיליון הספרים ספרי גוגל . ניתן להשתמש באוספים אלה תרגום מכונה סטטיסטי , זיהוי דיבור, תיקון איות , איתור ישויות, שאיבת מידע ומחקרי שפה אחרים. '



מנוע החיפוש הוא אחד מעסקי הליבה של גוגל, שמקבל מעל 63,000 שאילתות בכל שנייה. נתונים אלו חשובים מאוד עבור החברה וגוגל מנתחת נתונים אלה לצורך פרסום ממוקד. ובכל זאת, כמה תובנות לגבי הנתונים הכוללים מתפרסמות בפורטל המגמות של גוגל.

' גם גוגל מציעה מגמות גוגל , שירות בחינם המאפשר לכל אחד לראות ולהוריד פעילות חיפוש מצטברת מאז 2004 עבור חיפוש Google, חיפוש תמונות, חיפוש חדשות, קניות ו- YouTube. ניתן לקבל מידע על חיפוש עבור מדינות, אזורים, אזורי מטרו וערים על בסיס חודשי, שבועי, יומי ואפילו לפי שעה. נתוני המגמות נמצאים בשימוש נרחב על ידי חוקרים בתחומים מגוונים כמו רפואה וכלכלה. על פי Google Scholar, יש כאלה יותר מ -21,000 עבודות מחקר שמצטטים את המגמות כמקור נתונים. '

מדוע לעבוד על פרויקטים של קוד פתוח?

דיברתי על זה בקצרה בתחילת המאמר. פיסת תוכנה חדשה יכולה ליישם רעיון נהדר ולחדש את המרחב אך זה לא מונע מאחרים ליישם רעיונות דומים ואז לעבוד על מנת להפוך אותו לטוב יותר. חברות רבות למדו את זה בדרך הקשה, למשל, Windows Phone. כידוע זה היה כישלון מהדהד ומסיבות רבות אך קיום של סביבה סגורה ושליטה ברישוי היה חלק גדול מזה. Hardoop ו- HDFS היו גרסאות קודמות של MapReduce שנבנו על ידי גוגל והחברה למדה את החשיבות של קוד פתוח בשלב מוקדם. לסיכום, ההחלטה להכין קוד פתוח של IP היא החלטה אסטרטגית.

גוגל בפוסט בבלוג שלה מתעמקת בכמה סיבות אחרות ואומרת ' בראש ובראשונה, המשימה העיקרית שלנו היא 'לארגן את המידע העולמי ולהפוך אותו לנגיש ושימושי באופן כללי.' אין ספק שדרך אחת ברורה להפוך מידע לנגיש ושימושי באופן כללי היא למסור אותו ! '

הם גם מדברים על למה הם לא יכולים לשחרר כמה דברים שאומרים ' כמובן, איננו יכולים לפרסם את כל הנתונים בהם אנו משתמשים בעסק שלנו. עלינו להגן על פרטיות המשתמשים, לשמור על סודיות ללקוחות עסקיים ולהגן על הקניין הרוחני של גוגל עצמו. אך, בכפוף לשיקולים כאלה, אנו מנסים בדרך כלל להפוך את הנתונים שלנו ל'נגישים ושימושיים אוניברסאליים 'ככל האפשר. '

תגים גוגל