גרף המידע Knowledge Graph של גוגל - המוח ה-2 של מנוע החיפוש
המומחים של SEOweb מסבירים על גרף המידע Knowledge Graph של גוגל - המוח ה-2 של מנוע החיפוש...
גרף המידע Knowledge Graph של גוגל - המוח ה-2 של מנוע החיפוש



03-5446364



הכירו את גרף המידע של גוגל

Hebrew

כולנו משתמשים במנוע החיפוש של גוגל בכל יום אבל לא כולם שמו לב לעובדה שממש בימים אלה מנוע החיפוש נמצא במהלך שינוי בהליכי החשיבה שלו. לפי איך שזה נראה, השינוי שבעיצומו יביא למהפכה חיובית בתוצאות החיפוש המוכרות לכולנו ולמהפכה מקוונת גדולה ורחבה הרבה יותר - מעבר לעולם החיפוש.

עד לאחרונה, בגלגול הקודם, ניתן היה לתאר את גוגל כמומחה רב ידע בתחום הסטטיסטיקה. לא רק שמנוע החיפוש אינדקס מאות מיליארדי עמודי אינטרנט שונים לפי ביטויי מפתח, הוא גם פיתח כישורים מורכבים ומרשימים כמו זיהוי שמות נפוצים, תיקון שגיאות כתיב באין ספור שפות, וניתוח סמנטי של משפטים מורכבים.

כל אלה פותחו ופועלים עד היום באמצעות נוסחאות מתמטיות מורכבות, המבוססות בין השאר על הידע העצום של גוגל לגבי אופי החיפוש של כולנו. ניתן להבין זאת טוב יותר אם חושבים על כמויות המידע שגוגל שומר על מגוון החיפושים שהגולשים מבצעים מדי יום ביומו והתוצאות שעליהן הם מקליקים משחר ההיסטוריה הגוגליסטית. די הרבה מידע.

עד לאחרונה, הכל התבצע בצורה די קרה ומתמטית, ללא הבנה אמיתית של "מאחורי הדברים". מנוע החיפוש לא ידע כי תל אביב היא עיר ואילו הפועל תל אביב היא קבוצת כדורגל בעיר לדוגמא. אבל לא עוד. התקופה הזאת מאחורינו והדברים משתנים ומהר.

כיום, כשמחפשים ביטוי מסויים בגוגל מתבצע חיפוש אחד עם שני מוחות הפועלים במקביל. החיפוש הראשון בודק ומביא תוצאות מתמטיות מתוך המאגר העצום של עמודי האינטרנט שגוגל מכיר, ממש כמו שהיה עד היום, תוך שהוא מדרג אותן בשיטה המסורתית שכולנו מכירים – 10 קישורים לתוצאות חיפוש בכל עמוד.

המוח השני בודק במאגר מידע חדש של גוגל המכיל שמות, הקשרים ויחסי גומלין. המוח השני הוא זה שאחראי לגרף המידע של גוגל, או Knowledge Graph המוצג מצד מימין לתוצאות החיפוש של גוגל דוט קום (באנגלית) ובעתיד הקרוב יוצג גם בגוגל ישראל, משמאל לתוצאות החיפוש.

בגוגל מתארים את גרף המידע ככזה שאמור "להבין הקשרים ולא קישורים". אם תחפשו בגוגל דוט קום את החיפוש פילדלפיה לדוגמא (באנגלית כמובן) המוח השני יציג חלונית מידע לצד תוצאות החיפוש הסטנדרטיות, שבה יופיעו מפה של העיר ומידע בסיסי אודותיה. כמו כן תוצג לכם צלמית של הסרט המפורסם בכיכובו של תום הנקס הנושא את אותו השם.

בגוגל דוט קום החלו לצפות בתוצאות החיפוש החדשות, בליווי גרף המידע בסביבות חודש מאי 2012 ובשבוע החולף (4 לדצמבר 2012) החל גרף המידע לתת אותותיו גם עבור חיפושים בספרדית, צרפתית, גרמנית, פורטוגזית, יפנית, רוסית ואיטלקית. בקרוב גם אצלנו!

אמנם 2012 אבל הרעיון לפתח את גרף המידע הגיח לאוויר העולם במהלך שנת 2010 עת גוגל רכשה סטארטאפ מבטיח מתחום החיפוש בשם Metaweb טכנולוגיות. ענקית החיפוש החליטה להשתמש ולפתח את מאגר המידע הסמנטי העצום של החברה (מוכר בשם Freebase) כליבה של פרוייקט שכבר החל ובגוגל ומטרתו היתה להעריך איך בני האדם רואים ותופסים את העולם.

חשוב להדגיש כי אין כל התנגשות או סתירה בין ניתוח מאגר המידע הסמנטי לבין תוצאות החיפוש המתמטיות, שלהן הורגלנו במשך שנים. מאגר המידע הסמנטי, שמפעיל את "המוח השני" של גוגל, הוא כמו אינציקלופדיה עצומה של עובדות בדוקות לגבי העולם שאנו חיים בתוכו והיחסים בין כל אותן עובדות. המדובר על מאגר של כמעט 600 מיליון עובדות וקרוב ל-4 מיליארד יחסים בין אותן עובדות.

לדוגמא: המוח השני של גוגל יודע לעשות את האבחנה כי ירושלים היא עיר, בירת ישראל, יש בה כך וכך תושבים, הפילוח הדמוגרפי הו כזה וכזה, מזג האויר הממוצע בעיר הוא כזה, העיר העתיקה, ההיסטורי וכו...

אמנם תיבת הידע שמוצגת לצד תוצאות החיפוש של גוגל היא התוצר הוויזואלי של גרף המידע, אולם היכולת לנתח ולהבין הקשרים מסייעת לגוגל לעשות סדר והיגיון בהרבה תחומים אחרים (פרסום למשל).

רבים רואים בפיתוח זה צעד נוסף לעבר בינה מלאכותית או AI. זה אולי קצת מרחיק לכת אבל אין בכלל ספק שגרף המידע של גוגל הוא העתיד בכל הנוגע לחיפוש וגם הרבה מעבר לכך.

גרף המידע יביא למצב שבו התוכנה (גוגל במקרה הזה) תדע לחזות בצורה טובה את הרצון שלנו. וההסבר במילים אחרות: זוכרים את הכפתור "יותר מזל משכל" מתחת לחלונית החיפוש בדף הבית של גוגל?

הוא יהיה כפתור החיפוש היחיד שנצטרך ללחוץ עליו. תוצאות החיפוש הנכונות יוצגו מיד, תמיד הכי מדוייקות והכי רלוונטיות עבורך. זה העתיד לפי גוגל.

גם העמדה הרשמית של מהנדסי גוגל תומכת בגישה זאת בהכרזות רשמיות כמו: "הבנת הכוונה היא אבן יסוד לבניית החיפוש של המחר" (עמית סינגהל). לארי פייג' אומר בראיון למגזין פורצ'ן כי הוא שואף לשינוי הזה במהלך 10 השנים האחרונות.

לפי הדברים של פייג' מנוע החיפוש המושלם יבין בדיוק מהו הצורך האמיתי של כל אחד מאיתנו. מנוע החיפוש יכיר את העולם ומערכת החיים שלנו לעומקם, ויחזיר לנו תוצאות חיפוש שייענו בדיוק לצרכים שלנו.

גרף המידע ישנה את העולם המקוון!

צריך לזכור ולא לשכוח כי גוגל זה לא רק מנוע חיפוש. זוהי חברה שגרפה מעל 37 מיליארד דולר בהכנסות מפרסום רק בשנה החולפת. גוגל היא האמא של כרום והאבא של יוטיוב, בנוסף לכך שהיא מספקת שירותי אחסון ענן בשירותים כמו ג'ימייל וגוגל דרייב. ואם מישהו שכח גם אנדרואיד זה גוגל וכמובן שיש רשת חברתית בשם גוגל+...

אין בכלל ספק כי מנוע חיפוש שיבין את הכוונה והציפיות שלנו טוב יותר (ואולי בצורה קרובה למושלמת) יביא לשינוי משמעותי בתפקודה של האימפריה הגוגליסטית. מתי נראה שינויים מהותיים? קשה להצביע על נקודה מדוייקת אבל אין ספק שגרף המידע כבר החל להשפיע על כולנו. צריך לזכור כי בגוגל אוהבים לנסות וללמוד איך הגולשים מגיבים לפני שינויים גדולים.

ואין בכלל ספק כי יישומה של טכנולוגיית המוח השני או גרף המידע של גוגל יצרו מהפכה בתחום החיפוש. לפי התחזיות והקולות הספורים שמתייחסים לעתיד החיפוש מבין המהנדסים של גוגל, נשמעים קולות שמגדירים את השינוי העתיד לבוא כבעל השפעה אסטרטגית גדולה ביותר.

מאז ומתמיד וגם היום החיפוש בגוגל הוא תלוי ביטוי מפתח (המילים שעבורם מתבצע החיפוש) הרי שבעתיד תוצאות החיפוש יותאמו לכוונה המילולית ולרעיונות שלנו בצורה אופטימאלית. לאורך השנים מנוע החיפוש הבין מתוך החיפוש שביצענו מהן המילים העיקריות והחשובות, והתאים עבור המחפשים את עמודי האינטרנט שבהם הופיעו אותן "מילים עיקריות" או ביטויי מפתח לפי מאות קריטריונים, שהם למעשה הבסיס לכל פרוייקט קידום אתרים מקצועי.

גם מנועי חיפוש כמו בינג, יאהו, יאנדקס, באיידו ואחרים פועלים בשיטה דומה ותוצאות החיפוש שלהם תלויה לחלוטין בביטוי החיפוש שלנו. אנשי מקצוע מתחום ה-SEO וכמובן שגם טובי המוחות שעוסקים בפיתוח מנועי החיפוש מבינים לאורך השנים כי המגמה בשוק ברורה: להתקרב ככל שניתן להבנת מוח האדם.

אחת הסנוניות הראשונות שהופיעו בתוצאות החיפוש של גוגל, כשנה לפני הופעתו של גרף המידע, היה גוגל אינסטנט או Google instant (מאחר להגיע לישראל) שמחזיר תוצאות חיפוש המשתנות בהתאם להתקדמות ההקלדה שלך המחפש, בתיבת החיפוש של גוגל. אינסטנט למעשה מציג למחפש תוצאות מיד לאחר הקלדת 2-3 אותיות ראשונות מהשאילתה הרלוונטית.

השירות חוזה תוך אלפיות שנייה לאן יתקדם החיפוש של הגולש, כאשר הוא מתבסס בעיקר על סטטיסטיקה (כפי שכבר כתבנו, בגוגל זוכרים ולומדים מכל החיפושים שאנו מבצעים מדי יום לאורך שנים) ומשנה את התוצאות שמוצגות לפני הגולש. Google instant התקבל בברכה בעולם החיפוש ולמרות שהוא מבוסס לחלוטין על מחרוזות וחישובים מתמטיים, תוצאות החיפוש עבור ביטויים רבים מתאימות ומספקות את צרכי הגולשים באופן מפליא ומכונן.

למרות שתוצאות אינסטנט נראות חכמות הן כושלות בהבנה ובחיזוי כוונתו האמיתית של הגולש. הסיבה לכך נעוצה בבסיס המערכת. סטטיסטיקה אינה מספיקה על מנת להבין את הכוונה האמיתית של המחפש. בואו ניקח לדוגמא חיפוש כמו "טרויה". האם המחפש התכוון לאלה מהמיתולוגיה היוונית, לסרט הקולנוע המצליח או אולי למסעדה או גן אירועים בשם זה? הסטטיסטיקה לא יכולה לעזור לנו להבין איזו תוצאת חיפוש חשובה יותר לגולש ספציפי. זה פשוט לא מספיק.

המהנדסים של גוגל הבינו כי המוח הסטטיסטי של גוגל הגיע לקצה גבול היכולות שלו, בכל הנוגע להצגת תוצאות חיפוש אופטימאליות למחפשים. בגוגל הבינו כי אין ברירה אלא להבין ולהכיר כל הקשר של המילה "טרויה" ובשילוב עם פרמטרים נוספים (כמו מיקום גיאוגרפי) יתאפשר למנוע החיפוש לנחש טוב יותר איזה "טרויה" מחפש הגולש הספציפי. כאן בדיוק נכנסת לתמונה חברת Metaweb שגוגל רכשה.

המטרה המוצהרת של החברה, עוד בטרם נרכשה על ידי גוגל, היתה ליצור "אינציקלופדיה קריאה למחשבים" על מנת לאפשר למחשב להכיר טוב יותר את הלכות המחשבה וההתנהגות האנושית. מאגר המידע (הרעיונות) של החברה נקרא Freebase ובעת שגוגל רכשה את החברה היו בו "רק" 12 מיליון ערכים. מאגר המידע הזה נמצא בשימוש עד היום, כשהוא גדל ומתפתח בקצב מסחרר, בהכרת הסביבה ושגרת החיים שלנו – בני האדם.

המאגר החופשי או Freebase פתוח לכלל הציבור, וכל אחד יכול להרשם ולהוסיף נתונים למאגר שבשליטת גוגל. למעשה, גם מיקרוסופט עושה שימוש במאגר על מנת לשפר את תוצאות החיפוש של בינג בדרך דומה לתיאור הנ"ל.

בניגוד למאגרי מידע אחרים, מאגר במידע של פריבייס אינו בנוי מטבלאות רגילות, כי אם באמצעות גרפים סמנטיים שאינם מגבילים את כמות ההקשרים האפשריים בין נושא אחד למשנהו, הגם שהקשרים אלה מתווספים גם שנים לאחר שערך מסויים הוגדר לאחרונה. כשגוגל רכשה את Metaweb בשנת 2010 החברה הספיקה לעדכן את ה-freebase במשך 5 שנים ברציפות.

החיבור בין גוגל ל-Metaweb היה מושלם. הסטארטאפ המהפכני קיבל את האפשרות הנדירה להבין מה אנשים מחפשים (כי גוגל מחזיקה במידע זה כאמור) וכך להמשיך לפתח את Freebase בהתאם "למה שמעניין אנשים" וגוגל מצידה, קיבלה את האפשרות להשתמש בטכנולוגיה חדשנית שתסייע לה לפתח את המוח השני שלי. העתיד של תוצאות החיפוש.

Freebase הכפיל את מספר הערכים המופיעים במאגר
מאז שנרכש על ידי גוגל, מ-12 מיליון ערכים בשנת 2012 ל-24 מיליון ערכים נכון להיום. גרף המידע של גוגל השתפר בזכות Freebase אבל צמח בקצב מהיר הרבה ביותר מאז שהחל לפעול לפני פחות משלוש שנים. למעשה Knowledge Graph מכיל כיום מעל חצי מיליארד ערכים שונים וממשיך לגדול ולהתרחב במהירות רבה ביותר.

קצב הגדילה המסחרר של גרף המידע תלוי ומושפע באופן ישיר מכמויות המידע העצומות שנמצאות במאגר המידע המתחדש תדיר של גוגל. מפות, תמונות וכמובן מיליארדי חיפושים כמעט בכל שפה מדוברת. גרף המידע של גוגל גדול בערך פי 40 מוויקיפדיה, ובניגוד לאינציקלופדיה החופשית, לא כל פיסת מידע עוברת בחינה אנושית ולמעשה רוב המידע נבדק על ידי אלגוריתם משוכלל שפותח על ידי המהנדסים של Metaweb בשיתוף עם עמיתיהם בגוגל (עובדה המקלה מאד ומסבירה את היכולות לגדול במהירות עצומה).

שיטת העבודה של גרף המידע אומרת כי ככל שיהיו יותר הקשרים בין הנושאים השונים, כך הסיכוי שגרף המידע יפגע בדיוק לכוונתו של המחפש עולה. האם מאגר מידע שבו מעל 570 מיליון ערכים מספיק או שזוהי רק תחילת הדרך? ובכן, אין בכלל ספק כי 570 מיליון ערכים מהווים מאגר מידע עצום וייחודי. לגוגל אין כל בעיה לעבד, לאחסן או להפעיל מאגר כזה עם כח המחשוב שלה.

השאלה היחידה שקשה לענות עליה היא מתי גרף המידע יכיל מספיק מידע על מנת לאפשר לנו לקבל את התוצאות האופטימליות. למרות שהגרף עדיין לא פועל בגוגל ישראל ובחיפוש בעברית, הנתונים מלמדים כי קצב הפיתוח של הגרף הואט באופן משמעותי בחודשים האחרונים, כנראה לאור העובדה שהוא כבר מכיל את רוב המידע וההקשרים שקיימים בעולם שלנו... מפחיד קצת?

אם חושבים על זה לעומק, ניתן להניח כי אם למאגר הוכנסו כל עבודה שנכתבה אי פעם, כל מוצר, וכל ישוב על פני כדור הארץ, הרי שהמאגר מכסה כבר את רוב הנושאים הגדולים. מאידך, על מנת להיות שימושי ואפקטיבי לאורכה ולרוחבה של האימפריה הגוגליסטית, גרף המידע חייב להיות גדול מספיק עבור כולם. זוהי בדיוק הסיבה שלאורך החודשים האחרונים גוגל עושה מאמץ להשמיש את גרף המידע לשימוש בכמה שיותר מדינות ובכמה שיותר שפות.

תהליך הגלובליזציה מציג לגוגל שתי בעיות עיקריות. הראשונה היא תרגום גרף המידע למגוון שפות רחב. והבעיה השניה היא לוקאליזציה. בגלל ההבדלים במינוחים ובמשמעויות של אותם ביטויים, בין מדינה למדינה ובין אזור לאזור, גרף המידע צריך להבין את הניב המקומי והמשמעות השונה של כל ביטוי חיפוש, בין אם הוא מתבצע מישראל, ביפן או באוסטרליה.

בעיה נוספת של גרף המידע הנה בהצגת המידע עבור כל שאילתה של גולש במנוע החיפוש. איך יודעים איזה מידע להציג ראשון ומה להציג אחר כך, בסדר יורד? ובכן, נכון להיום גרף המידע מציג את המידע לפי סוג השאילתה של הגולש ב-3 דרכים אפשריות.

אם חיפשת מידע שהתוצאה שלו היא חד חד משמעית, התוצאות יוצגו באופן בולט, מעל 10 תוצאות החיפוש האורגניות בעמוד תוצאות החיפוש שמוכר לכולנו. על פי רוב, תוצאות גרף המידע מופיעות מימין לתוצאות החיפוש (באנגלית) בתוך חלונית מידע יעודית, במציגה שפע של מידע חשוב הרלוונטי לשאילתה של הגולש, כולל בין השאר: מילים נרדפות לביטוי החיפוש, תמונות, מפות, תאריכים רלוונטיים, קישורים לנושאים קשורים, צלמיות ועוד. חלונית המידע מוצגת כאשר גרף המידע "כמעט בטוח" למה התכוון הגולש בחיפוש שביצע.

האפשרות השלישית והאחרונה לתצוגת תוצאות החיפוש של גרף המידע (נכון למועד כתיבת שורות אלה) היא קרוסלה של תמונות / צלמיות מתחלפות. הקרוסלה מופיעה במקרים שבהם לשאילתה של הגולש יש מגוון רחב של תוצאות, לדוגמא: "תמונות של ואן גוך", חיפוש שיציג קרוסלה עם צלמיות מוקטנות של מגוון יצירות של האמן ההולנדי, כפי שגרף המידע מכיר.

אין ספק כי בעתיד הקרוב נראה את התוצאות של גרף המידע בדרכים רבות נוספות, כמו: אינפוגראפיק, ואפילו איורים, מפות ועוד. הכל עניין של זמן, הרחבת מערך ההקשרים בגרף המידע ופיתוח כמובן. ניתן להניח עוד כי ככל שגרף המידע יתפתח וישתכלל, שטח המסך שיתפסו התוצאות שלו יגדל על חשבון שטח המסך של 10 תוצאות החיפוש האורגניות ה"רגילות" אליהן התרגלנו.

גרף המידע לא רק בתוצאות החיפוש

גרף המידע מסייע ומניע את החיפוש הקולי בשידורי הטלוויזיה של גוגל, המאפשרים כבר היום לבצע חיפושים קוליים של תוכניות וסרטים. כמו כן, גרף המידע הוא זה שמפעיל הלכה למעשה את Google Now, תוכנה תואמת SIRI המותקנת ופועלת על מכשירים מבוססי אנדרואיד.

אם למישהו היה חשש מפני דחיקתן של פרסומות ה-ADwords לתחתית העמוד בגלל חלונית המידע, הרי שבגוגל אומרים בכל רם כי שיפור תוצאות החיפוש הוא שעומד לנגד עיניהם בראש ובראשונה. לנו אין בכלל ספק כי תוצאות טובות ואישיות יותר, יביאו למיקוד טוב יותר גם בתחום הפרסום, מה שיוביל לעליה ב-CTR של המפרסמים, כך שבסוף כולם יהיו מרוצים.

וכמה מילים לסיכום

מסקרן ומרתק להבין יותר על גרף המידע ואפשרויות הפיתוח של מוצרי גוגל השונים ותוצאות החיפוש בעיקר, בהתבסס על הגרף. כבר בתחילת דרכה גוגל הפכה לחברה המובילה בתחום החיפוש המקוון, הרבה בזכות אלגוריתם משוכלל ומתקדם, שפשוט שכנע את הגולשים / המחפשים לעבור לחפש רק בגוגל ולזנוח את המתחרים.

הגישה הבלתי מתפשרת לשיפור מתמיד של תוצאות החיפוש, גרף המידע, מוביל את כולנו לעתיד עוצר נשימה ככל שהדבר נוגע לאפשרויות לחפש ולמצוא מידע ביעילות רבה עוד יותר, מכפי שחזינו עד היום. המטרה העיקרית של גוגל היא להציג לגולשים את המידע שהם צריכים במהירות וביעילות רבה יותר. עמית סינגהל מתאר את העתיד הנראה לעין באומרו כי גוגל הופך להיות העוזר הדיגיטלי המושלם שלצידנו.

מנוע החיפוש יכול לא רק לענות על כל שאלה ששואלים אותו אלא גם להציע לך מידע חשוב באופן אקטיבי. בסופו של תהליך המטרה היא לאחד את שני המוחות של גוגל בחזרה למאגר אחד גדול ומשוכלל. מאין נישואין בין גרף המידע למאגר המידע העצום שמבוסס ביטויי מפתח. העתיד מסקרן ומבטיח לכולנו גוגל הרבה הרבה יותר מפותח. מישהו אמר בינה מלאכותית? טובי המהנדסים בעולם כבר שוקדים על המלאכה בגוגל...

מקורות מידע לכתיבה:
http://googleblog.blogspot.co.il/2012/05/introducing-knowledge-graph-things-not.html

http://tech.fortune.cnn.com/2012/12/11/larry-page/

http://www.freebase.com/

http://www.xconomy.com/san-francisco/2012/12/12/google-gets-a-second-brain-changing-everything-about-search/

תאריך: 17/01/2013 10:12    מחבר:


רוצה לדעת יותר? פנה אלינו כבר עכשיו >