איכות תוצאות החיפוש ודרך הצגתן למחפשים בגוגל - מאמר מתורגם לעברית
חדש באתר: שינויים באלגוריתם של גוגל - פברואר-מרץ 2011
לפני מספר שבועות פתח אודי מנבר קבוצת דיון בנושא איכות החיפוש, וההודעות הקודמות בסדרה זו דיברו על דירוג מסמכים. בעוד שדירוג מסמכי אינטרנט הוא לב ליבו של מה שגורם לחיפוש בגוגל לעבוד כל כך טוב, חוויית החיפוש שלכם מורכבת מהרבה יותר מזה.
במאמר זה אתאר את העקרונות שמנחים אותנו בפיתוח חוויית החיפוש הכוללת, וכיצד הם מיושמים בנוגע להיבטים העיקריים של החיפוש. אתאר גם כיצד אנו מבטיחים שאנחנו בכיוון הנכון, באמצעות ביצוע קפדני של ניסויים. וההודעה הבאה בסדרה תתאר כמה מהניסויים שמתבצעים בימים אלה.
אני רוצה להציג את עצמי. שמי בן גומז, ואני עובד בגוגל בתחום החיפוש מאז 1999, בעיקר בנושא איכות החיפוש. התמזל מזלי לתרום לרוב היבטי מנוע החיפוש, החל מזחילה ברשת ועד דירוג. לאחרונה, היה באחריותי תכנון הממשק לחיפוש ותכונות החיפוש.
תגובה נפוצה מחברים כאשר אני אומר שאני עובד כרגע על הממשק למשתמש של פונקצית החיפוש בגוגל היא "מה אתה עושה? הממשק אף פעם לא משתנה". ואז הם מסתכלים עלי בחשדנות ואומרים לי שלא כדאי להתעסק אם דבר טוב. גוגל הוא מצוין בדיוק כפי שהוא עכשיו – דף אינטרנט פשוט, מהיר ולא מסובך. "זה נהדר, אבל כמה קשה זה כבר יכול להיות?"
מה יש לשפר בתוצאות החיפוש של גוגל?
כדי לעזור לענות על השאלה הזאת, אני רוצה להתחיל עם המטרה העיקרית שלנו בחיפושים ברשת: להגיע לדפי האינטרנט שאנו רוצים הכי מהר שאפשר. חיפוש אינו מטרה בפני עצמה. זהו רק כלי. אולי המטרה הזאת נראית מובנת מאליה, אבל היא הופכת מנוע חיפוש לדבר שונה לחלוטין מרוב האתרים האחרים ברשת, אשר מודדים את ההצלחה שלהם על פי התשובה לשאלה כמה זמן המשתמשים נשארים בתוך האתר.
אנחנו מודדים באופן חלקי את ההצלחה שלנו על ידי התשובה לשאלה כמה מהר אתם עוזבים את האתר (כשאתם מרוצים אנחנו מקווים!). ישנם כמה עקרונות שבהם אנו משתמשים כדי להביא אתכם למידע שלו אתם זקוקים מהר ככל האפשר:
אלגוריתמים מורכבים בפרזנטציה פשוטה. תכונות חיפוש רבות דורשות מורכבות רבה מאד מבחינת האלגוריתם וניתוח של כמות גדולה של נתונים כדי שהן תעבודנה כמו שצריך. החוכמה היא להסתיר את כל המורכבות הזאת מאחורי ממשק משתמש נקי ואינטואיטיבי. תיקוני איות, ציטוטים מאתרים, הפונקציה של ריבוי קישורים - Site Links ושיפורים במילות החיפוש הם דוגמאות לתכונות שדורשות אלגוריתמים מתוחכמים ומשתפרות כל הזמן. מנקודת מבטו של המשתמש, החיפוש, כמעט באופן בלתי נראה, פשוט עובד טוב יותר.
תכונות שעובדות בכל מקום. התכונות חייבות להיות מתוכננות כך שהאלגוריתמים והפרזנטציה יוכלו לעבור התאמה כך שהם יפעלו בכל השפות והארצות. תארו לעצמכם את הבעיה של תיקוני איות בסינית, שבה חיפושי המשתמשים אינם מחולקים לעיתים קרובות למילים, או את החיפוש בעברית וערבית, שבהן הטקסט נכתב מימין לשמאל (באופן מעניין, זה נחשב בעבר ליתרון: כאשר כתבו על אבן באמצעות אזמל, היה קל יותר להחזיק את הפטיש ביד ימין!).
החלטות המונעות על ידי נתונים. ניסויים, ניסויים, ניסויים. אנחנו מנסים לוודא שעשינו את הדבר הנכון על ידי ביצוע ניסויים. דרכי ביצוע שאולי נראו מבטיחות, יכולות להתגלות בסוף בניסויים כגרועות.
מה צריך לשקול בעת שיפור תוצאות החיפוש של גוגל?
קיימים כאן מספר מתחים המהווים חלק בלתי נפרד מהעניין. למשל, אם נראה לכם יותר טקסט (או תמונות) בכל תוצאת חיפוש, ייתכן שתוכלו לבחור בצורה טובה יותר את התוצאה המתאימה לכם ביותר. אבל דף תוצאות הכולל יותר מדי מידע לוקח זמן רב יותר מבחינת ההורדה והשלמת התהליכים הויזואליים.
לכן כל פיסת מידע שאנו מוסיפים לדף התוצאות חייבת להישקל בקפידה, כדי להבטיח שהתועלת למשתמש תעלה על המחיר הכרוך בהתמודדות עם מידע רב יותר. זה נכון לגבי כל אחד מחלקי חוויית החיפוש, החל מהקשת מילות החיפוש, דרך סקירת התוצאות ועד לבדיקה מעמיקה יותר של הדברים.
תחילת החיפוש היא הקשת מילות החיפוש. גורם נפוץ לתסכול הוא מצב בו אינכם יודעים את האיות הנכון של מילה כלשהי! תיקון האיות – אשר נראה כמו תכונה פשוטה וברורה מאליה – מסתיר בתוכו אתגרים טכניים רבים. שום מילון אנגלי רגיל אינו כולל את האיות הנכון של שמה של Britney Spears (אשר הפכה, כנראה ללא ידיעתה, לדוגמה מושלמת לתכונה זאת).
אנו מבצעים ניתוח בקנה מידה עצום של מיליארדי הדפים שברשת ושל היסטוריית החיפושים שלנו, במטרה לקבוע איזה ממילות החיפוש הן "מילים אמיתיות" שאכן קיימות ברשת, ואיזה מהן הן ככל הנראה טעויות איות.
המערכת המספקת לכם את תיקוני האיות, חייבת, תוך שבריר שנייה, לשקול כמות עצומה של מילים אפשריות שייתכן שהתכוונתם אליהן (כמות גדולה בהרבה מכל מילון ידני שאי פעם נוצר), ולקבוע האם קיימת מילת חיפוש שיש סיכוי רב יותר שהתכוונתם אליה. כאשר אנו בטוחים שלמעשה התכוונתם להקיש משהו אחר, אנו לוקחים לעצמנו לעיתים נדירות את החופש הבא: אנו מנסים להסיח את דעתכם מהתבוננות בתוצאה העליונה ביותר בדף.
תיקון האיות מוצב בקו הראייה שלכם באותיות אדומות ובוהקות שאי אפשר לפספס. בנוסף, אנו מוודאים כעת ששום דבר אחר בעמוד אינו אדום, אלא אם כן הוא חשוב מבחינתכם באותה מידה כמו האיות! (וכרגע, שום דבר לא חשוב באותה מידה).
האלגוריתמים המעורבים בתיקוני האיות הולכים ומשתפרים כל הזמן. הם כעת פועלים בכמות גדולה של שפות, והם נעשים יותר ויותר טובים באיתור המקרים בהם טעיתם באיות. איות נכון של מילת החיפוש הוא כה חשוב, שאנו שוקלים להראות לכם את תוצאות החיפוש של המילה המתוקנת במרכז העמוד (למקרה שפספסתם את הטקסט האדום הבוהק בחלק העליון של הדף ובתחתית!).
לאחר שניסחתם בצורה נכונה את מילות החיפוש שלכם, המשימה הבאה היא לבחור דף מתוך רשימת התוצאות. עבור כל תוצאה, אנו מציגים את הכותרת ואת ה- URL, וכן ציטוט קצר מהאתר בן שתי שורות. עמודים שאין להם כותרת מתאימה זוכים לעיתים קרובות להתעלמות מצד המשתמשים.
שינויים בכותרות עמודים בתוצאות החיפוש של גוגל
אחד השינויים היותר גדולים שהתבצעו לאחרונה היה ליצור כותרות עבור דפים שאינם מציינים מהי כותרת ה-HTML, למרות שבדף האינטרנט ישנה באופן ברור כותרת אשר מסתכלת לכם בפרצוף. כדי שהמערכת תוכל "לראות" את הכותרת שאליה התכוון יוצר דף האינטרנט, אנו מנתחים את ה-HTML באותו עמוד במטרה לקבוע מהי הכותרת שאליה יוצר הדף ככל הנראה התכוון.
הדבר מגדיל משמעותית את הסיכוי שלא תתעלמו מהדף בגלל העדר כותרת מתאימה. מתחת לכותרת מופיע הציטוט מהאתר, וחידוש חשוב שגוגל הכניסה כבר מזמן היה בחירת התוכן שגוגל מציגה בציטוט זה. באותה עת, מנועי החיפוש נהגו להראות את שתי השורות הראשונות בדף האינטרנט. במקום זאת, גוגל החלה להראות את החלקים בדף בהם הופיעו מילות החיפוש שלכם (מומחים לאיתור מידע קוראים לזה "מילות המפתח בהקשרן").
הצגת מילות המפתח בהקשרן היא דבר פשוט מבחינה ויזואלית, וכמעט שלא ניתן להבחין בינה לבין הציטוטים מהסוג הפשוט יותר, אך זוהי שיטה הרבה יותר מועילה מבחינת האופן בו היא מסייעת לכם להחליט באיזה דף לבקר. הפשטות הזאת מסווה את המורכבות שנמצאת מתחת לפני השטח: כאשר אנחנו יוצרים ציטוט, אנחנו חייבים לעבור על הטקסט הקיים בפועל בכל אחת מתוצאות החיפוש ולמצוא את החלק הרלוונטי ביותר (אשר מכיל את מילות המפתח שלכם) ולא סתם לתת לכם את השורות הראשונות.
במשך הזמן הכנסנו שיפורים לציטוטים שלנו, באמצעות אלגוריתמים שקובעים את הרלוונטיות של חלקי הדף השונים. שינויים אלה נעים החל משינויים עדינים, כמו הדגשת מילים נרדפות למילות החיפוש שלכם בתוך התוצאות, ועד לשינויים ברורים יותר. הנה דוגמה למסך בו המשתמש חיפש את המילה "arod", וניתן לראות כי המילים Alex ו-Rodriguez מודגשות בתוך הציטוט של תוצאת החיפוש, על בסיס הניתוח שבצענו כי באופן מתקבל על הדעת ייתכן שהאדם שביצע את החיפוש התכוון לאיש זה.
כדוגמה ברורה יותר, בתקופה האחרונה אנו מצטטים את התאריך המופיע ליד שם הכותב, מתוך העמודים בהם תאריך כזה מופיע. תאריכים אלה נכתבים בכמות אדירה של פורמטים, ואנו מצליחים לאתר אותם ולצטט אותם באופן אחיד, כך שניתן יהיה לסרוק אותם בקלות.
ריבוי קישורים מאתר - Site Links
כמענה לאחד מהצרכים הנפוצים הקיימים בקרב המשתמשים – הקשת שם האתר שאותו אתם כבר יודעים – הנהגנו קיצורי דרך עבור המשתמש, שאותם אנו מכנים "ריבוי קישורים" ובאנגלית site-links. ריבוי קישורים אלה מאפשרים לכם לקבל את החלקים החשובים ביותר באתר, והם מהווים דוגמה להרבה מהעקרונות שהוסברו קודם. הם מהווים תוספת פשוטה לתוצאת החיפוש העליונה ביותר, ומוסיפים מעט טקסט לדף.
לדוגמה, דף הבית של חברת Hewlett-Packard כולל כמעט 60 לינקים, עם מערכת תפריטים בת שתי רמות. האלגוריתם שלנו, הנעזר בשילוב של כמה סימנים שונים, בוחר מתוכם את הלינקים שאנו חושבים כי קיים הסיכוי הגבוה ביותר שאתם מעוניינים לבקר בהם.
ומה אם לא מצאתם את מה שחיפשתם בתוך התוצאות העליונות? במקרה כזה, אתם צריכים כנראה לנסות להשתמש בחיפוש שונה. אנו מסייעים לכם בתהליך הזה על ידי כך שאנו מספקים סדרה של שיפורי מילות חיפוש בתחתית דף התוצאות.
גם את זה לא נותן לכם את החיפוש לו אתם זקוקים, שיטה זו מספקת לכם טיפים לכיוונים שונים (שיש סיכוי שיהיו יותר מוצלחים) שבאמצעותם תוכלו ללטש את החיפוש שלכם. על ידי כך שאנו שמים את שיפורי מילות החיפוש בתחתית הדף, השיפורים לא מסיחים את דעתם של המשתמשים, אך נמצאים שם כדי לסייע להם אם שאר תוצאות החיפוש לא שירתו את צרכי החיפוש שלהם.
סיכום - שיפור תוצאות החיפוש המוצגות למחפש בגוגל
תיארתי מספר היבטים חשובים בחוויית החיפוש, כולל תחומים שבהם הנהגנו שינויים רבים במהלך הזמן – חלקם עדינים וחלקם יותר ברורים לעין. בעת ביצוע שינויים אלה בחוויית החיפוש, כיצד נוכל לדעת שהצלחנו, שלא פישלנו? אנו מבצעים הערכה מתמדת של השינויים שאנו עורכים, על ידי כך שאנחנו חולקים אותם אתכם!
אנו משיקים את השינויים המוצעים אצל חלק זעיר מהמשתמשים שלנו, ובודקים האם נראה כי השינויים מסייעים להם או פוגעים בחוויית החיפוש שלהם. ישנם מספר רב של מדדים בהם אנו משתמשים בכדי לקבוע אם הצלחנו או נכשלנו.
תהליך מדידתם של שיפורים אלה הוא מדע בפני עצמו, עם מוקשים פוטנציאליים לא מעטים. מתודולוגית הניסויים שלנו מאפשרת לנו לחקור מגוון רחב של אפשרויות, ולהשיק את אלה אשר פועלות בצורה הטובה ביותר. על כל תכונה שאנו משיקים, לעיתים קרובות בצענו מספר רב של ניסויים שמעולם לא ראו את אור היום.
אז כעת אני רוצה לענות על השאלה שעימה התחלתי: למעשה אנו משנים כל הזמן את דף התוצאות של גוגל, ואנו עושים זאת כבר הרבה זמן. ולא, אנחנו לא מתעסקים עם דברים שמצליחים. אתם לא מאפשרים לנו.
בהודעה הבאה שאפרסם כחלק מסדרה זו, אספר על כמה מהניסויים שאנו עורכים, ועל מה שאנו מקווים להפיק מהם.
נכתב במקור על ידי בן גומז, מהנדס מצטיין - מקור המאמר בבלוג של גוגל: ליחצו כאן