מה הקשר בין SEO ולימוד מכונה (Machine Learning)

14 מרץ 2019

מהי החשיבות של לימוד מכונה לקידום אתרים?

עד בערך לפני עשר שנים, היה אפשר לקדם אתר יחסית בקלות על ידי שימוש בכמות מסיבית של קישורים מעמודים בעלי תכנים באיכות נמוכה, בין אם התכנים האלו ישבו באתרי מאמרים, בלוגים שנפתחו בחינם בבלוגר, פורומים או אפילו באתרי "פרסום אייטמים" (פרסום של קישורים עם כמה שורות טקסט).

הכוונה "באיכות נמוכה" הייתה בדרך כלל לתכנים שלא באמת חידשו שום דבר והשתמשו במילות מפתח צפופות מאוד עם משפטים זהים שחזרו על עצמם בתבניות שונות. הספאמרים המתקדמים אפילו ידעו כיצד לקחת מאמרים קיימים וליצור מהם מאמרים חדשים באמצעות החלפה של מילים מסוימות באחרות. חלק משיטות "הספינר" האלו אפילו היו אוטומטית לחלוטין, מה שיצר לפעמים מאמרים חסרי היגיון או ניסוח מוזר מאוד...

עם זאת, חשוב גם להדגיש שגוגל בהחלט לא היה טיפש, ועל מנת להתברג במקומות גבוהים עדיין היה צריך לדעת כיצד ללכת בין הטיפות ולא להדליק יותר מדי נורות אזהרה. הבעיה הייתה שככל שיותר ויותר אתרים הצליחו להערים את גוגל, כך הם פגעו באמינות שלו בעיני הקהל הרחב, ובשלב מסוים גוגל כבר לא הייתה יכולה לתת לזה להימשך, גם אם היה מדובר רק בחלק קטן מן השאילתות.

פנדה ופינגווין

כתבנו כבר המון על גוגל פנדה וגוגל פינגווין שהופעלו בהתאמה ב-2011 ו-2012, ולכן לא נתעכב על כך. מה שכן חשוב לדעת הוא ששני האלגוריתמים האלו היו הרבה יותר חכמים מכל מה שנראה קודם לכן, למרות שאנחנו לא לגמרי יודעים אם הם השתמשו בלימוד מכונה. מה שהם כן ידעו לעשות זה להעריך בצורה הרבה יותר טובה את האיכות של הקישורים והתוכן של אתרים שונים באינטרנט על פי סיגנלים ספציפיים, וכך למעשה להתגבר על שתי נקודות התורפה שהצגנו קודם לכן.

אבל הם לא היו מושלמים, בעיקר מכיוון שהם לא ידעו כיצד לבצע עיבוד בזמן אמת. כלומר, אתר שהשתמש בקישורים בעייתיים ונפגע על ידי עדכון פינגווין, לא היה יכול לזכות בדירוגים שלו בחזרה גם אם התיקון שהבעלים שלו ביצעו היה מהיר יחסית. בסופו של דבר זה השתנה, אבל אין ספק שבקרב בעלי אתרים רבים (שלעיתים לא היו מודעים לשיטות המפוקפקות בהם האתר שלהם קודם על ידי חברות הקידום) נגרם תסכול רב.

במהלך 3-4 השנים הבאות ראינו כאמור שכלולים של האלגוריתמים האלו בנוסף למספר אלגוריתמים נקודתיים שהיו אמורים לטפל בתוצאות מקומיות, תחום שגוגל טיפחה מאוד, בעיקר בחו"ל, אבל עדיין היה רווי בספאם.

Rankbrain

באוקטובר 2015 נפל דבר בתחום מנועי החיפוש כאשר גוגל הכריזה על שימוש באלגוריתם מסוג חדש בשם Rankbrain. למעשה היא החלה להפעיל אותו מספר חודשים לפני ההכרזה  הרשמית(כלומר, אמצע 2015):  Rankbrain היה אלגוריתם מבוסס לימוד מכונה שעסק בין היתר בעיבוד של שפה טבעית. במילים אחרות, אם מנוע חיפוש קלאסי מתאים תבניות לשאילתה של המשתמש עם יכולת מוגבלת מאוד לזהות מילים נרדפות או זהות, הרי שאלגוריתם כמו Rankbrain יכול להתאים מגוון גדול הרבה יותר של טקסטים רלוונטיים לשאילתה של המשתמש, כולל תשובות שונות שמבוססות על עובדות.

אם רוצים לראות דוגמה חיה ליכולת הזו, אפשר להסתכל על גוגל טרנסלייט: פעם הוא היה בעיקר מקור לבדיחות, אבל היום יכולות התרגום שלו כבר הפכו להיות מתקדמות מאוד. לפעמים הוא אפילו יכול להבין סלנג. לדוגמה, אם מקלידים את המשפט Piece of Cake, הוא יתרגם זאת כ"קלי קלות" ולא "חתיכת עוגה...". ההשערה היא שאת חלק מהטעויות האלו הוא לומד באמצעות פידבק של משתמשים אמיתיים.

RankBrain

אנשי ה SEO צריכים להתאים את עצמם

לפני הכול, יש לציין שיכולות עיבוד השפה של גוגל בעברית עדיין אינן טובות כמו אלו באנגלית, אבל בהחלט רואים שמקדמי אתרים ישראלים  מקפידים הרבה יותר על התכנים שהם משתמשים בהם במהלך בניית הקישורים. למרבה הצער, זה לא תמיד דו כיווני, ולעיתים נתקלים במקדמי אתרים עם כוונות טובות ששולחים מאמרים באיכות גבוהה לאחרים, אך מקבלים בתמורה מאמרים באיכות נמוכה ושותלים אותם באתרים שלהם (מה שבסופו של דבר פוגע בהם בחזרה).

העתיד לא תמיד ורוד

לכאורה לימוד המכונה של גוגל יכול להביא לעתיד וורוד יותר: לזהות אתרים עם סמכות גבוהה יותר (כמו שבוצע באלגוריתם ה-Medical), להילחם בפייק ניוז ולהביא תנועה לאתרים עם תוכן מצוין שאולי אין להם את היכולת להשקיע עשרות שעות בחודש בבניית קישורים.

אבל יש גם צד שני למטבע: בשלב מסוים ייתכן שגוגל יהפוך להיות כל כך חכם עד שהוא לא יצטרך יותר אתרי אינטרנט עבור חלק גדול מן השאילתות, בטח עבור אלו שקל לענות עליהן באופן אובייקטיבי: החל מהכנת עוגה ועד לחומר האיטום הטוב ביותר במדינות קרות. גופים שונים כמו האיחוד האירופאי מנסים להילחם בכך באמצעות חקיקה שמבוססת על זכויות יוצרים של האתרים מהם התוכן נלקח, אך כפי שאנחנו יודעים, החוקים של העולם הישן לא חלים על גוגל (ובשלב מסוים סביר להניח האלגוריתם כבר יוכל לכתוב משפטים בעצמו...).

והאמת היא שזה כבר קורה: לפני כמה שבועות גוגל נתפסה על חם משתמשת בתצוגה שבה הקישור לאתר המקורי שמספק את התשובה מוחבא מתחת ל"אקורדיון" שצריך לפתוח אותו. נשמע כמו פרט קטן, אבל הוא גרם ל"עליהום" רציני שהכריח את אחד מהנציגים של גוגל (דני סולימבן, שבעבר סיקר את גוגל בעצמו מהצד השני) להדוף את ההאשמות בצורה לא מאוד משכנעת (בשלב מסוים הוא פשוט הציע למתלוננים שיזרמו עם הקדמה)...

 

תוצאות מובייל בתצוגת אקורדיון 0:


לתת משהו שגוגל לא יכול

גוגל תמיד אומרת לאנשים ליצור תכנים בעלי ערך, ובאמת יכול להיות שאחת היכולות האחרונות שיישארו לנו הוא להתבסס על מידע סובייקטיבי, פרשנות, הבעות דעה, כתבות עומק שלא מציגות רק עובדות פשוטות וכך הלאה. יש כבר מקרים בהם גוגל מציגה כמה דעות בתוצאות החיפוש (לדוגמה, מכמה דיונים), אבל תוכן שאינו רק עובדתי ימשוך אנשים לבדוק אותו מקרוב ולא להסתפק בתשובה פשוטה לשאלה אם עדיף לשתות מיץ תפוזים או לאכול פלח תפוז טרי.

לשכנע את המכונה

מלבד האתרים שתיארנו עד כה, אין ספק שגם מקדמי אתרים שעוסקים בשיווק וקידום של אתרי תדמית או מכירת מוצרים יצטרכו להסתגל למצב החדש: סביר להניח שהמערכת של גוגל תתבסס יותר ויותר על סיגנלים חיצונים כמו ביקורות גולשים בתוצאות המקומיות שלה (לא רק כוכבים, אלא גם סנטימנטים בטקסט), מידע ממקורות שונים ברשת כדי לצורך אימות פרטים, גלריות, סרטונים וכו'. אז כן, המשמעות היא להשקיע יותר בתוכן, אבל גם לעשות זאת בצורה חכמה ולא לנצל מקורות חיצונים רק לשם יצירת קישורים שנראה שכבר היום הרלוונטיות שלהם נשחקת לעומת הסיגנלים הממוקדים יותר שקצת יותר קשה לזייף.

SEO, machine learning
רוצה להתקדם? צור קשר