המדריך המלא להתמודדות עם כפילות תוכן

19 אוקטובר 2014

המדריך המלא להתמודדות עם כפילות תוכן

המדריך המלא להתמודדות עם כפילות תוכן

כפילות תוכן הוא אחד מן האתגרים הגדולים ביותר איתם מנסים להתמודד מנועי החיפוש כיום ובעיקר גוגל אשר יצר אלגוריתם מיוחד לטיפול בכך הידוע כאלגוריתם "פנדה": כאשר אתר אינטרנט מציג תוכן מסוים שנמצא גם במקומות אחרים ברשת, מנוע החיפוש לא תמיד יודע איזה אתר הוא האתר המקורי אשר פרסם את התוכן לראשונה ונחשב למקור המהימן ביותר. יתרה מזאת, אם אתרים אחרים מתחילים לקשר לתוכן בצורות השונות שלו, הדבר מבלבל את מנועי החיפוש עוד יותר. (ניתן ללמוד עוד במאמר "מה זה בעצם תוכן משוכפל")

הפתרון המתבקש לכאורה הוא להציג את כל האתרים הרלוונטיים, אך אז ייווצר מצב של הצגת תוצאות כפולות ואיכות החיפוש תיפגע. לפיכך, מנועי החיפוש חייבים לבחור רק בגרסה אחת של כל תוכן. בתור בעלי ומקדמי אתרים, האחריות שלנו היא לעקוב אחרי התכנים שלנו ברשת וכמובן בתוך רשת האתרים הפנימית שלנו ולמנוע מצבים של כפילות תוכן אם אנחנו רוצים לקבל חשיפה מקסימאלית במנועי החיפוש.

מדוע בכלל נוצר תוכן משוכפל?

  • מערכות ניהול תוכן יוצרות ארכיונים שונים באותו האתר וגרסאות כפולות של אותן העמודים ללא התחשבות במנועי החיפוש
  • גם תצוגה חלקית ותצוגה מלאה כמו למשל בעמודי תגובות או גרסאות הדפסה נחשבות לכפילות תוכן
  • פרמטרים של כתובת אתר שאין להן השפעה על תוכן העמוד או שהן רק מסדרות אותו בסדר אחר בצורה ויזואלית (למשל - מוצרים בחנות מהמחיר הגבוה לנמוך או מהנמוך לגבוה).
  • אתרים אחרים או "מגרדי תכנים" מפרסמים תכנים ללא אישור ואתרים אחרים מקשרים אליהם במקום אלינו
  • לעיתים אתר מסוים נגיש גם עם www וגם בלי www, אך התכנים בשתי הגרסאות זהים לחלוטין

 

תג הקנוניקל

הפתרון אותו מצאו מנועי החיפוש לחלק גדול מן התכנים המשוכפלים הוא תג ה - Canonical. תג זה הוא תג אשר אפשר לשים אותו בכל עמוד שהתוכן בו זהה לתוכן בעמוד המקורי, והתג עצמו כולל את כתובת המקור.

השימוש בו נעשה בתוך ה - Header של הדף בצורה זו:

link rel="canonical" href="http://example.com/orginal-page-name

החיסרון הברור של התג הוא כמובן שמישהו צריך לשים אותו בגרסה המשוכפלת, ולכן הוא לא פותר מקרים של פרסום שלא בהסכמה. כמו כן, גם לא כל מי שמפרסם בהסכמה יתלהב מלשים את התג מכיוון שהוא כביכול מוריד את הערך של העמוד בעיני גוגל.

כיצד לזהות תוכן משוכפל?

יש כמה וכמה דרכים לזהות תוכן משוכפל:

זיהוי ברמת תגי המטה דרך כלי מנהלי האתרים  - אם ישנם תגי מטה כפולים, נוכל למצוא אותם באמצעות האפשרות "שיפורים ב - HTML" תחת תפריט תצוגת חיפוש. החיסרון של שיטה זו הוא שמדובר רק על כפילות מלאה ולא על כפילות חלקית.

זיהוי ברמת הכותרת דרך שורת החיפוש של גוגל: כאשר נקליד intitle: ולאחר מכן מילת מפתח מסוימת, נמצא את כל העמודים שכוללים אותה, אבל לא בהכרח רק אותה. אם נוסיף גם את הפקודה site: ואחריה את שם האתר שלנו, נגביל את החיפושים רק לתחום של הדומיין שלנו. כמובן שרצוי לבחור במחרוזת ארוכה שהיא שם של מאמר ולא בסתם מילת מפתח. בנוסף לכך, לפעמיים גוגל לא יציג לנו את כל הגרסאות הרלוונטיות, אלא אם כן נלחץ על הקישור התחתון...

כאשר נקליד intitle: ולאחר מכן מילת מפתח מסוימת, נמצא את כל העמודים שכוללים אותה

זיהוי ברמת התוכן הפנימי - זיהוי ברמת התוכן הפנימי הוא מעט יותר בעייתי, אבל גם הוא אפשרי במידה ובה אנחנו לוקחים מספר משפטים מן המאמר המקורי ומדביקים אותם בגוגל. חשוב רק לשים לב להקיף אותם במרכאות.

כיצד להתגבר על בעיית התוכן המשוכפל ברמה הטכנית?

מלבד תג הקנוניקל, יש עוד מספר אפשרויות נוספות לטפל בתוכן משוכפל (משתנה בהתאם למקרה):

  • לבטל משתני Session דרך ה - URL
  • במקום ליצור גרסאות הדפסה לכל עמוד, ניתן לעצב גרסת הדפסה פנימית באותו העמוד דרך קובץ העיצוב (CSS)
  • ביטול של חלוקת תגובות לעמודים
  • סידור של הפרמטרים תמיד באותו הסדר או שימוש באופציית "פרמטרים של כתובת אתר" בתוך תפריט "סריקה" בכלי מנהלי האתרים כדי להורות לגוגל מאילו פרמטרים להתעלם
  • קביעת כתובת אתר מועדפת (עם או בלי www) בכלי מנהלי האתרים דרך לחיצה על כפתור גלגל השיניים בפינה השמאלית למעלה ואז בחירה ב - "הגדרות אתר"

חשוב לשים לב שאם מדובר בכתובות ספציפיות אותן צריך להגדיר מחדש, לעיתים אין בררה אלא להשתמש בהפניות מסוג 301 (Redirects). אלו הן הפניות שלמעשה אומרות לגוגל שהעמוד הנוכחי עבר באופן קבוע לכתובת אחרת. במידה ואין גישה לדף או הדפים הבעייתיים ברמת השרת, אך אפשר עדיין לערוך את התוכן, לעיתים אין מנוס מלקשר לתוכן המקורי באמצעות קישור רגיל שהוא גם כן סוג של אינדיקציה (במידה והקישור הוא חד כיווני, גוגל מבין שהדף המקושר הוא המקור ולא ההפך).

לסיכום - תוכן משוכפל הוא לא גזרה משמיים

למרות שכמעט בכל אתר אפשר למצוא תוכן משוכפל, הרי שלא מדובר בגזרה משמיים שצריך לחיות איתה, ובאמצעות כמה צעדים פשוטים אפשר בהחלט לצמצם את התופעה ובכך להשיג דירוגים גבוהים יותר במנועי החיפוש. בכל אופן, לשם זאת יש לעבוד בצמוד עם צוות הפיתוח של האתר ולהסביר לו את החשיבות שבטיפול בבעיה גם אם הדברים נראים חסרי משמעות מן הצד השני.

SEO, תוכן, טכני
רוצה להתקדם? צור קשר