מה זה בעצם תוכן משוכפל?

29 יוני 2014

מה זה בעצם תוכן משוכפל?

מה זה בעצם תוכן משוכפל?

מאז היוולדו של עדכון "גוגל פנדה" לפני כמה שנים, נראה כי החשש הגדול ביותר של בעלי אתרים הוא שתמצא באתר שלהם כמות גדולה מדי של תוכן משוכפל. הסיפורים על אתרים שירדו עשרות מקומות בדירוגים ואיבדו מחצית מהתנועה שלהם ממשיכים להלך אימים על מנהלי אתרים ומקדמי אתרים אפילו היום.

נשאלת השאלה מהו בעצם תוכן משוכפל, מה הבעיה איתו, האם יש סף מסוים של תוכן משוכפל שהופך את האתר כולו ל"משוכפל"? ואולי יותר חשוב, האם תמיד חייבים לפרק את כל התוכן באתר ולכתוב אותו מחדש ?!

ונתחיל כמובן בהגדרה של תוכן משוכפל : בגדול, תוכן משוכפל הוא כל תוכן שמופיע ביותר ממקום אחד באינטרנט. התוכן עצמו לא חייב להיות משוכפל ב - 100%, אבל מספיק שחלקים גדולים ממנו יהיו זהים או דומים אחד לשני על מנת שמנועי החיפוש יבחינו בכך. כמו כן, יש לשים לב שתוכן משוכפל המופיע בשני אתרים נפרדים אינו זהה לתוכן משוכפל היושב באותו האתר בשני עמודים שונים מכיוון שמנועי החיפוש מתייחסים לכל מקרה מעט אחרת.

 

מהי הבעיה של מנועי החיפוש עם תוכן משוכפל?

הבעיה המרכזית של מנועי החיפוש עם התוכן המשוכפל היא שמבחינתם מדובר בכפילות של תוצאות החיפוש. במילים אחרות, מנוע חיפוש טוב ינסה להימנע ככל הניתן מלהציג לגולש תוצאות דומות מדי אחת לשנייה, לפחות בעשרת המקומות הראשונים (העמוד הראשון).

במידה ושני עמודים מאתרים שונים מציגים את אותו התוכן ועליו לבחור איזה מהם יופיע במקום גבוה יותר, הוא יסתמך לרוב על האתר שפרסם אותו לראשונה. לרוע המזל, במקרים רבים גם מנוע החיפוש עצמו לא יודע מיהו המקור או שהוא מייחס את המקור דווקא אל ההעתק. על מנת להתגבר על בעיה זו, לעיתים הואישתמש במדדים נוספים בנוגע למוניטין הכללי של האתר ברשת : כמה אתרים אחרים מקשרים אליו, כמה הוא וותיק וכדומה.

לאחרונה נוסף גם פרמטר חדש ויעיל יחסית הידוע בתור "תג כותב". תג זה מזהה את הכותב של התוכן באמצעות פרופיל הגוגל פלוס שלו (הרשת החברתית של גוגל), ולכן יכול לסייע למנועי חיפוש (כרגע מן הסתם רק גוגל) לזהות מיהו המקור.

 

מה קורה כאשר תוכן זהה מופיע בשני עמודים שונים באותו האתר?

במקרים מסוימים תוכן משוכפל עשוי להופיע בכמה עמודים באותו האתר. לדוגמה, אם יש לנו רשימה של מוצרים שמסודרים בשני סידורים שונים, פעם אחת לפי מחיר ופעם אחת לפי הא"ב. דוגמה אחרת ונפוצה לא פחות : התבנית של האתר שלנו כוללת בלוק גדול מאוד של טקסט המופיע לאורך כל עמודי האתר.

מכיוון שלרוב לא מדובר בעמודים זהים לגמרי מבחינת הכותרת והמיקום שלהם בהיררכיה הפנימית של האתר, הרי שבמקרים כאלו, מנוע החיפוש בדרך כלל יציג את הדף הרלוונטי ביותר לשאילתא של המשתמש. אם נחזור לדוגמה הקודמת של מוצרים, אם המשתמש יחפש למשל "מחירי טאבלט ב - XYZ", סביר להניח שהדף שיוחזר הוא זה שמסדר את הטאבלטים לפי המחיר שלהם ולא לפי יצרנים. (בהנחה שיש דף כזה באתר).

 

כיצד ניתן להתגבר על בעיית ה Duplicate Content / תוכן משוכפל?

למרות שהדוגמאות שהבאנו כאן הן פשוטות יחסית, במציאות ישנם מקרים מורכבים של עשרות דפים משוכפלים באותו האתר (שלעיתים נוצרים באופן אוטומטי) או מאמרים שמשוכפלים על ידי מאות אם לא אלפי אתרים אחרים. בהנחה שאין לנו את המוניטין והדירוגים של ויקיפדיה, זו בהחלט עשויה להיות בעיה.

במקרים בהם אין דרך להמנע מתוכן משוכפל עקב מגבלות CMS או אילוצים אחרים, מומלץ לחסום את הדפים הכפולים באמצעות תג noindex או ליידע את את מנוע החיפוש על קיום הכפילות באמצעות תג קנוניקל.

SEO, תוכן, פנדה
רוצה להתקדם? צור קשר