Як виключити спам в Google Analytics, або Хто псує ваші дані

  1. Навіщо спамити в Google Analytics?
  2. Як вони це роблять? Метод спаму Google Analytics # 1: Ghost spam
  3. Приклад Ghost spam: спам в подіях GA від www.event-tracking.com
  4. Метод спаму Google Analytics # 2: Crawler Referrer Spam
  5. Як визначити реферальний спам в звітах?
  6. Які параметри потрібно проаналізувати для ідентифікації спамера?
  7. Як виключити реферальний спам: фільтри Google Analytics
  8. Фільтр по джерелу кампанії
  9. Фільтр по імені хоста або по будь-якому іншому параметру
  10. Виняток звернень роботів
  11. А чи потрібно морочитися?
  12. короткі висновки

Що робити, якщо ви зіткнулися зі спамом в звітах Google Analytics? Чи означає це, що хтось має доступ до вашого профілю, або що хтось спеціально впливає на дані сайту в GA? Як вони це роблять? І як виключити подібні дані зі звітів?

Коли в джерелах реферального трафіку з'являються нетематичні ресурси, або коли ви відкриваєте «Поведінка → Події → Обзор», і бачите подія, яка точно не налаштовували самостійно, саме час розібратися, в чому ж тут справа. Коли в джерелах реферального трафіку з'являються нетематичні ресурси, або коли ви відкриваєте «Поведінка → Події → Обзор», і бачите подія, яка точно не налаштовували самостійно, саме час розібратися, в чому ж тут справа Спам в подіях від event-tracking.com

Навіщо спамити в Google Analytics?

Google Analytics - найпопулярніший інструмент веб-аналітики, його використовують мільйони користувачів. Спамери розраховують на переходи цікавих власників сайтів, а що вже робити з цими переходами - монетизувати через банери, перенаправляти в магазин або використовувати будь-яким іншим способом - кожен вирішує сам. Навіть якщо взяти відсоток цікавості за 10%, в співвідношенні з мільйонами користувачів Google Analytics це вийде значна цифра.

Як вони це роблять? Метод спаму Google Analytics # 1: Ghost spam

Ghost spam (спам-привид) називається примарою, тому що відправляє дані в GA без взаємодії з сайтом безпосередньо.

Як же дані потрапляють в Google Analytics? GA використовує протокол для передачі даних - Measurement Protocol , Який дозволяє розробникам відправляти дані безпосередньо на сервера Google Analytics. Measurement Protocol сам по собі - гарна річ, він дозволяє використовувати можливості Google Analytics для збору даних практично з будь-якого середовища. Таким чином, стає можливим використовувати інструменти аналітики GA, наприклад, в мережі магазинів роздрібної торгівлі. Дані з продажу або будь-яким іншим взаємодій з покупцями магазинів будуть зібрані в Google Analytics подібно даними з веб-сайтів. Як же дані потрапляють в Google Analytics Однак, той же Measurement Protocol можна використовувати і для передачі спаму.

Для доступу до аккаунту GA досить знати ID аккаунта. Спамерам нічого не потрібно дізнаватися - ID можна генерувати автоматично в великих кількостях. Решту вони вводять самі - рефералів, сторінки, імена хостів, ключові слова і так далі. Автоматизований скрипт відправляє помилкові дані в різні акаунти GA.

Так як безпосередньої взаємодії з сайтом немає, то не можна відсікти спамние дані на рівні сервера, використовуючи .htaccess. Дані можна виключити зі звітів тільки за допомогою фільтрів Google Analytics.

Приклад Ghost spam: спам в подіях GA від www.event-tracking.com

Ви, звичайно ж, знаєте, які саме події налаштовані на сайті, і що хочете відслідковувати. Тому ідентифікувати спам в події дуже просто. Якщо в події ви виявили чуже повідомлення, наприклад, «to use this feature visit: www.event-tracking.com» - це спам. Щоб відсіяти помилкові дані по неіснуючому події, потрібно налаштувати окремий фільтр - докладні інструкції, як це зробити, дивіться в кінці поста. Ви, звичайно ж, знаєте, які саме події налаштовані на сайті, і що хочете відслідковувати

Метод спаму Google Analytics # 2: Crawler Referrer Spam

Є роботи, які здійснюють обхід сайтів з метою залучити трафік на певний портал. Дані, які такі роботи залишають в Google Analytics, не несуть ніякої корисної інформації, а сфабриковані показники спотворюють статистику. Такі роботи ігнорують директиви robots.txt, тому блокувати їх там немає сенсу. Хороша новина в тому, що тут є звернення до сайту. Це означає, що можна заблокувати робота-спамера не тільки в настройках Google Analytics, але і в .htaccess на рівні сервера.

Як визначити реферальний спам в звітах?

Зайдіть в свій аккаунт Google Analytics, вкладка «Звіти», «Джерела трафіку → Весь трафік → Спрямування». До звіту додайте додатковий параметр «Поведінка →" Ім'я хоста "» і відсортуйте по імені хоста. Побачите багато цікавого :) Зайдіть в свій аккаунт Google Analytics, вкладка «Звіти», «Джерела трафіку → Весь трафік → Спрямування» Пошук реферального спаму в звітах Якщо рефералів багато, для зручності роботи краще вивантажити всі дані в таблицю, і там відібрати ті джерела, які необхідно виключити. Експорт даних з Google Analytics

Які параметри потрібно проаналізувати для ідентифікації спамера?

  1. Джерело - неприродний або нетематичні адреса сайту говорить сам за себе.
  2. Нові сеанси і Показник відмов - в першу чергу зверніть увагу на значення 0% або 100%.
  3. Ім'я хоста - набір символів або «not set».
  4. Дублювання значень в додаткових параметрах. У нашому випадку - дані для «Ім'я хоста» і «Назва екрану» для сайтів erot.co, sanjosestartups.com, непереводімая.рф і так далі частково або повністю збігаються.

Порівняння даних імені хоста і назви екрану для однакових джерел Порівняння даних імені хоста і назви екрану для однакових джерел.

5. Списки спамерів Google Analytics в мережі. Якщо мішенями спамерів стає велика кількість людей, то і списки спам-роботів будуть збігатися. Розуміючи це, Ви можете відсіяти частину спаму заздалегідь. Налаштуйте фільтр по чужому списку спамерів - приклад такого списку знаходиться тут . Або зробіть загальний список спамерів для декількох SEO-проектів і застосуєте до кожного сайту окремо.

Як виключити реферальний спам: фільтри Google Analytics

Як ми вже писали вище, обидва види спаму - Ghost spam і Crawler Referrer Spam - можна виключити зі звітів внутрішніми інструментами GA, налаштувавши відповідні фільтри.

Важливо! Чи не застосовуйте фільтри до основного поданням Google Analytics, інакше частина даних для вашого сайту не буде зібрана. Для фільтрації даних використовуйте наявне додаткове уявлення або створіть його ( Детальніше ).

Фільтр по джерелу кампанії

Будь-які метрики Google Analytics - кількість переходів, тривалість сесій, події і все інше - мають джерело. Щоб виключити її зі звіту, внесіть URL певного сайту як джерела кампанії в фільтр уявлення з налаштуванням «Виключити». Надалі всі дані з цього джерела не будуть додані до звіту. Як налаштувати фільтр:

  1. Прихильника чи критика наразі Google Analytics.
  2. Перейдіть на вкладку «Адміністратор».
  3. Виберіть уявлення, до якого буде застосований фільтр. Основне уявлення не потрібно чіпати :)

4 4. У меню відразу під обраним поданням виберіть «Фільтри». 5. Клацніть "Фільтри» → «Новий фільтр». 6. Заповніть поля, як показано на скронях нижче. Налаштування антиспам фільтра за джерелом кампанії. 7. Збережіть фільтр. Такий фільтр виключить всі дані, які приходять із зазначеного джерела, в тому числі і спам в розділі «Події».

Фільтр по імені хоста або по будь-якому іншому параметру

Як налаштувати фільтр: пункти 1-5 ті ж - перейдіть на вкладку «Адміністратор», виберіть уявлення і відкрийте вкладку створення нового фільтра. Далі так само заповнюємо фільтр, тільки замість «Джерело кампанії» вибираємо «Ім'я хоста».

Аналогічним чином можна відфільтрувати спамние дані і за іншими параметрами. Головне, визначити параметр, який однозначно визначить небажаний джерело.

Важливо! Обов'язково перевіряйте фільтр перед застосуванням. Наприклад, ви можете вказати адресу сайту, ім'я хоста якого потрібно виключити. Припустимо, що для сайту в якості імені хоста вказано домен вашого ресурсу. Але цей домен автоматично вказується в імені хоста і для всіх природних рефералів. Таким чином, якщо ви застосуєте «не дивлячись» цей фільтр, дані з природних джерел також будуть виключені.

Виняток звернень роботів

Виключити Crawler Referrer Spam можна в налаштуваннях уявлення. Послідовність та ж:

  1. Прихильника чи критика наразі Google Analytics.
  2. Перейдіть на вкладку «Адміністратор».
  3. Виберіть уявлення.
  4. Увійдіть в «Налаштування уявлення».

Як налаштувати уявлення Google Analytics 5 Як налаштувати уявлення Google Analytics 5. Відзначте пункт «Виключення звернень роботів і павуків». Виняток звернень роботів з даних уявлення Google Analytics Тепер Google Analytics на підставі власного алгоритму буде визначати звернення роботів і відсівати їх.

А чи потрібно морочитися?

Ми вирішили поцікавитися у Middle SEO фахівця агентства Netpeak Олексія Даниліна про те, як він фільтрує дані по своїм проектам. На думку Олексія, все залежить від ситуації. Перш ніж витрачати час на відстеження спамерів і настройку фільтрів, варто оцінити, чи потрібно це конкретним проектом. Якщо спам становить незначну частину всієї аналітики, або якщо вам важливо відстежити окрему тенденцію серед користувачів (наприклад, розподіл мобільних і десктоп відвідувань) - можна відфільтрувати дані, переглянувши це співвідношення тільки для відвідувачів з органічного пошуку, або для всіх відвідувань, крім реферального трафіку.

Щоб уникнути плутанини в події, можна заздалегідь віднести кожне налаштоване подія до окремої групи, при цьому всі можливі зовнішні події будуть залишатися в загальному списку і ніяк не потраплять в якусь із груп. Коли ви створюєте окреме подання, безумовно варто відсіяти з статистики звернення роботів і павуків. Налаштовувати додатково фільтри від спаму - потрібно дивитися для кожного проекту індивідуально.

короткі висновки

Хороші новини: повну картину по своєму сайту бачите тільки ви, ніхто не має доступу в ваш Google Analytics. Погані новини: відіслати неправдиві дані в ваш GA можна практично завжди. Визначити ID - теж. Хороші новини: як правило, ID саме Вашого аккаунта нікому не потрібен. Найчастіше неправдиві дані потрапляють в GA після генерації випадкових чисел і з метою реклами іншого ресурсу. Більше хороших новин: спам можна виключити зі звітів за допомогою фільтрів і налаштувань. Або, якщо він не заважає жити, можна просто не звертати на нього уваги. Залишилися питання? Будемо раді відповісти на них в коментарях.

Навіщо спамити в Google Analytics?
Як вони це роблять?
Які параметри потрібно проаналізувати для ідентифікації спамера?
Чи означає це, що хтось має доступ до вашого профілю, або що хтось спеціально впливає на дані сайту в GA?
Як вони це роблять?
І як виключити подібні дані зі звітів?
Як вони це роблять?
Як же дані потрапляють в Google Analytics?
Як визначити реферальний спам в звітах?
А чи потрібно морочитися?

Дополнительная информация

rss
Карта