Внутрішні коригування сторінок: Технології flash і javascript, використання фреймів і ідентифікаторів сесій в динамічних URL, а також биті посилання на сайті

  1. Використання технологій Flash, JavaScript і frame Технологій створення сайтів дуже багато, але пошукові...
  2. формування ЧПУ
  3. Биті посилання на сайті

Використання технологій Flash, JavaScript і frame

Технологій створення сайтів дуже багато, але пошукові системи навчилися індексувати не всі з них. Якщо весь сайт або один з ключових елементів зроблений з використанням технологій Flash, Frame або JavaScript, то просувати такий сайт буде практично неможливо.

Технологія Flash використовується для виробництва reach-media сайтів або різних елементів сайту, таких як банери, спливаюча реклама, навігація і т.д. Ця технологія дозволяє створювати красиві сайти з красивими елементами, але, на жаль, пошукові системи не читають Flash.

В Яндексі в Flash документі може індексуватися текст, який розміщений в наступних блоках: DefineText, DefineText2, DefineEditText, Metadata.Посилання індексуються, якщо вони розміщені в блоках: DoAction, DefineButton, DefineButton2.Але, як показує практика, при ранжируванні перевага віддається все ж HTML сторінок.

Мінуси Flаsh технологій для просування сайту :

  • Для пошукової системи існує тільки текст. Якщо навігація на сайті і текст зашиті під Flash-об'єкт, то це обмежує доступ пошукового робота до посилань на значущі сторінки сайту, які містять необхідний для просування контент. Таким чином, кількість ключових слів, за якими сайт може потрапити в TOП видачі пошукової системи, зменшується.
  • Якщо весь вміст сайту знаходиться в одному Flash файлі, що представляє з себе одну сторінку, немає можливості розподіляти ключові слова за додатковими сторінками.
  • У браузері неможливо побачити контент без установки Flash plug-in.
Щоб перевірити сайт на використання технологій Flash, необхідно відключити Flash в браузері.Якщо весь сайт, частина основного контенту або меню пропадають, або якщо навігація по сайту неможлива або утруднена, значить, на сайті використаний Flash, і, як наслідок, для просування є перешкоди.

Якщо весь сайт, частина основного контенту або меню пропадають, або якщо навігація по сайту неможлива або утруднена, значить, на сайті використаний Flash, і, як наслідок, для просування є перешкоди

Коли проблема виявлена, необхідно оцінити її масштаби. Flash меню можна виправити на звичайне статичне меню або зробити наскрізний контрольний футер. Якщо ж навігація на Flash вже дублюється в якомусь додатковому статичному меню сайту, то робити наскрізний контрольний футер немає необхідності.

Коли основний контент або весь сайт повністю реалізований на Flash, то найкращий варіант - створення наскрізного посилального футера і розміщення контенту вище (нижче, збоку) від Flash об'єкта. Іншим, більш трудомісткий варіантом, є створення HTML версії сайту.

Аналогічні перешкоди для індексації сайту несе використання на сайті технологій JavaScript. Якщо в браузері відключена підтримка JavaScript і сайт при цьому перестає нормально функціонувати, але, головне, зникає можливість використовувати меню і читати текст, то проблема повинна вирішуватися на рівні web-розробників.

Використання технологій JavaScript в меню можна також обчислити, навівши курсор на посилання. Якщо внизу в рядку стану браузера відображається не звичайна посилання, а параметр Javascript, то це посилання не бачать пошукові системи. У випадках використання JavaScript технологій рекомендується переписати код сайту з використанням індексованих форматів. Інший варіант - додати на сторінку додаткове статичне меню, яке можуть бачити інші користувачі з відключеною підтримкою JavaScript і, відповідно, пошуковим системам.

Ще момент, що утруднює індексацію, - використання фреймів. Frame - це формат веб-сторінок, що використовують безліч незалежних секцій для створення однієї сторінки. Кожен фрейм побудований як окремий HTML-файл, але з одним «майстер» -Файл, що ідентифікує кожну секцію. Розглянемо приклад, представлений на малюнку. У різних розділів сайту (фреймів) однаковий URL.

Використання фреймів може перешкодити пошуковій машині проаналізувати сторінки сайту. Крім того, всередині фреймів може бути порушена посилальна цілісність. Пошукові системи, зокрема Яндекс, вказують на допустимість використання тегів <frameset>, <frame> і <noframe>. Однак при використанні даного формату є обмеження на доступ до важливих областей сайту, і в цьому випадку ймовірність того, що контент сайту з фреймами буде проігнорований пошукачем, різко підвищується.

Наявність фреймів можна виявити чисто візуально: зазвичай сторінка з фреймами розділена на кілька блоків з прокрутки. Більш точно їх можна виявити, відкривши вихідний код сайту. Присутність у вихідному коді сторінки тегів <frame>, <frameset>, <iframe>, <noframes> підтверджує використання фрейм-технології.

Для виправлення цієї ситуації потрібно реструктурувати верстку сторінок сайту. Рекомендується замість фреймів використовувати теги форматування таблиць. Так як можливостей працювати з кадрами багато, то в деяких випадках буде досить використовувати відповідні теги, наприклад, <noframe>. Однак з досвіду можна сказати, що сторінки HTML більш високо ранжуються, ніж такі екзотичні формати, як frame.

Ідентифікатори сесій і динамічні URL

Крім проблем, які можуть нести в собі різні технології створення сторінок, існують складнощі, пов'язані з адресами сторінок. Це URL з ідентифікаторами сесій і динамічні URL, що збільшують кількість дублів на сайті.

Ідентифікатор сесії - це унікальний символьний код, який додається до URL сторінки для відстеження кожного відвідувача сайту. Адреса з ідентифікатором сесії містить в собі SessionID , Або SID. Всі URL з ідентифікатором сесії є динамічними URL. наприклад:

наприклад:

Динамічні URL - це адреса сторінок сайту, які містять спеціальні символи ( «?», «&», «=» І т.д.) і функції, які з'являються в результаті роботи різних скриптів на сайті. Наприклад, http://dedal-kovka.ru/?page_id=54.

Справа в тому, що роботи пошукових систем сприймають ідентифікатори як унікальні URL, оскільки при кожному заході на сайт роботу приписується новий ідентифікатор.Це тягне за собою появу дублів сторінок в індексі, тому щона сайті з'являється велика кількість дубльованих сторінок, а також підвищує навантаження на сервер.

Через те, що ідентифікатори сесій перетворять URL, це викликає серйозні проблеми з індексацією.

Сучасні алгоритми пошукових систем дозволяють з великим ступенем точності відсівати адреси з ідентифікаторами сесій, однак бувають випадки, коли визначити ідентифікатор неможливо.

Щоб уникнути появи дублів в індексі, слід зробити наступні дії:

1. Заборонити пошуковим роботам індексувати сторінки з ідентифікаторами сесій при першому заході.

2. За допомогою 301 редіректу перенаправляти відвідувачів, що приходять на сторінку з ідентифікатором сесій, на сторінку без нього.

3. Якщо відмовитися від використання ідентифікаторів сесій неможливо, слід застосувати спеціальний PHP код, який заборонить відкриття сесій для роботів пошукових систем. В результаті впровадження даного коду роботи пошукових систем замість сесії будуть отримувати помилку 404.

Для заборони індексації пошуковим роботам сторінок з ідентифікаторами сесій слід в файл .htaccess додати наступні рядки:

php_flag session.use_trans_sid Off (відключення передачі ідентифікатора через додавання його до URL)
php_flag session.use_only_cookie On (вказівка ​​сервера передавати ідентифікатори через cookie)
php_flag session.auto_start On

Приклад коду, що дозволяє заборонити відкриття сесії для пошукових роботів:
$ se_mask = «(Yandex | Google bot | StackRambler | YahooSlur

p | WebAlta | msnbot )»;
if (ereg ($ se_mask, $ _ SERVER [ 'HTTP_USER_ AGENT'])) {if (! empty ($ _ GET [ 'PHPSESSID'])) {header ($ _ SERVER [ 'SERVER_ PROTOCOL']. »404 Not Found »); exit (); }
} Else {session_start (); }

4. Закрити для роботів індексацію сторінок з ідентифікаторами сесій можна також за допомогою інструментів самих пошукових систем. Для Яндекса в директиві Clean-param слід прописати всі адреси сторінок сайту з динамікою, які не змінюють зміст сторінок. Для Google в інструментах вебмастера в розділі «Конфігурація сайту - Налаштування - Обробка параметрів» слід задати динамічні параметри, які роботи будуть ігнорувати. В результаті таких маніпуляцій у сторінок, що додаються в індекс, з URL буде віддалятися ідентифікатор сесій.

Перетворення посилань з динамічних в псевдостатіческіе здійснюється на підставі прописаних в базі даних alias-урлов і налаштування ЧПУ на рівні CMS сайту.Після цього ЧПУ налаштовується на рівні сервера: в файл .htaccess додається правило mod_rewrite для внутрішнього перетворення URL.Завершальний етап - настройка 301 редиректу.

В цілому оптимізатори воліють замість динамічних URL налаштовувати псевдостатіческіе URL або ЧПУ , Організовуючи 301 редирект з динамічних на статичні сторінки.

Позбавлення від ідентифікаторів сесій і динамічних адрес - важливий етап технічної оптимізації сайту, так як це допомагає усунути дублі сторінок в індексі і отримати коректне ранжування основних сторінок.

формування ЧПУ

Часто при заміні динамічних URL на псевдостатіческіе в якості адреси використовують написання заголовка сторінки транслітерацією.

ЧПУ - це формат адресації сторінок сайту, зручний для розуміння людиною. ЧПУ розшифровується, як «человекопонятний урл» (де «урл» - транслит URL).

Наприклад, ЧПУ може виглядати так:

http://promo.ingate.ru/prodvizhenie-sajta/

ЧПУ можуть містити транслітеровані входження просуваються запитів (або англомовні запити), тому вони досить корисні для просування сайту в пошукових системах. Налаштувавши ЧПУ на сайті, важливо не забути налаштувати коректний редирект зі старих адрес на нові.

Формуючи ЧПУ, не варто забувати основні принципи:

Всі адреси на сайті повинні мати подібний формат. наприклад:
www.site.ru/12/35
www.site.ru/12/32
www.site.ru/13/1 і т.д.
Адреси нових URL сторінок не повинні бути занадто довгими (оптимально 50-70 символів) або містити спам (перерахування ключових слів).

Багато сучасних CMS вже підтримують ЧПУ на базовому рівні, мають власні алгоритми формування адрес і таким чином полегшують роботу веб-майстра. У будь-якому випадку найкращий спосіб визначать веб-розробники, виходячи з особливостей вашого сайту.

ЧПУ дуже важливі для просування висококонкурентних запитів на внутрішніх сторінках, тому при наявності динамічних URL варто заздалегідь підготувати псевдостатіческіе адреси в форматі ЧПУ.

Биті посилання на сайті

Биті посилання - це посилання, які ведуть на неіснуючу сторінку сайту, тобто на 404 помилку. Такі посилання виникають, коли динамічні URL замінені псевдостатіческімі, але перенаправлення не реалізоване, або коли сторінка видалена з сайту, але посилання на неї з інших сторінок сайту не прибрали; або якщо в URL сторінки міститься помилка.

Наявність битих посилань на сайті - це прояв байдужості до відвідувачів і джерело проблем для пошукових роботів, адже вони переходять на неіснуючі сторінки. Пошукові системи не можуть потрапити на сторінку і проіндексувати дійсно важливий контент, а відвідувач перебуває в подиві, чому посилання поставлена ​​на відсутню сторінку. Такі посилання потрібно вчасно усувати.

Важливим завданням пошукової оптимізації є надання пошуковому роботу доступу до якомога більшої кількості контенту на сайті, щоб він міг проіндексувати його і надати користувачеві відповідь на пошуковий запит.Наявність битих посилань обмежує можливість індексації вмісту сайту.

Биті посилання виявляються за допомогою дослідження навігації сайту. Якщо є сторінки, при переході на які надається 404-й відповідь, це означає, що вони биті. Щоб виправити ситуацію, потрібно:

1. відновити контент на битих сторінках;

2. видалити посилання на неіснуючі сторінки з інших сторінок сайту, якщо контент на битих сторінках не може або не повинен бути відновлений;

3. виправити URL на коректний в разі помилки в адресі.

Якщо ці дії проблематично здійснити, слід закрити биті сторінки від індексації в файлі robots.txt .


Повернутися назад: Супутні настройки сайту Читати далі: Дублі сторінок


«?
Ru/?

Дополнительная информация

rss
Карта