Зникли збережені копії в яндексі. Що таке кеш сторінки і для чого він потрібний? Як знайти в кеші Google, Yandex

Ми випустили нову книгу «Контент-маркетинг у соціальних мережах: Як засісти в голову передплатників та закохати їх у свій бренд».

Збережена копія в Яндексі – це версія сторінки, яка занесена до пошукової системи Яндекс.

Більше відео на нашому каналі - вивчайте інтернет-маркетинг із SEMANTICA

При перегляді видачі результатів пошуковика на введений користувачем запит у сніпеті кожного сайту можна побачити блок з додатковою інформацією. Одним із розділів блоку з додатковою інформацією є «Збережена копія».

Щоб зрозуміти, що собою являє збережена копія Яндекса, розберемо просту аналогію. Уявіть, що ви написали доповідь чи твір. Ви здали роботу, відправили її на конкурс, але перед цим встигли скопіювати. Потім потрібно ще раз зробити цю роботу вже для іншого конкурсу. Щоб не писати все заново, не відновлювати в пам'яті всі деталі, ви дістаєте збережений файл і пишіть по ньому новий твір. Збережена сторінка Яндекса виконує функцію цієї копії. З її допомогою можна переглянути сайт, якщо з тих чи інших причин немає доступу до інтернет-ресурсу.

Для чого потрібна збережена копія сторінки в Яндексі

Насамперед зазначимо, що збережена копія в пошуковій системі Яндекс - це важливий інструмент SEO оптимізатора. З її допомогою можна побачити, яка версія документа вже проіндексована роботами пошукової системи та бере участь у ранжируванні, а які сторінки ще не пройшли цей процес. Таким чином, наявність збереженої сторінки в Яндексі – індикатор успішно пройденої індексації.

У ході роботи з інтернет-ресурсами можуть виникнути різні ситуації. Зокрема, на сайтах періодично здійснюються технічні роботи: внесення коригувань у дизайн/зміна шаблону/редагування або видалення текстових матеріалів. У ході даних робіт легко можна припуститися помилки, що веде до негативних наслідків: зникнення дизайну/тексту/іншого елемента, зміна шаблону не за планом і так далі. Напевно, кожен розробник сайтів мав такий сумний досвід. Якщо є можливість бекапу або підключений якісний хостинг, через який можна повернути все як було чудово. Але ресурси-початківці, як правило, не мають такої можливості. У цьому випадку допоможе збережена копія сторінки в Яндекс. З її допомогою можна побачити, як все було на момент індексації роботами та відновити вигляд сторінки, виправити помилки. Але врахуйте, що зберігання сторінки в індексі не вічне, і якщо на неї робот зайшов у період, коли вона вже була в неробочому стані, ви можете не побачити старої інформації...
Ще одна ситуація, коли корисна буде збережена копія сторінки в Яндексі: під час роботи над сайтом ви змінили текстовий матеріал з метою збільшення релевантності сторінок. Тепер потрібно подивитися, чи виконано оновлення сторінки, де ви внесли зміни. Зробити це можна, переглянувши збережену копію.
Нерідко сайти бувають недоступні, причин для цього може бути багато: технічні неполадки, минув термін хостингу і таке інше. Щоб у цій ситуації зайти на сайт, потрібно знайти збережену копію та переглянути її. Таким чином, користь збережених сторінок Яндекса очевидна.

Як переглянути збережену копію сторінки в Яндексі

Всі сучасні пошукові системи, та Яндекс не виняток, дозволяють користувачам відкрити потрібні веб-документи через їхній індекс. Це можна зробити швидко за допомогою спеціальних сервісів або вручну. У першому випадку на допомогу прийдуть сервіси: Page Promoter у Firefox, RDS bar для Хром та інші. Однак плагіни періодично можуть некоректно працювати і виходити з ладу, тому володіти ручним методом також потрібно.

Перший спосіб

Відкриваємо пошуковик Яндекс і в рядку пошуку прописуємо саму адресу потрібної сторінки або запит, що цікавить. У результатах пошуку ми бачимо, що у сніпеті кожного результату є маленька стрілочка. Натискаємо на стрілочку та вибираємо «Збережена копія». Після цього ми відвідаємо сайт, його збережену сторінку від якоїсь минулої дати.

Другий спосіб

Спосіб полягає у застосуванні спеціальних розширень браузера/плагінів/онлайн сервісів. Найбільш популярним сьогодні є RDS bar. Інтерфейс плагіна більш ніж простий, за його допомогою можна переглянути останні зміни сторінки, коли сторінку востаннє відвідував робот, отже копія надається за це число. Якщо потрібна сторінка не пройшла індексацію Яндекса, її збережена копія не відображатиметься у результатах видачі пошукової системи.

Чому немає збереженої копії сторінки в Яндексі

Іноді при пошуку збереженої копії сторінки можна не побачити потрібного пункту при натисканні на стрілку в сніпеті. Причин тому може бути кілька:

Перший варіант – некоректна робота ПС. Сам Яндекс зізнається, що не гарантує наявність і показ таких копій для всіх сторінок через велику кількість причин.

2. Друга ситуація - у коді документа знаходиться метатег "robots" і він має значення "noarchive" - заборона кешування. Щоб уникнути падіння трафіку, необхідно уважно налаштовувати такі речі.

Чим може загрожувати відсутність копії в Яндексі

Сама собою відсутність копії не буде впливати якось негативно на просування. А ось причини, які призвели до відсутності, можуть пошкодити, тому розберіться з ними.

Чим справді може обернутися проблема з копіями сторінок, то це складнощі при роботі з біржами посилань.

Наприклад, у Сеопульті сьогодні є параметр, який здійснює контроль за тим, чи є збережена копія Яндекса. Цей параметр називається NIC - No Index Cache. Він свідчить, що сторінка не має збереженої копії. З такого ресурсу не купуватимуть посилання, нікому не хочеться ризикувати та платити за те, що може не принести користі.

Як ви бачите, збережена копія в Яндексі дозволяє вирішити низку проблем та оптимізувати використання інтернет-трафіку. Дані рекомендації дозволять оперативно відкривати та переглядати їх.

Існує справжня, реальна машина часу, в якій можна ненадовго повернутися в минуле і побачити, наприклад, як виглядав той чи інший сайт кілька років тому. Думаєте, нікому не потрібні копії сайтів багаторічної давності? Помиляєтесь! Для багатьох людей сервіс з архівування інформації дуже корисний.

По-перше, це просто цікаво! З чистої цікавості та від надлишку вільного часу можна подивитися, як виглядав улюблений, популярний ресурс на зорі його народження.

По-друге, далеко не всі власники сайтів ведуть свої архіви. Знати місце, де можна знайти інформацію, яка була на сайті в якийсь момент, а потім зникла, не просто корисно, а дуже важливо.

По-третє, саме собою порівняння є найважливішим методом аналізу, що дозволяє оцінити хід і результати нашої діяльності. До речі, під час аналізу веб-ресурсу дуже ефективно використовувати низку методів порівняння.

Тому наявність унікального архіву веб-сторінокІнтернету дозволяє нам отримати доступ до величезної кількості аудіо-, відео- та текстових матеріалів. За твердженням розробників, «інтернет-архів» зберігає більше матеріалів, ніж будь-яка бібліотека світу. Ми потрапили у правильне місце!

Що потрібно, щоб знайти копії сайтів інтернету

Щоб відправитися в минуле, потрібно перейти на сайт archive.orgта скористатися пошуковим рядком.

Простий пошук в архіві збережених сайтів видає нам посилання на всі збережені копії запитуваної сторінки.

З цього видно, що сайт був створений в 2012 році (До речі, важливо відзначити, за допомогою практично ідеального хостингу Спринтхост- Рекомендую!). Перемикаючись на потрібний нам рік, можна побачити дати, виділені кружальцями, і є дати збереження копії сайту. Наприклад, у 2015 році, поки можна буде побачити лише одну копію від 7 лютого.

Звичайно, це чудовий ресурс! Адже тут індексуються та архівуються всі сайти інтернету! Це не тільки скріншоти… Маючи в руках такий інструмент, можна відновити масу інформації, що втрачена з часом.

Треба зауважити, що, безумовно, все відновити однозначно не вийде, оскільки якщо на сторінках сайту використовуються елементи Java Script, або скрипти або графіка взяті зі стороннього сервера, то на відновлення такої інформації розраховувати не доведеться. Тому до збереження даних свого сайту потрібно ставитись з особливою увагою, незважаючи ні на що.

Користуючись нагодою, я зробила скріншоти та відновила у пам'яті, як виглядав мій сайт, починаючи з 2012 року. Цікаво подивитися))

Сайт буквально недавно «народився»)) Січень 2012..

Минає час, і хочеться щось змінити… Кінець 2012-го.

Напевно, настав час уже щось змінювати. 2013-й. Це тема, яка й сьогодні встановлена на моєму сайті.

До зміни теми ставлюся з обережністю, тому що пам'ятаю останній «переїзд», після якого кілька місяців відновлювала відвідуваність сайту. Якось не дуже вдало вийшло.

Сподіваюся, що й моїм читачам ця чудова інтернет-бібліотека — «машина часу» зможе допомогти пересуватися у часі, коли вони цього захочуть. Подивіться, як виглядали раніше деякі сайти ще за часів свого зародження. Якими раніше були google або яндекс, можна побачити тільки на archive.org, аналогів цього ресурсу немає. Приємної подорожі, друзі!

Уявіть ситуацію: ви створюєте веб-сайт. Наймаєте веб-майстра або робите його самі, витративши на це багато грошей та особистого часу. Розміщує своє дітище на хостингу і любовно заповнюєте його інформацією, не замислюючись про те, що потрібно зберегти копію сайту, щоб не втратити дані.

В один день, не дуже вам прекрасний, ви заходите на свій сайт, а він не працює. Ви починаєте дізнаватися, в чому річ, і, жах, згорів дата-центр або полетів хостинг. А може, до вас забрався вірус та знищив дані. Втрата інформації на сайті можна порівняти з втратою інформації на комп'ютері. То як зберегти копію сайту?

Розберемося спочатку з визначенням. Процес архівування веб-сайтів — це зберегти поточну версію сторінки або сайту в архіві для подальшої роботи з ним. Для цього використовується спеціалізоване програмне забезпечення. Найбільшою компанією у світі є Internet Archive, про яку ми поговоримо нижче.

Для приватного архіву ви можете скористатися офлайн-браузерами, спеціально створеними для роботи в офлайн-режимі. Вони допоможуть створити локальні копії окремих веб-сторінок або сайтів. До них, наприклад, належать:

Крос-платформний HTTrack-браузер, який підтримує 29 світових мов та здатний відновлювати перервані завантаження, оновлювати дзеркало сайту.
Умовно безкоштовний Offline Explorer, який дозволяє завантажувати не лише файли чи сторінки, а й цілі сайти з Інтернету за протоколами FTP, HTTP, HTTPS, RTSP, MMS, BitTorrent.
Free Download Manager. Він інтегрується з усіма браузерами, має вбудований FTP, підтримує протокол BitTorrent, може створювати файли torrent, перехоплювати посилання з буфера обміну.
Teleport Pro із закритим вихідним кодом для Windows. Програма дозволяє завантажувати сайти повністю.
Вільна консольна неінтерактивна програма для завантаження файлів та сайтів з Інтернету Wget. Програма підтримує протоколи HTTPS, HTTP, FTP, а також може працювати через проксі-сервер HTTP. Підходить для Linux.

Створення резервної копії на хостингу

Можна налаштувати сайт на вашому хостинг-провайдері. Для цього вам потрібно зайти в адмінпанель, розділ створення резервних копій. Кожен хостинг має свою адмінпанель, і важко сказати, де саме у вашого розміщується цей розділ. Якщо ви не можете розібратися, напишіть у технічну підтримку.

Створення резервної копії плагінами

Якщо ваш сайт розміщується на CMS-платформі, наприклад, WordPress, ви можете зберегти копію сайту, встановивши плагін wp-db-backup (ru.wordpress.org/plugins/wp-db-backup/) або схожі на нього. Правильно налаштувавши плагін, ви отримуватимете бекап сайту кожен день або щотижня, як забажаєте.

Як зберегти копію сайту на комп'ютер

На комп'ютері можна зберегти сайт, використовуючи FTP-клієнт. Якщо ви користуєтеся програмою FileZilla, створіть на своєму комп'ютері папку "Бекап" (ім'я папки може бути будь-яким). Підключіться до сервера через FTP-клієнт і простим перетягуванням зробіть повний бекап сайту в папку "Бекап".

Крім цього, можна скористатися сервісом Site2ZIP (сайт в архів), програмою для завантаження WinHTTrack WebSite Copier. Як переглянути збережену копію сайту? Для цього потрібно відкрити папку, в якій було збережено сайт, і клацнути на файл index.html.

Інтернет-архів

У Сан-Фарнциско 1996 року Брюстер Кейл заснував некомерційну організацію "Архів Інтернету". Він збирає копії всіх веб-сторінок, аудіо- та відеозаписи, графічні файли та програми. Тут дуже довго зберігаються архіви зібраного матеріалу та є до своїх баз безкоштовний доступ для всіх бажаючих.

Якщо ви запитуєте, як відкрити збережену копію сайту, перейдіть за адресою archive.org/web/ і у відповідному полі введіть адресу сайту або сторінки. Наприкінці 2012 року розмір Інтернет-архіву складав 10 петабайт – це 10 000 терабайт! А до середини 2016 року в ньому накопичилося 502 млрд. копій веб-сторінок.

пошуковими системами

Збережена копія сайту Google — це не що інше, як кеш сторінок сайту, зроблений пошуковою системою. Будь-який користувач у будь-який момент може використовувати копію сторінки для своїх потреб. Збереження їх на серверах пошукових систем займає багато ресурсів, і для цього виділяється чимало грошей, але така допомога окупає себе, оскільки ми однаково заходимо на пошукові системи. Правда, цей спосіб підходить тільки для існуючих сайтів або для тих, що були видалені нещодавно. Якщо це сталося досить давно, то пошукова система стирає дані.

Спеціалізована пошукова система

Крім того, що ви можете вручну шукати кешовані сторінки в Google або "Яндексі", ви можете скористатися спеціалізованою пошуковою системою cachedview.com. Він має аналог: cachedpages.com.

Якщо ви бажаєте зберегти копію сайту або його окремої сторінки, ви можете зробити це самостійно та безкоштовно на сайті archive.is. Крім цього, там є і глобальний пошук за версіями, які коли-небудь були збережені користувачем.

Створення веб-архіву у національних бібліотеках

На сьогоднішній день перед національними бібліотеками стоїть завдання створення архівів інтернет-документів, які є частиною наукової, культурної та історичної спадщини людства. Але це дуже проблематично.

Проведені дослідження виявили, що кількість веб-документів у Мережі зростає експоненційно і в середньому документ живе від одного до чотирьох місяців. Як одиниця обліку архіву веб-документів найзручніше використовувати веб-сайт. Процес створення фонду полягає у створенні копії чи "дзеркала" сайту. Оскільки інформація на ньому змінюється з часом, бібліотеці потрібно створювати дзеркала одного і того ж веб-сайту з певною періодичністю.

Так, у Швеції 60 000 сайтів, що у 20 разів перевищує кількість традиційних друкованих видань. Примірники друкованих документів у бібліотеці Швеції займають 1,7 км полиць на рік. Веб-архів зайняв би 25 км полиць! Наразі їх архів містить 138 млн файлів загальною вагою 4,5 гігабайта.

Інтернет зростає щодня. Є безліч компаній та сайтів, які дбають про те, щоб зберігати копії веб-сторінок у своїх архівах. Але не варто покладатися лише на них. Робіть своєчасні бекапи, і ви не втратите свій сайт ніколи.

Що значить «Відсутня збережена копія в Яндексі!»і як це впливає на сайт загалом. По-перше, якщо ви продаєте посилання зі свого сайту, то відсутність сторінок у кеші Яндекса негативно вплине на доход веб-майстра.

Наприклад, у сеопульті є параметр, що контролює наявність сторінки в кеші пошукової системи.

Називається він nic (no index cache)- це означає, що сторінка не має «збереженої копії».

На сьогоднішній день у Сеопульті перевіряється індекс Яндекса. У перспективі планують додати і перевірку у Гугле.

Ось як це виглядає на графіку. Довгий час траст дорівнював дев'яти, але потім різке падіння.

Я почав шукати причину відсутності збереженої копії сайту в пошуковому індексі. І навіть написав у службу підтримки TrustLink.

Добридень. Скажіть, будь ласка, з чим може бути пов'язане падіння трасту біля мого блогу. Параметр XT за останні два апа Яндекса знизився з 9 до 7. Одночасно і знизився дохід у Трастлінк.
Вітаю! Цей показник не є офіційним поданням Яндекса, тому причини його падіння нам не відомі.
Тобто зменшення кількості розставлених посилань сеопультом із цим не пов'язане. А чому спостерігається зменшення доходу?
Під час перевірки частина сторінок, на яких було куплено посилання, була відсутня в кеші Яндекса. Посилання було знято, тому просів дохід.
А чи не підкажіть чому сторінки відсутні в кеші Яндекса? У індексі є, а у кеші ні? Як можна вплинути на те, щоб вони опинилися в кеші?
Це вже питання до техпідтримки Яндекса, часто апдейт кешу відбувається трохи пізніше за апдейт видачі/індексу, звідси виходить така проблема
Так, саме так. Для досягнення максимальної ефективності посилання потрібна наявність сторінки в кеші.

Потім я поставив питання на техпідтримку Яндекса.

Добридень.
Наразі відсутня збережена копія в Яндексі. Підкажіть, будь ласка, у чому причина. Блог працює на Вордпрес.
Крім того мій блог мав траст xt = 9. За останні два апдейти траст впав до 7. Я намагаюся покращувати свій блог, а тут два такі негативні моменти. Із чим це може бути пов'язане і як можна виправити ситуацію?
Адреса сайту: //www.сайт
З повагою, Ілля.

І продовжував шукати причини.

Стаття на тему: Як знайти зворотні посилання

Виявляється, після оновлення плагінів, прапорець навпроти значення неархів був включений. Внаслідок чого на кожній сторінці мого блогу з'явився рядок, що забороняє кешування сторінки. Можливо, з цієї причини я втратив дві одиниці трасту.

Прибравши цей тег, вимкнувши прапорець у плагіні Robots Metaя переконався в його відсутності на сторінках свого блогу.

Add noarchive meta tag
Prevents archive.org і Google від публікування сторінок ваших сторінок у своїх архівах / cache.

Будьте уважні при настроюванні плагіна Robots Meta для Вордпрес!

Дізнавшись про тег, що забороняє кешування, я написав у супорт Трастлінка.

Доброго дня. Я вже з'ясував причину падіння трасту та відсутності копії блогу у кеші Яндекса. Мабуть, при оновленні плагінів Вордпреса на сторінках був присутній тег noarchive. Виявивши це я негайно прибравши його і сьогодні вже траст знову став 9, піднявшись відразу на 2 одиниці. Даремно оптимізатори знімали свої посилання.
Вітаю! Чекайте на відновлення закупівлі найближчим часом.

І тут мені надходить відповідь із служби підтримки Яндекса.

Вітаю!
Справа в тому, що на момент останньої індексації сторінок, в їхньому коді містився мета-тег noarchive. Це явна заборона показу збереженої копії в результатах пошуку. Зараз тег прибраний, але збережена копія не з'явиться, поки робот не оновить документи в нашій пошуковій базі.
У деяких випадках, робот може вважати зміни, внесені на сторінці незначними, наприклад, якщо текст на сторінці практично не змінився або зміни стосуються лише html-розмітки. Такі документи не оновлюються в нашій пошуковій базі, оскільки внесені зміни на пошук не впливають.
З повагою, Платон Щукін
Служба підтримки Яндекса
//help.yandex.ru/

Наступного дня я знову перевірив свій блог у сервісі //xtool.ru/. І о диво! Миттєвий підйом на 2 одиниці!

Вітаю! Сьогодні пост про наболіле для більшості з початківців сайтобудівників. Мені доводилося дуже часто в коментарях відповідати на те саме питання. як видалити сторінки з пошуку, які були проіндексовані раніше, але через обставини, що склалися, були видалені і більше не існують, але як і раніше знаходяться в індексі пошукових систем. Або в пошуку знаходяться сторінки заборонені до індексації.

У коментарях особливо не розгорнешся, тому після чергового питання вирішив приділити цій темі окрему увагу. Для початку давайте розберемося, як такі сторінки могли опинитися в пошуку. Приклади наводитиму виходячи з власного досвіду, так що якщо я щось забуду, то прошу доповнити.

Чому закриті та віддалені сторінки є у пошуку

Причин може бути кілька і деякі з них я постараюся виділити як невеликий список з поясненнями. Перед початком дам пояснення що маю на увазі під «зайвими» (закритими) сторінками: службові чи інші сторінки, заборонені до індексації правилами чи мета-тегом.

Неіснуючі сторінки перебувають у пошуку з таких причин:

Найбанальніше - сторінка видалена і більше не існує.
Ручне редагування адреси web-сторінки, внаслідок чого документ, який вже знаходиться в пошуку, стає недоступним для перегляду. Особливу увагу цьому моменту слід приділити новачкам, які через свої невеликі знання зневажливо ставляться до функціонування ресурсу.
Продовжуючи думку про структуру, нагадаю, що за умовчанням після встановлення WordPress на хостинг вона не задовольняє вимогам внутрішньої оптимізації і складається з буквено-цифрових ідентифікаторів. Припадає на ЧПУ, при цьому з'являється безліч неробочих адрес, які ще довго залишатимуться в індексі пошукових систем. Тому застосовуйте основне правило: надумали змінювати структуру — використовуйте 301 редирект зі старих адрес на нові. Ідеальний варіант - виконати всі налаштування сайту до його відкриття, в цьому може стати в нагоді локальний сервер.
Неправильно настроєно роботу сервера. Неіснуюча сторінка має віддавати код помилки 404 або з кодом 3хх.

Зайві сторінки з'являються в індексі за таких умов:

Сторінки, як Вам здається, закриті, але насправді вони відкриті для пошукових роботів і знаходяться без обмежень (або не правильно написаний robots.txt). Для перевірки прав доступу до сторінок скористайтеся відповідними інструментами для .
Вони були проіндексовані до того, як були закриті доступними способу.
На ці сторінки посилаються інші сайти або внутрішні сторінки в межах одного домену.

Отже, із причинами розібралися. Варто зазначити, що після усунення причини неіснуючі або зайві сторінки ще довгий час можуть залишатися в пошуковій базі — все залежить від частоти чи відвідування сайту роботом.

Як видалити сторінку з пошукової системи Яндекс

Для видалення URL з Яндексдостатньо пройти за посиланням і в текстове поле форми вставити адресу сторінки, яку потрібно видалити з пошукової видачі.

Головна умова успішного запиту на видалення:

сторінка повинна бути закрита від індексації правилами robots або мета-тегом noindex на даній сторінці — якщо сторінка існує, але не повинна брати участь у видачі;
при спробі звернутися до сторінки сервер повинен повертати помилку 404 — якщо сторінку видалено і більше не існує.

При наступному обході сайту роботом запити видалення будуть виконані, а сторінки зникнуть з результатів пошуку.

Як видалити сторінку з пошукової системи Google

Для видалення сторінок надаємо аналогічним чином. Відкриваємо інструменти для веб-майстрів і знаходимо в списку Оптимізація пункт Видалити URL-адреси і переходимо за посиланням.

Перед нами спеціальна форма, за допомогою якої створюємо новий запит на видалення:

Натискаємо продовжити і дотримуючись подальших вказівок, вибираємо причину видалення. На мою думку, слово «причина» не зовсім підходить для цього, але це не суть…

З наведених варіантів нам доступно:

видалення сторінки сторінки з результатів пошуку Google та з кешу пошукової системи;
видалення лише сторінки з кешу;
видалення каталогу з усіма адресами, що входять до нього.

Дуже зручна функція видалення цілого каталогу, коли доводиться видаляти кілька сторінок, наприклад з однієї рубрики. Слідкувати за статусом запиту на видалення можна на цій сторінці інструментів з можливістю скасування. Для успішного видалення сторінок з Googleнеобхідні ті ж умови, що і для . Запит зазвичай виконується в найкоротші терміни і сторінка відразу зникає з результатів пошуку.