Москва:
+7 (911) 900-44-99
+7 (911) 900-44-99
Санкт-Петербург:
ул. Новый Арбат д. 21, б.ц. "Новый Арбат"
7-ая линия д. 76, б.ц. "Сенатор"
Главная » База знаний » Интересная информация о поисковых системах

Интересная информация о поисковых системах

SandBox от Google

Таинственное словосочетание Google SandBox (песочница Google) появилось в среде оптимизаторов в начале 2004 года. Это название получил новейший спам-фильтр, разработанный компанией Google специально для борьбы со спам-сайтами. Однако метод, который для этого использовался, сразу вызвал массу нареканий со стороны владельцев сайтов и оптимизаторов. Дело в том, что Google SandBox исключал из выдачи поисковой системы только что созданные молодые сайты.

При этом вновь созданный сайт не попадает в выдачу поисковой системы Google по практически по любой фразе, что сводит на нет все усилия оптимизаторов. Каким бы качественным не был сайт, какой бы полезной и интересной не была информация на нем, какой бы эффективным ни было продвижение сайтов, наличие в поисковой системе фильтра Google SandBox не давало Интернет-пользователям узнать о его существовании.

Разработчики фильтра оправдывались тем, что такой метод является эффективным способом борьбы с спам-сайтами. Действительно, ни один спамер не станет тратить деньги на создание сайта, который начнет работать только через несколько месяцев. Однако фильтра страдало гораздо большее количество нормальных, только созданных сайтов. В настоящее время Google SandBox отсеивает новые сайты только в англоязычном сегменте сети Интернет – сайты на других языках фильтрации не подлежат. Однако никто не может дать гарантии, что Google решит расширить возможности фильтра.

Какой алгоритм работы песочницы, и каковы признаки нахождения сайта в ней до сих пор известно только разработчикам SandBox, однако за годы работы фильтра было выявлено несколько закономерностей, которые можно использовать в качестве утверждений.

Обойти фильтр практически невозможно для обычного вебмастера. Есть ряд предложений, однако реализовать их под силу немногим. Поэтому больше ничего не остается, как ждать окончания действия фильтра. Заметить, что сайт попа под действие SandBox можно по нескольким признакам. Сайт нормально индексируется: на него регулярно заходит поисковый робот, у него есть свой PageRank, корректно принимаются и отображаются внешние ссылки, поиск по адресу сайта выдает правильные результаты (заголовок, сниппет и т.д.), сайт может находиться в поиске по уникальным словам и словосочетаниям. При этом сайт не попадает даже в ТОП 1000 по любым другим запросам, в том числе по тем, под которые создавался. Выход сайта из песочницы можно заметить сразу: у сайта наблюдается резкий, практически моментальный прирост рейтингов на 500 и более позиций.

 

LocalRank от Google

В феврале 2003 года компания Google получила патент на новый алгоритм ранжирования страниц под названием LocalRank. В его основе лежит не ранжирование всех страниц в Интернете на основе их общей ссылочной цитируемости, а использовать их «локальную» цитируемость, то есть цитируемость среде группы страниц, имеющих единую тематику с поисковым запросом.

В том виде, в котором алгоритм описан в патенте, он сегодня не используется, однако ряд содержащихся в нем идей будет интересен для любого оптимизатора, чтобы сделать продвижение сайтов более эффективным. Тематика ссылающихся страниц учитывается во всех поисковых системах. Несмотря на то, что это происходит по другим алгоритмам, изучение патента LocalRank позволит оптимизатору понять основные механизмы и общие идеи реализации такого учета.

 

Алгоритм LocalRank состоит из 3-х основных частей.

Ключевым этапом работы алгоритма является процедура ранжирования и получения страницей нового ранга LocalScore, поэтому рассмотрим этот пункт подробнее.

1. Для расчета LocalScore выделяются все страницы, которые релевантные поисковому запросу (их число равно N). Каждая из них имеет некоторый ранг OldScore. Алгоритм ранжирования в дальнейшем будет работать только с этими страницами. Из этих N страниц выделяются страницы, имеющие внешнюю ссылку на данную страницу (их число равно M). При этом происходит фильтрация страниц по IP адресу, чтобы в множество M не попали страницы, расположенные на том же хосте, что и рассматриваемая страница.

2. В множестве М выделяются подмножества Li, в которые попадают страницы с одинаковыми признаками: принадлежат одному хосту (совпадают первые три октета IP адреса), имеют одинаковое или схожее содержание (так называемые зеркала), относятся к одному сайту (домену).

3. У каждой страницы из подмножества Li также имеется свой ранг OldScore. Из них выбирается страница с самым большим рангом OldScore, а остальные далее не рассматриваются. Таким образом, из изначального множества N мы получаем некоторое множество страниц K, которые ссылаются на данную страницу и обладают набольшим «весом» на своем хосте.

4. Согласно параметру OldScore страницы из множества K сортируются, после сего остаются только первые k страниц.

5. По выбранным k страницам рассчитывается общий показатель OldScore. Это происходит путем суммирования их показателей по формуле LocalScore= В этой формуле m – это некоторый параметр, значение которого может задаваться в диапазоне от 1 до 3. После того, как аналогичны образом будет подчитан LocalScore для каждой страницы из множества N, осуществляется расчет значений NewScore и происходит ранжирование страниц согласно полученным значениям. NewScore рассчитывается по следующей формуле: Здесь i- рассматриваемая страница, a и b – некоторые параметры (в патенте не указано, откуда они берутся), MaxLS – максимальное значение LocalScore, MaxOS – максимальное значение OldScore.

Если описать работу алгоритма словами, то мы получим следующее. На первом этапе из числа страниц, соответствующих поисковому запросу, отбирается некоторое число страниц. Отбор происходит по параметрам, не учитывающим тематику внешних ссылок, например, по ссылочной популярности и релевантности.

После того, как будет отобрана группа страниц, подсчитывается локальная ссылочная популярность каждой из них. Пи это все страницы имеют схожую тематику, так как на основе ссылок, так или иначе связаны с поисковым запросом. Анализируя взаимные ссылки страниц в данной группе, и игнорируя все остальные страницы, можно получить нужную локальную ссылочную популярность.

Таким образом, мы имеем два параметра: OldScore (рейтинг страницы, соответствующий ее общей ссылочной популярности, релевантности и т.д.) и LocalScore (рейтинг страницы, рассчитанный среди тематически связанных страниц). На основе этих двух рейтингов рассчитывается новый, итоговый рейтинг страницы, а затем происходит заключительное ранжирование страниц.

 

Особенности работы поисковых систем

Все методы и идеи по увеличению ссылочной популярности сайта и его текстовой оптимизации, о которых говорилось выше, одинаково применимы ко всем поисковым системам. Несмотря на то, что больше внимания уделялось системе Google, все идеи, рассмотренные относительно этой системы, применимым и ко всем остальным поисковым системам, а значит раскрутка сайтов в любом поисковике происходит одинаково. Повышенное внимание к Google объясняется лишь тем, что информации по этой системе в свободном доступе представлено больше, чем по всем остальным. Поэтому можно сделать вывод, что алгоритмы поисковым систем, несмотря на различия в некоторых деталях, работают приблизительно одинаково и подчиняются общим правилам. Зная эти правила, сео-оптимизатор и вебмастер могут существенно повысить позиции любого сайта во всех поисковых системах. Однако у поисковых систем есть ряд своих особенностей, о которых речь пойдет ниже.

Поисковая система Google

Google – самая быстрая поисковая система в плане индексации сайтов. В этой системе большое внимание уделяется внешним ссылкам. База данных Google используется в качестве рабочей многими поисковыми системами и информационными порталами.

Yandex – самая крупная поисковая система, созданная специально для русскоязычного сегмента сети Интернет (Рунет). Именно Yandex обрабатывает до 80% всех поисковых запросов на русском языке. В системе большое внимание уделяется тематическим ссылкам. При этом нетематические ссылки также учитываются, но имеют меньший эффект, чем в других поисковых системах. Индексация сайтов в Yandex происходит медленнее, чем в Google, но не занимает много времени. Во время обновления базы Yandex, которое может занять несколько дней, результаты выдачи могут многократно меняться, поэтому в этот период рекомендуется не проводить никаких работ по оптимизации сайта, а дождаться стабильной работы системы.

Поисковая система Yandex исключает из индекса или понижает в рейтинге сайты, специализирующихся на нетематическом обмене ссылками, а также Интернет-ресурсы, связанные с автоматическим обменом ссылками. Еще одной особенностью Yandex является различие результатов поиска в зависимости от того, в каком регистре задан поисковый запрос. Например, для запросов «окно» и «Окно» результаты поиска будут отличаться.

MSN – поисковая система, которая уделяет самое большое внимание по сравнению с остальными поисковыми системами информационному содержанию сайта.

Mail.ru – молодая, только набирающая популярность поисковая система. По большей части, Mail.ru использует результаты поиска системы Google, которые подвергает небольшой дополнительной обработке. Поэтому дополнительной оптимизации сайта под эту поисковую систему производить не требуется – достаточно оптимизировать его под систему Google.

Rambler – одна из самых «таинственных» поисковых систем, так как об алгоритмах ее работы мало что известно. По популярности в Рунете занимает второе или третье место после Google. Предположительно понижает рейтинг сайтов, которые занимаются активной раскруткой (например, быстро увеличивают число внешних ссылок). Большое значение уделяет ключевым словам в простом тексте на страницах сайта, при этом они не должны заключаться в теги или выделяться стилистически.

 

Советы на основе наблюдений и предположений

В данном разделе представлена информация, полученная на основе анализа различных статей, а также информация, полученная из опыта оптимизаторов, их практических наблюдений и т.д. Поэтому информация не является точной и не должна восприниматься, как руководство к действию. Это лишь предположения, однако, они могут использоваться в качестве интересных идей для дальнейших экспериментов в области оптимизации.

Нужно внимательно относиться к тем ссылкам, которые размещаются на страницах сайта. Исходящие ссылки не должны вести на FFA каталоги или подобные сайты, так как они исключены из каталогов поисковых систем. Наличие таких ссылок понижает рейтинг сайта. Количество исходящих ссылок на странице не должно превышать 50. Это обычно не снижает рейтинга сайта, но поисковая система будет учитывать только первые 50 ссылок – остальные она пропустит.

Внешние ссылки типа site wide (ссылки, расположенные на каждой странице сайта) негативно воспринимаются поисковыми системами и обычно не учитываются при ранжировании. Однако, по наблюдениям специалистов, это ограничение применяется только к большим сайтам, содержащим несколько тысяч страниц.

Идеальной плотности ключевых слов, ровно, как и формулы для ее расчета не существует. Поисковая система рассчитывает плотность ключей динамически, отдельно для каждого поискового запроса. Если Вы хотите узнать, какой должна быть оптимальная плотность для данного ключа, проанализируйте ТОП 10 сайтов, полученных в выдаче поисковой системы по данному запросу.

Наибольшее предпочтение поисковые системы отдают старым сайтам, которые считает более стабильными и проверенными. Поэтому идеальным вариантом будет купить уже существующий сайт схожей тематики и переделать его, чем осуществлять длительное продвижение сайтов.

Сайт должен постоянно развиваться, так как это положительно воспринимается поисковыми системами. Поэтому добавляйте новые страницы и сервисы, обновляйте информационное содержимое и т.д.

Доменная зона, в которой расположен сайт, также играет немаловажную роль. Например, на западе существуют специальные домены (.gov, .edu, .mil), зарегистрироваться в которых могут лишь сайты соответствующих организаций и компаний. Наличие такого домена воспринимается поисковой системой, как гарантия хорошей репутации сайта.

Старайтесь заинтересовать пользователя, чтобы он остался на вашем сайте и нашел там интересующую его информацию. Поисковые системы отслеживают процент возврата к поиску, то есть число посетителей, которые покинули сайт и продолжили поиск. Если процент возврата большой, это будет воспринято поисковиком, как наличие на сайте нетематической информации. Такой сайт будет понижен в рейтинге.

Также поисковые системы учитывают то, сколько раз перешли по той или иной ссылки из результатов поиска. Если процент переходов низкий, поисковик считает, что страница не представляет интереса для пользователей, и понижает ее рейтинг.

Рекомендуется использовать не только ключевые слова в прямой форме, но и синонимы или родственные формы. Это хорошо воспринимается поисковыми системами.

Поисковые системы негативно относятся к очень быстрому росту числа внешних ссылок, так как рассматривают это, как следствие искусственной раскрутки сайта. В результате рейтинг сайта понижается.

Поисковая система Google не учитывает внешние ссылки, расположенные на одном хосте, то есть на страницах, IP адрес которых находится в диапазоне ххх.ххх.ххх.0 – ххх.ххх.ххх.255. Такая информация содержится в одном из патентов компании, в то время, как ее представители утверждают, что никаких ограничений в отношении внешних ссылок с одного хоста нет.

Каждая поисковая система проверяет информацию о владельце домена. Если несколько сайтов принадлежат одному лицу, то их взаимные ссылки имеют меньший вес или совсем не учитываются. Такая информация также содержится в одном из патентов.

Уделяется внимание и сроку, на который зарегистрирован домен. Чем больший срок регистрации, тем большее предпочтение получит сайт при ранжировании.

 

Правильный контент

Контент или информационное содержание страницы является основным инструментом, который использует раскрутка сайтов. Поисковые системы уделяют этому фактору огромное внимание, поэтому от того, какая информация будет размещена на страницах сайта, зависит то место, которое он займет в результатах выдачи поисковой системы.

Контент должен быть уникальным. Поисковые системы особо ценят ту информацию, которая еще не появлялась на страницах сайтов. Поэтому не стоит копировать тексты с других сайтов, иначе Ваш сайт будет иметь меньше шансов попасть в ТОП поисковой системы. В то же время первоисточник текста всегда будет находиться выше. Поэтому старайтесь размещать свои собственные тексты.

Сайт создается в первую очередь для посетителя. Привести его на сайт не сложно, а вот заставить задержаться на сайте и посещать его в дальнейшем гораздо труднее. Для этого на сайте должно быть что-то, что заинтересует пользователя. Это может быть интересная и познавательная информация, различные сервисы, красивое оформление, удобный интерфейс и т.д. Сайты, которые создаются для людей, а не для поисковых машин, также имеют больше шансов попасть в основные каталоги, такие как Яндекс или DMOZ.

Информация на сайте должна постоянно обновляться (хотя бы раз в месяц). Это ценится поисковиками, а также создает для пользователя дополнительный стимул посещать сайт. Поэтому нужно писать новые статьи на тему сайта, создать раздел для отзывов посетителей, сделать активный форум (если позволяет тематика и посещаемость сайта).

Старайтесь, чтобы Ваш сайт упоминался в различных отзывах, обзорах и т.д., расположенных на тематических сайтах, конечно же, с проставлением внешних ссылок на Ваш сайт. Это не только повысит шансы сайта занять более высокую позицию при ранжировании, но и привлечет на сайт новых посетителей.

Написание текстов для сайта лучше всего поручить грамотному специалисту (если таких нет в штате Вашей компании). Услуги профессионального копирайтера стоят не так уж и дорого, а Вы получаете в свое распоряжение уникальный и интересный текст, созданный по всем правилам оптимизации.

 

Домен и хостинг

Чтобы создать собственную страницу в Интернете сегодня не нужно прикладывать много сил и тратить какие-либо деньги. Все это можно сделать совершенно бесплатно. Большое число компаний предоставляют бесплатный хостинг, на котором они размещают любые сайты в обмен на возможность показа на их страницах свою рекламу. Также некоторые Интернет-провайдеры предоставляют место на своем сервере своим клиентам, не требуя за это дополнительной платы. Однако все эти варианты выглядят привлекательно только для небольших сайтов, типа визитка. Для более серьезных проектов обязательным условием является наличие собственного домена, который придется купить (стоимость домена составляет примерно $10-20 в год в зависимости от зоны и регистратора). На это есть ряд причин.

Подбор и регистрация доменного имени

Интернет-проект, у которого нет собственного домена, не вызывает доверия и воспринимается, как сайт однодневка. Деловые партнеры не будут доверять компании, которая не в состоянии потратить небольшую сумму на создание собственного имиджа. Наличие собственного домена делает Вас свободными в выборе хостинга. Если качество работы провайдера перестали Вас устраивать, в любой момент можно перенести сайт на другую площадку.

 

Выбирая домен и хостинг, нужно соблюдать следующие правила:

Выбирая хостинг, следует отдавать предпочтение солидным компаниям, не первый год работающим на рынке данных услуг. При этом нужно обратить внимание на следующие факторы:

В зависимости от провайдера и выбранного пакета услуг стоимость хостинга колеблется в районе $5-10 в месяц (для небольших сайтов).

Не стоит принимать бесплатные предложения по размещению Вашего сайта в доменной зоне или на хосте. Помимо необходимости размещать на своем сайте рекламу, это может создать в дальнейшем дополнительные трудности для сайта. Например, хостинг-компании в этом случае обычно регистрируют домен на себя, то есть являются его фактическим владельцем. Поэтому, если Вы решите вдруг сменить хостинг, Вам придется покупать новый собственный домен.

 

Смена адреса проекта

Очень часто из небольшого сайта, зарегистрированного на бесплатном хостинге и адресе, вырастает успешный Интернет-проект, которому становится тесно в прежних условиях. В этом случае ему необходимо не только переехать на собственный домен, но и сменить имя. В любом случае меняется адрес Интернет-проекта.

Если это происходит, то рекомендуется создавать на новом адресе новый сайт и наполнить его уникальным контентом. На старом проекте необходимо проставить внешние ссылки на новый сайт. Таким образом, в Вашем распоряжении окажется два ресурса: старый сайт - популярный, но ограниченный бесплатным хостингом, и новый проект – пока не раскрученный, но обладающий широкими возможностями для этого. Постепенно на новый сайт по внешним ссылкам перейдут все посетители со старого проекта, который Вы сможете использовать в дальнейшем для каких либо новых идей. Перенос сайта на новый адрес является сложной и затратной задачей, но делать это необходимо. При правильном подходе Вы сможете извлечь из этого немало пользы.



Отзывы и комментарии.