Некоторое время назад мой друг Boris Wertz написал в своем блоге статью «Есть только 2 способа построить бизнес в $100 млн.». Я хотел бы рассмотреть это вопрос подробнее и предположить, что есть пять стратегий создать интернет-компанию на $100 млн. Это не значит, что я не согласен со статьей Бориса. Я думаю, что наши взгляды очень похожи, и по большей части «мои» пять стратегий лишь немного отличаются и более детализируют взгляд Бориса.


Но что же поменялось в действительности за последние годы? Не алгоритмы и не структуры данных, не математические модели. Хотя и они тоже. Поменялась парадигма использования систем. Проще говоря, к экрану со строчкой поиска подсели домохозяйка, ищущая утюг подешевле, и выпускник вспомогательного интерната в надежде найти работу автомеханика. Кроме появления фактора, невозможного в доинтернетовскую эру, — фактора тотальной востребованности поисковых систем — стала очевидна еще пара изменений. Во-первых, стало ясно, что люди не только «думают словами», но и «ищут словами». В ответе системы они ожидают увидеть слово, набранное в строке запроса. И второе: «человека ищущего» трудно «переучить искать», так же как трудно переучить говорить или писать. Мечты 60—80-х об итеративном уточнении запросов, о понимании естественного языка, о поиске по смыслу, о генерации связного ответа на вопрос с трудом выдерживают сейчас жестокое испытание реальностью.
3. Работа со страницами сайта. На этом этапе нужно отталкиваться от запросов пользователей, знать как они ищут и воспринимают информацию. Большую работу нужно провести с текстами: они должны быть уникальными, структурированы, написаны с ключевыми словами, метатегами, ссылками, заголовками и подзаголовками). Акцентировать внимание нужно не только на текст, но и на фото, видео и инфографику, так как эти элементы тоже учитываются поисковиками. Еще необходимо проверить навигацию по сайту, сделать интуитивный интерфейс.

Но что же поменялось в действительности за последние годы? Не алгоритмы и не структуры данных, не математические модели. Хотя и они тоже. Поменялась парадигма использования систем. Проще говоря, к экрану со строчкой поиска подсели домохозяйка, ищущая утюг подешевле, и выпускник вспомогательного интерната в надежде найти работу автомеханика. Кроме появления фактора, невозможного в доинтернетовскую эру, — фактора тотальной востребованности поисковых систем — стала очевидна еще пара изменений. Во-первых, стало ясно, что люди не только «думают словами», но и «ищут словами». В ответе системы они ожидают увидеть слово, набранное в строке запроса. И второе: «человека ищущего» трудно «переучить искать», так же как трудно переучить говорить или писать. Мечты 60—80-х об итеративном уточнении запросов, о понимании естественного языка, о поиске по смыслу, о генерации связного ответа на вопрос с трудом выдерживают сейчас жестокое испытание реальностью.


Первая техника состоит в разделении индекса на заведомо более релевантную и менее релевантную части. Поиск сначала выполняется в первой части, а затем, если ничего не найдено или найдено мало, поисковая система обращается ко второй части индекса. Прюнинг (от англ. pruning — «отсечение, сокращение») состоит в том, чтобы динамически прекращать обработку запроса после накопления достаточного количества релевантной информации. Бывает еще статический прюнинг, когда на основании некоторых допущений индекс сокращается за счет таких документов, которые заведомо никогда не будут найдены.
Внутренняя оптимизация включает в себя работу с заголовками страницы, которые содержатся в коде с тегами

,

,

, надписью, которая высвечивается на вкладке браузера — Title, и созданием уникального текста на этих же страницах. Также важно уделить внимание мета-тегу description, поскольку именно его пользователь чаще всего видит под url сайта в поисковой выдаче.
Используйте обратные ссылки. Когда поисковые системы видят, что посетители приходят на ваш сайт с других источников, рейтинг страницы будет увеличиваться. Чем больше авторитетных сайтов и читателей появляется у вас, тем большее влияние это будет оказывать на статистические показатели. Вы можете добавить обратные ссылки, оставляя комментарии на других блогах и добавляя ссылку на ваш сайт при подписи. Другим вариантом является предоставление контента для других веб-сайтов с последующей ссылкой на вашу страничку при условии оплаты.
Серая оптимизация отличается от чёрной тем, что она официально не запрещена, но её использование всё равно может быть расценено как неестественное завышение популярности сайта. Некоторые поисковые системы, например, Google, могут временно или постоянно заблокировать такой сайт. То есть, конечное решение о том, являются ли методы продвижения законными или нет, принимает специалист — модератор поисковой системы, а не программа.
При оптимизации вы можете корректировать ставки как вручную, так и автоматически. Существуют разные способы корректировки ставок, но основная тактика - это повышение ставок у эффективных ключевых слов и понижение у неэффективных. Вы можете корректировать ставки, основываясь на количестве конверсий, показателю окупаемости инвестиций (ROI), средней позиции и любых других показателях.

Как и любая программа, поисковая система оперирует структурами данных и исполняет алгоритм. Разнообразие алгоритмов не очень велико, но оно есть. Не считая квантовых компьютеров, которые обещают нам волшебный прорыв в «алгоритмической сложности» поиска и про которые автору почти ничего не известно, есть четыре класса поисковых алгоритмов. Три алгоритма из четырех требуют «индексирования», предварительной обработки документов, при котором создается вспомогательный файл, сиречь «индекс», призванный упростить и ускорить сам поиск. Это алгоритмы инвертированных файлов, суффиксных деревьев, сигнатур. В вырожденном случае предварительный этап индексирования отсутствует, а поиск происходит при помощи последовательного просмотра документов. Такой поиск называется прямым.

Для каждого десятисловия текста рассчитывается контрольная сумма (шингл). Десятисловия идут внахлест, с перекрытием, так, чтобы ни одно не пропало. А затем из всего множества контрольных сумм (очевидно, что их столько же, сколько слов в документе минус 9) отбираются только те, которые делятся на, скажем, 25. Поскольку значения контрольных сумм распределены равномерно, критерий выборки никак не привязан к особенностям текста. Ясно, что повтор даже одного десятисловия — весомый признак дублирования, если же их много, скажем, больше половины, то с определенной (несложно оценить вероятность) уверенностью можно утверждать: копия найдена! Ведь один совпавший шингл в выборке соответствует примерно 25 совпавшим десятисловиям в полном тексте!
Что такое «женщина 25-45 лет с доходом выше среднего и высоким»: в Москве — это одна женщина, в Перми — другая, а в Краснодаре — третья, несмотря на глобализацию. А что такое «мужчина, который читает новости, посещает сайты с модными кроссовками, совершает покупки в интернет-магазинах и смотрит все видео с Дудём»? Это будущий покупатель новых модных кроссовок и неважно, где он живёт. Различие заключается в том, какую по счёту пару кроссовок купит этот мужчина.
Акция “Бесплатное продвижение” продлится 6 месяцев. Компании-участники были выбраны случайным образом методом жеребьевки. Проект призван наглядно продемонстрировать, каких результатов можно добиться, запустив продвижение сайта практически с нуля. И что для этого нужно сделать. Для этого на сайте сервиса выкладывается информация о результатах продвижения, плюс пошаговое описание проделанной работы.
×