В июле прошлого года не стало Ильи Сегаловича, основателя и директора по технологиям «Яндекса», создателя первой версии поисковика и автора его названия. В память об этом выдающемся человеке и общественном деятеле, который помог многим, в том числе и COLTA.RU, мы републикуем его научно-популярную статью об информационном поиске и математических моделях, которые лежат в его основе. Илья Сегалович называл поисковые системы одним из двух новых чудес света. Во всяком случае, без них и в том числе без главного детища Сегаловича — «Яндекса» наша жизнь была бы совсем другой.
Расшифровывается это, как Search Engine Optimisation, то есть оптимизация поисковых систем. Иными словами, это когда вы вбиваете в Google или Яндекс «Языковые курсы в Новой Зеландии» и поисковик с помощью алгоритмов выводит на первые места результатов те сайты, которые лучше всего в этом разбираются. Тут учитываются правильно составленные тексты, использование нужных ключевых слов и заголовков, актуальность информации, наличие ссылок на сайт с других источников и многое другое.
Серая оптимизация отличается от чёрной тем, что она официально не запрещена, но её использование всё равно может быть расценено как неестественное завышение популярности сайта. Некоторые поисковые системы, например, Google, могут временно или постоянно заблокировать такой сайт. То есть, конечное решение о том, являются ли методы продвижения законными или нет, принимает специалист — модератор поисковой системы, а не программа.
Большинство рекламодателей считают модель рекламы с оплатой за лиды привлекательной, так как она дает возможность оплачивать реальные конверсии. К главным достоинствам этой модели относится нулевой риск неэффективной траты маркетингового бюджета. К ее недостаткам можно отнести высокую стоимость лида. Кроме этого, CPA-кампании обеспечивают рекламодателю конверсии, однако практически не работают на бренд.
Цифровой маркетинг (digital-маркетинг, диджитал-маркетинг) — общий термин, используемый для обозначения таргетивного и интерактивного маркетинга товаров и услуг, использующего цифровые технологии для привлечения потенциальных клиентов и удержания их в качестве потребителей. Главными задачами цифрового маркетинга являются продвижение бренда и увеличение сбыта с помощью различных методик. Цифровой маркетинг включает в себя большой выбор маркетинговых тактик по продвижению товаров, услуг и брендов. Помимо мобильных технологий, традиционных ТВ и радио методы цифрового маркетинга используют интернет в качестве основного коммуникационного посредника.[1]

Приблизительно три из пяти поисковых систем и модулей функционируют безо всяких математических моделей. Точнее сказать, их разработчики не ставят перед собой задачу реализовывать абстрактную модель и/или не подозревают о существовании оной. Принцип здесь прост: лишь бы программа хоть что-нибудь находила. Абы как. А дальше сам пользователь разберется.

Причин здесь несколько. Во-первых, топовые места в поисковых системах можно сравнить с престижными районами города. Обычно первое впечатление о компании клиент получает еще до посещения организации, узнав, где она располагается. Чем престижнее район, тем большее доверие питает клиент, а соответственно, больше шанс, что он выберет именно Вас. Работает стереотип: если фирма расположена в самом центре города, то эта фирма процветает. Аналогично этот стереотип работает и при SEO продвижении. Сайты, находящиеся в ТОПе – это, как правило, наиболее уважаемые сайты.
Здесь поисковые объявления могут оказать огромное влияние. Реклама – это быстрый и простой способ разместить свой сайт перед аудиторией, и аудитория становится естественным источником ссылок. Некоторые из самых крупных имен в индустрии SEO имеют поисковые объявления, хотя они уже хорошо оцениваются. Они не сделали бы этого, если бы не работали для них.

Quora больше похожа на информационный портал, чем на поисковую систему. Здесь можно общаться с людьми на разнообразные темы и получать ответы на важные вопросы от пользователей по всему миру. Более того, на сайте есть специальная категория тематических вопросов, которые задавались раньше. Русскоязычным аналогом такого сервиса является  Thequestion. У них разный дизайн и структура, но суть одна – пользователь хочет получить лучший ответ на свой вопрос от реальных людей.
This course examines how digital tools, such as the Internet, smartphones, and 3D printing, are revolutionizing the world of marketing by shifting the balance of power from firms to consumers. Marketing in a Digital World is one of the most popular courses on Coursera with over 150,000 Learners and is rated by Class Central as one of the Top 50 MOOCs of All Time (https://www.class-central.com/report/top-moocs/). This course is part of the iMBA offered by the University of Illinois, a flexible, fully-accredited online MBA at an incredibly competitive price. For more information, please see the Resource page in this course and onlinemba.illinois.edu.
Главная тема Теплицы в апреле 2017 года — поисковая оптимизация. Наши корреспонденты расскажут о том, как работает поисковая система, каким образом можно улучшить позиции вашего ресурса и привлечь аудиторию, увеличить трафик, как правильно оформлять тексты и лучше всего писать на сайт некоммерческих организаций. Для начала разберемся в том, что же такое SEO.
В итоге, чтобы найти оптимальный для себя вариант, как и всегда, придется тестировать, проверять, считать. Естественно, постоянно отслеживать состояние кампаний и отдельных объявлений, подстраиваться под текущую ситуацию. Когда у вас появится статистика за длительный период времени (хотя бы несколько месяцев), сможете четко сформулировать свою ценовую стратегию и определить, нужны ли вам тесты и мониторинг, либо лучше оставить все, как есть.
Самый эффективный путь, на мой взгляд, это всестороннее тестирование рекламных кампаний перед большим запуском. А также детальный контроль результатов, не только с помощью отслеживания медийных и посткликовых показателей, но и проведения бренд-лифтов и больших исследований. Всесторонний анализ дает намного больше данных для коррекции в креативах и медийных настройках.
Главная тема Теплицы в апреле 2017 года — поисковая оптимизация. Наши корреспонденты расскажут о том, как работает поисковая система, каким образом можно улучшить позиции вашего ресурса и привлечь аудиторию, увеличить трафик, как правильно оформлять тексты и лучше всего писать на сайт некоммерческих организаций. Для начала разберемся в том, что же такое SEO.
Я просыпаюсь прямо в линзах виртуальной реальности, и чат-бот в виде красивой девушки в 3D называет меня по имени, проецирует на стены моей квартиры виды Мальдив, где под пальмой сидит популярный блогер. Девушка предлагает мне отдохнуть там в его обществе, потому что банк уже одобрил мне персональный кредит в криптовалюте, рассчитанный на мощность майнинг-фермы, которая находится в багажнике моей Tesla-ВАЗ.
Как ни странно, но вроде бы уже ушедшие технологии почтовой рассылки вновь набирают обороты. Информации становится больше, клиент становится искушеннее. Но качественно проработанная email рассылка, несущая пользу людям, неизменно приносит хороший результат. Новости, дайджесты, подборки специальных предложений или просто полезные лайфхаки, все это найдет своего адресата.
Ранее украинцы устроили флешмоб, поставив более 150 тысяч низких оценок странице ФИФА в «Фейсбуке», обвалив её рейтинг. Позже ФИФА убрала возможность поставить оценку странице. Флешмоб был организован после того, как ФИФА наказала Огнена Вукоевича и вынесла предупреждение Домагою Виде. Напомним, после матча Россия – Хорватия Вида с Вукоевичем записали видеообращение со словами «Слава Украине». Вукоевич был отстранён от работы в хорватской делегации и оштрафован ФИФА на 15 тыс. швейцарских франков. Вида получил предупреждение от ФИФА.

Операции поиска или нахождения похожих документов резко упрощаются, так как каждому слову и каждому документу сопоставляется относительно короткий вектор из k смыслов (строки и столбцы соответствующих матриц). Однако по причине малой осмысленности «смыслов» или по какой иной [4], но использование LSI в лоб для поиска так и не получило распространения. Хотя во вспомогательных целях (автоматическая фильтрация, классификация, разделение коллекций, предварительное понижение размерности для других моделей) этот метод, по-видимому, находит применение.
Как ни странно, но вроде бы уже ушедшие технологии почтовой рассылки вновь набирают обороты. Информации становится больше, клиент становится искушеннее. Но качественно проработанная email рассылка, несущая пользу людям, неизменно приносит хороший результат. Новости, дайджесты, подборки специальных предложений или просто полезные лайфхаки, все это найдет своего адресата.
Хотя прямой просмотр всех текстов — довольно медленное занятие, не следует думать, что алгоритмы прямого поиска не применяются в интернете. Норвежская поисковая система Fast использовала чип, реализующий логику прямого поиска упрощенных регулярных выражений (fastpmc), и разместила 256 таких чипов на одной плате. Это позволяло Fast обслуживать довольно большое количество запросов в единицу времени.
Обновление Google’s Hummingbird для их поисковых алгоритмов создало ключевые слова, что гораздо менее важно, чем обычные диалоговые запросы. Это отражает изменения в способах поиска вещей обычными людьми. Например, вместо того чтобы искать по ключевому слову «айфон» (iPhone), Google будет выдавать страницы, которые отвечают на такие вопросы, как «Какой iPhone самый лучший для меня?» (Which is the best iPhone for me?)[3]
Кроме проблемы корректного ранжирования создателям поисковых систем в интернете пришлось решать задачу обновления и синхронизации колоссальной по размеру коллекции с гетерогенными форматами, способами доставки, языками, кодировками, массой бессодержательных и дублирующихся текстов. Необходимо поддерживать базу в состоянии максимальной свежести (на самом деле достаточно создавать иллюзию свежести — но это тема отдельного разговора), может быть, учитывать индивидуальные и коллективные предпочтения пользователей. Многие из этих задач никогда прежде не рассматривались в традиционной науке информационного поиска.
Начальные показатели проекта: В результате работы алгоритма «Автоподбор минус-слов» были собраны неэффективные поисковые запросы за месяц. Они составили примерно 10% от всех поисковых запросов. Данные запросы отличались высоким показателем отказов и низкой средней длительностью сеанса. Все неэффективные запросы были внесены в аккаунт в качестве минус-слов, что привело к увеличению дохода от клика и коэффициента транзакции, а соответственно, и к увеличению общего дохода.
Теперь, когда вы закончили ваш анализ и назначили начальные ставки, настала очередь оптимизации. Прежде всего, мы поговорим о том, что же является вашей идеальной ценой за клик. Ответ на этот вопрос, как и на многие другие вопросы - “зависит от ситуации”. В более широком смысле, ваша идеальная цена за клик - это цена, достаточная для достижения средних позиций, которые принесут вам конверсии по приемлимым ценам.
Бренд состоит из множества маленьких деталей, которые работают слажено, чтобы стать единым целым. Собирая эту машину, если вы забыли часть или ввернули винт неправильно, вы рискуете получить не работающую машину, или еще хуже – ту, которая разобьется вместе с вами. Один из способов избежать поломок вашей бренд-машины – с самого начала создать руководство по применению (handbook).
По большому счету, сегодня практически невозможно получить «чистую» поисковую выдачу. Дело в том, что Google владеет огромными наборами данных о своих пользователях. Он знает не только то, где мы живем, а еще и что любим читать и смотреть, какие страны посещать, он знает, в какие магазины мы ходим  и что мы в них покупаем. Например, чтобы найти сервис заказа пиццы, часто уже не нужно добавлять город. Запрос «заказ пиццы» приведет к разным результатам для людей, которые задали такие запросы, например, из Киева или из Одессы.
Чтобы контролировать эффективность рекламы с оплатой за показы, маркетологи часто комбинируют эту модель с оплатой за клики. В таких случаях они приобретают блоки просмотров со скидкой и доплачивают за каждый переход пользователя на сайт бренда. Данный подход позволяет распределить риски между рекламодателем и владельцем ресурса, а также обеспечивает взаимную заинтересованность сторон в эффективности рекламных кампаний.
«То, что хорошо работает в TREC, часто не срабатывает в вебе <...> некоторые утверждают, что в вебе пользователи обязаны более точно специфицировать то, что им нужно, писать побольше слов в запросах. Мы категорически не согласны с такой точкой зрения. Если люди спрашивают “Билл Клинтон”, они должны получать осмысленные результаты, так как в вебе полным-полно качественной информации на эту тему...»
Для примера опишу лишь одну, пожалуй, самую популярную модель, работающую по смыслу. В теории информационного поиска данную модель принято называть латентно-семантическим индексированием (иными словами, выявлением скрытых смыслов). Эта алгебраическая модель основана на сингулярном разложении прямоугольной матрицы, ассоциирующей слова с документами. Элементом матрицы является частотная характеристика, отражающая степень связи слова и документа, например, TF*IDF. Вместо исходной миллионноразмерной матрицы авторы метода  Фурнас и Дирвестер предложили использовать 50—150 «скрытых смыслов» [3], соответствующих первым главным компонентам ее сингулярного разложения.
Знаете ли вы, что результаты поиска по Яндекс и Google совпадают в среднем лишь на 25%? Пользуясь только одной поисковой системой, вы упускаете до 75% полезных сайтов, доступных другим пользователям. Поисковая система ДзенПоиск позволяет быстро переключаться между результатами Яндекс и Google в одном окне. Теперь вы не упустите ни одного полезного сайта!

Обо всех задачах и способах их решения рассказать невозможно. Для примера рассмотрим «расширение запроса», которое обычно производится через привлечение к поиску ассоциированных терминов. Решение этой задачи возможно в двух видах — локальном (динамическом) и глобальном (статическом). Локальные техники опираются на текст запроса и анализируют только документы, найденные по нему. Глобальные же «расширения» могут оперировать тезаурусами, как априорными (лингвистическими), так и построенными автоматически по всей коллекции документов. По общепринятому мнению, глобальные модификации запросов через тезаурусы работают неэффективно, понижая точность поиска. Более успешный глобальный подход основан на построенных вручную статических классификациях, например, веб-директориях. Этот подход широко используется в интернет-поисковиках в операциях сужения или расширения запроса.
Проверка сайта на технические ошибки играет важную роль в поисковой оптимизации. Ошибки в robots.txt и на 404 странице, в пагинации и канонических ссылках, тегах hreflang и редиректах: каждая из них может серьезно испортить все усилия по реализации SEO стратегии. С помощью Sitechecker вы можете сделать качественный технический аудит сайта без дополнительных финансовых вложений и увеличить вероятность роста позиций в поисковых системах.
Ещё одна важная особенность онлайн-сервисов - это определенные ограничения в работе. Так, некоторые инструменты не позволят узнать показатели вашего сайта в Яндексе, другие - в Гугле. Да, есть и универсальные сервисы, но в числе их недостатков - неточная информация. Также отличается и глубина анализа, число используемых запросов. Все это обязательно нужно учесть, чтобы процедура мониторинга позиций не превратилась в проблему
Те, кто занимается ASO на постоянной основе, да еще, не дай бог, по разным локализациям, знает: это не то дело, в котором можно действовать по наитию. Слов в словаре, конечно, много, но продуктов на маркете тоже хватает, и конкуренция за самые простые, ассоциативные ключи разворачивается нешуточная. Чтобы выдержать баланс между популярностью запроса и вероятностью пробиться на первые позиции, нужен тщательный анализ ситуации в соответствующем сегменте.
×