Не могу пройти мимо интересного отчета Яндекса, который он выложил в открытый доступ, о поисковых интересах пользователей. Исследование строится на статистических данных за период с сентября 1997 года, когда только произошло создание Яндекса, по сентябрь 2008 года. За это время много всего поменялось как в жизни страны, так и в “поисковой” истории: появились новые слова, с которыми пользователи обращаются в интернет-поиск, изменились формулировки запросов и их частотность, увеличилось количество сайтов, а как следствие и поисковый индекс.
В 1997 году в индексе Яндекса было около 18 тысяч сайтов и около 3-х миллионов страниц. Это количество и представляло весь русскоязычный сектор интернета (на сегодняшний момент в Сапе сайтов и то больше). Объем всех текстов Рунета составлял 7,5 Гб, а количество пользователей не превышало 200 тысяч, и в день они задавали около тысячи запросов к Яндексу.
Теперь в Рунете как минимум 13 миллионов сайтов, а полугодовая аудитория, по данным ФОМ, составляет 32 миллиона человек. К поисковым системам Рунета, по оценке Яндекса, они задают порядка 48 миллионов запросов в день, просматривая при этом страницы результатов поиска более 63 миллиона раз. Среднестатистический пользователь за поиском нужного ответа проводит около 5-ти минут.
Типичный поисковый запрос состоит из двух-трех существительных, написанных кириллицей. Средняя его длина – 2,5 слова. За одиннадцать лет развития Рунета пользователи стали многословнее, в 1997, когда поиск Яндекса только появился, средняя длина поискового запроса была всего 1,2 слова. Теперь количество информации и сложность в правильном ее ранжировании увеличились во много раз, поэтому приходится задавать более точные формулировки запросов, для того чтобы найти нужный ответ. Доли запросов в зависимости от количества слов в них распределяются по данным Яндекса примерно так:

Около 2,5 % поисковых запросов к Яндексу сформулированы как вопрос. Самый популярный вопрос, который задают пользователи, содержит вопросительное слово как. Вопросов, начинающихся с как, спрашивают больше, чем начинающихся со всех остальных вопросительных слов вместе взятых. Рейтинг вопросительных слов выглядит следующим образом:
1. как – 4597176 запросов в месяц ([как целоваться], [как заработать в интернете])
2. что – 1504560 запросов в месяц ([что делать], [что будет])
3. где - 949088 запросов в месяц ([где можно покупаться],[где скачать песню])
4. какой – 434165 запросов в месяц ([какие документы], [какой антивирус лучше])
5. кто - 420373 запроса в месяц ([кто с кем], [кто виноват])
6. сколько – 406462 запроса в месяц ([сколько времени], [сколько стоит билет])
7. когда – 209951 запрос в месяц ([когда стричься], [когда запустят коллайдер])
8. куда – 150074 запроса в месяц ([куда вложить деньги], [куда поступать])
9. почему – 130550 запросов в месяц ([почему нельзя], [почему желтеют листья])
10. зачем – 55130 запросов в месяц ([зачем жить], [зачем учиться])
11. откуда – 27314 запросов в месяц ([откуда берутся дети], [откуда пошла фамилия])
12. чей – 15240 запросов в месяц ([чей номер], [чей туфля])
Самые короткие запросы к Яндексу – буквы и цифры (предлоги, союзы), наиболее длинные осмысленные слова – как правило, сложные существительные, состоящие из нескольких корней. Самое длинное слово, заданное в качестве запроса к Яндексу в августе 2008 года, состояло из 37 символов – гиппопотомомонстросеквиппедалиофобия (боязнь произнесения новых слов).
При обращении к поиску пользователи используют:
существительные – содержатся в 75% запросов;
прилагательные – присутствуют в 16% запросов к поиску;
глаголы – используются в 5% запросов;
наречия – содержатся в 1% запросов;
числительные - присутствуют в 0,2% поисковых запросов
При общении с Яндексом матерную лексику содержит 1,5% запросов. Много это или мало, судить сложно.
Свои запросы к поиску русскоязычные пользователи в основном набирают кириллицей (более 72% запросов). Латиницей написаны около 15% запросов, а около 11% содержат и кириллические, и латинские символы. Чуть более 1% – это запросы из одних чисел, пустые или бессмысленные (интересно специфические запросы вебмастеров классифицируются как бессмысленные?).
Приблизительно в каждом десятом поисковом запросе присутствует название организации
или сайта. В этом случае пользователь часто хочет найти вполне определенный сайт, и все остальные результаты поиска его не интересуют.
14-15% всех запросов содержат различные ошибки и искажения. Две трети всех ошибок — орфографические (пропущенные буквы, неправильное написание слов и т.п.).
Самая распространенная ошибка сейчас — однокласники (с одной с). Этот запрос входит в топ-10 запросов к Яндексу в августе 2008.
По поисковым запросам можно понять, какой способ написания слов, недавно появившихся
в русском языке, выбирают пользователи. Варианты [тег], [бренд] и [тренд] победили варианты [тэг], [брэнд] и [трэнд].
Для некоторых пользователей не существует адресной строки браузера, поэтому они вводят адреса сайтов в строку поиска. Таких запросов достаточно — около 4%.
Теперь о популярности запросов. Как видно из диаграммы, большая часть запросов (около 77% от всего числа или более 20 миллионов запросов в день) являются низкочастотными с частотностью менее 100 запросов в день (не путать с месячной статистикой показов wordstat.yandex.ru).

Всего лишь 3% от общего числа запросов составляют запросы с популярностью более чем 20 000 запросов в день. Общая картина распределения долей в зависимости от популярности приведена на диаграмме.
ТОП 10 самых популярных поисковых запросов к Яндексу в августе 2008 года выглядел следующим образом:
- одноклассники
- в контакте
- порно
- погода
- mail.ru
- вконтакте
- контакт
- одноклаСники
- зайцев нет
А вот как тот же ТОП 10 выглядел еще совсем недавно, в январе 2007 года:
- порно
- погода
- знакомства
- mail.ru
- скачать
- работа
- сонник
- ваз
- из рук в руки
- гороскоп
Традиционно популярная сексуальная тематика явно сдает позиции перед напором социальных сетей.
Из любопытного в исследовании еще можно отметить:
- при помощи наблюдений за популярностью поисковых запросов можно следить за всплесками интересов пользователей к тем или иным событиям, например, в августе 2008 года пользователи очень часто задавали запросы [война в осетии], [война в южной осетии], [война грузия] или [дневник олимпиады], [медали олимпиады], [итоги олимпиады];
- наблюдая за частотностью запросов можно отследить сезонные колебания интересов пользователей. Например, [шубы] и [лыжи] чаще запрашивают зимой, запросы [море] и [кондиционеры] интересуют пользователей летом, интерес к литературным произведениям (в виде запросов с их названиями) из школьной программы резко снижается в летние месяцы.
Подытожив, могу сказать, что из отчета можно извлечь много чего любопытного и интересного, так что рекомендую прочитать полную версию.



Теги:
