Интернет журнал InterneR IT-ЖУРНАЛ: ИНТЕРНЕТ, ГАДЖЕТЫ, ТЕХНОЛОГИИ


8Сен/07Off

ПС на службе силы зла…

Вообще то я хотел озаглавить это исследование немного не так. Напрашивается «Я на службе силы зла». Но передумал, в силу объективных причин.

Нет, вы только не подумайте чего плохого, я православный христианин. В данном случае, я выбрал такое название для статьи, имея в виду не себя, а поисковую систему Яндекс. Справедливости ради стоит сразу заметить, что не только Яндекс тут попадает под раздачу, но все же… Кстати, я не шучу, и не сбрендил. Ну а тем, кто думает что я несколько преувеличиваю, я готов доказать обратное.

От автора.
Смысл данной статьи вам будет более понятен, если во время ее прочтения вы будете слушать вот эту песню.

Набираем в Яндексе вот такой вот простой запрос: купить душ. Наученный опытом эффекта президента, когда выдачу довольно быстро подкрутили, я сразу сделал скриншот.

купить душ?

Надеюсь, всем видно, что начиная с пятой позиции, начинают появляться страницы, посвященные не покупке этого простого девайса, который есть у каждого из нас в ванной, а нечто иное. Тут предметом торга выступает уже наша бессмертная душа. Так минуточку, как же это? ПС не может отличить душу от душа? Заметьте, что первые пять сайтов найдены по ссылке (!)

Конечно, тут можно взмахнуть руками и сказать: «Ну что ты блин докопался? Русский язык очень сложный, морфология, падежи, склонения, там черт ногу сломит, не то что тупой алгоритм поисковой системы.» Все это так, если бы не несколько важных НО.

А именно. Как известно, Яндекс всегда позиционировал себя как создателя уникальных алгоритмов и поисковых технологий, позволяющих осуществлять качественный полнотекстовый поиск именно с учетом морфологии русского языка.

Поиск работает с учетом морфологии русского, английского и украинского языков. Например, если задан запрос «идти», то в результате поиска будут найдены ссылки на документы, содержащие слова «идти», «идет», «шел», «шла» и т. д.

И что же? Я же не прошу отличить замок от замка, хотя эти два слова Яндекс в состоянии разделить. Не смотря на то, что слова эти пишутся идентично в именительном падеже и единственном числе, разница лишь в ударении. Я лишь хочу понять, каким образом душ перемешался с душой? Да, понятно, что это не самое простое слово, ибо даже в склонениях они почти идентичны, но все же, в контексте страницы, о чем идет речь, алгоритм просто обязан определять. Тем более что таких слов в русском языке не так много. Можно и ручками покрутить, или как там это у них делается… 

А что там конкуренты, кстати? Смотрим Рамблер: купить душ. Хм, странно, но дьявол сюда не пробился, и купить предлагается исключительно душ. Google путается в показаниях, и подобно Яндексу путает эти два слова, лихорадочно расставляя сайты в выдаче. Кстати забавно еще и то, что Яндекс маркет предлагает вместе с душем купить еще и винище «Душа монаха»… :) Выдача Webalta во многом напоминает гугловскую, такой же хаос, с уклоном в сантехнику. Вот Гога – порадовал, там только с 19 позиции начинают проскакивать люциферы и некроманты, но в целом все очень даже релевантно.

На самом деле (ненавижу этот паразитный оборот) такая ситуация вполне объяснима, и таких хитрых, в кавычках, запросов можно напридумывать много. Но что настораживает в Яндексе. Если вы посмотрите на скрин выдачи еще раз, вы увидите, что все что в первой пятерке найдено по ссылке. Опять, двадцать пять! ПО ССЫЛКЕ! А вот потом уже, когда эффект ссылочного начинает угасать, Яндекс нам выдает свои морфологические шедевры. И там уже купить можно только душу. Вот в данном случае ссылочное как раз играет на руку Яндексу, вытягивая эти пять сайтов наверх. Но тем самым, беспомощность алгоритма становится еще более отчетливо видна. Вот что странно.
А вы как думаете?

Связано с категорией: Поисковые системы, Яндекс Комментарии
Комментарии (8) Пинги (0)
  1. Да уж, лоханулся Яндекс. В своём «величии» не замечает, или не хочет замечать очевидных вещей. Или «велик» настолько, что просто плевать на то, что происходят такие казусы.

  2. Мне подобные мысли по поводу Артемя приходили. Не настолько, правда, демонологические – я их в масонстве подозревал :) Главным образом из-за птички – логотипа Парсера.

  3. Пригласите в Яндекс священника. Сегаловичу с Воложем исповедоваться обязательно!

  4. Не хотел на Форуме «срать в карму», но вы полную фигню написали.
    Если вы готовы предложить алгоритм, решающий такие неоднозначности — то честь вам и хвала, а также у вас готова тема для диссера по прикладной лингвистике, и, думаю, приглашение на работу в Яндексе вам обеспечено.

  5. Это хорошо что яндекс делает собственный серп.
    Если бы все выдавали одно и то же…

  6. По запросу не ясно, что хочет человек купить, сантехнику или чьи-то души, вот Яндекс выдает и то и то на выбор

  7. > semenov, ну как-то в 21-вом веке искать в яндексе возможность покупки душ… :)

  8. Ахаха, я все понял, просто яндекс, это поисковая система шестнадцатого века :) Немного модернизированная и локализованная, а так, все еще находящаяся в лапах инквизиции, искалка :)


Оставить комментарий

Вы должны войти в систему чтобы публиковать комментарии.

Trackbacks are disabled.