Полезная информация

Пользователи не любят читать документацию. Станьте оригинальным, будьте не как все. Ознакомьтесь с нашей базой знаний.

№121-08-2009 10:54:24

George Yves
Help you I can
 
Группа: Extensions
Откуда: Полоцк, Беларусь
Зарегистрирован: 22-05-2008
Сообщений: 1886
UA: Firefox 3.5

Google Caffeine: средство взбодриться или уснуть?

(Источник: «Компьютерные вести» №32, 21 августа 2009 года)

Тестируем "Кофеин"

Неутомимая в своих инновациях компания Google разработала и сейчас тестирует новый поисковый движок. Впервые об этом в официальном блоге компании сообщил ее главный инженер Мэтт Катс. По его словам, Google Caffeine быстрее обрабатывает запросы и дает более точные результаты.


Секретный проект Google

Как утверждает Мэтт Катс, команда Google работала над этим проектом в обстановке повышенной секретности несколько последних месяцев. Пока проект носит рабочее название Caffeine ("Кофеин"). 10 августа Google попросил владельцев сайтов, а затем и всех желающих пользователей протестировать его новый поисковый механизм. Разработчиков более всего интересуют различия между ныне работающей и новой версией. По утверждению программистов Google, новая версия поискового движка отличается улучшенной системой индексирования, возросшей скоростью обработки поисковых запросов, обновленным поисковым роботом (теперь он умеет анализировать большее количество информации за единицу времени), а также переработанным алгоритмом ранжирования страниц в результатах поиска. Механизм Caffeine, говорят в Google, кардинально меняет архитектуру поиска, сокращая размер поискового индекса, увеличивая скорость и улучшая полноту выдаваемых результатов.

Протестировать "Кофеин" можно в "песочнице" по адресу www2.sandbox.google.com. В Google попросили всех участников тестирования сообщать о любых отклонениях от ожидаемой поисковой выдачи. К примеру,о случаях, когда какие-то страницы неожиданно резко поднялись в списке результатов, а какие-то оказались нерелевантны заданному запросу. На странице с поисковыми результатами размещена специальная ссылка, нажав на которую, можно отправить разработчикам свой комментарий.


Личный опыт

Итак, тестируем. Сразу замечу, что по дизайну стартовая страница "Кофеина" практически не отличается от традиционной. Для начала я выбрал банальное слово "Минск". Отличия в скорости действительно есть: стандартный поисковик обработал запрос за 1,01 секунды, а "Кофеин" - за 0,13 сек. Впрочем, не думаю, что эта разбежка действительно важна для кого-то из пользователей.

Но вот поисковая выдача Caffeine оказалась заметно более релевантной. "Обычный" поисковый механизм в первой десятке ссылок поведал мне о погоде в Минске, о новостях, в которых упоминается Минск, об автопробеге Минск-Магадан-Минск (всю жизнь мечтал!) и о том, где в Минске можно купить автозапчасти. Заодно пригласили пообсуждать что-то на минских форумах. Итого: в первой десятке - ни одной полезной ссылки!

"Кофеин" оказался намного более конкретен. Первая ссылка - Минск в Википедии, вторая - официальный сайт Мингорисполкома, третья - ссылка на сайт Mensk.by. Далее - Минск в новостях, минский городской портал, блог Минска, телефонный справочник Минска, национальный аэропорт Минск, гостиницы в Минске, погода в Минске. Как видим, практически все ссылки окажутся востребованы, особенно тем, кто собирается впервые посетить белорусскую столицу.

А вот подборка картинок, идущих перед списком ссылок, оказалась идентичной в обоих случаях. Кроме того, "обычный" поисковик Google выдал 8.270.000 ссылок, а "Кофеин" - 13.100.000. Это при том, что в Google утверждают: по большинству запросов новый сервис выдает меньшее количество сайтов, что связано с улучшением механизма обнаружения фальшивых и некачественных ресурсов, которые удаляются из индекса. И еще: как сказано в официальном пресс-релизе, в целом, поисковая выдача в Caffeine все же не должна серьезно измениться, так как в Google оптимизировали механизм обработки данных, а не принципы, по которым выстраиваются результаты (замечу, это несколько противоречит утверждениям Мэтта Катса). Но, как видим, все совсем не так, и результаты в новой версии поисковика существенно отличаются от стандартных в лучшую сторону.

Продолжаем тестирование. Теперь озадачим систему словом "кракозяблы". В этом случае первая дюжина ссылок в поисковой выдаче в традиционном поиске и в "Кофеине" практически не отличалась. Обычный поисковик Google за 0,25 секунды предложил ссылки на 4.240 web-страниц, а Caffeine - ссылки на 35.500 страниц за 0,27 сек.

В принципе, более высокое количество ссылок, выдаваемых Caffeine, можно объяснить тем, что новый поисковый движок также в режиме реального времени отслеживает новости и обновления на сайтах вроде Facebook и Twitter. В любом случае, можно сказать: планка качества поиска Google с появлением "Кофеина" заметно повысилась. Еще недавно на меня произвел очень хорошее впечатление майкрософтовский Bing, но Caffeine, по субъективным ощущениям, его успешно превзошел (обстоятельное сравнительное тестирование еще впереди).

А вот еще один немаловажный момент. Когда Caffeine заменит собой старый механизм поиска Google, пока неизвестно. Больше всего этот вопрос должен интересовать специалистов по поисковой оптимизации - после запуска Caffeine в качестве базового движка Google им придется "с нуля" изучать его алгоритмы и составлять новые стратегии вывода своих сайтов на высокие позиции по различным запросам.


Новая GFS

Как утверждает сотрудник Google Шон Квинлан, Google в рамках проекта Caffeine, оптимизируя инфраструктуру поисковика, полностью переделает файловую систему Google File System (GFS). Напомню, что GFS была разработана в конце 1990-х годов, и тогда ее создатели никак не предвидели объем нагрузки, который в будущем ляжет на систему. В те времена Google прежде всего требовалось сохранять и индексировать полученную от поисковых роботов информацию, так что GFS была оптимизирована для пакетной обработки данных.

Как говорят специалисты, в спецификации GFS прямо сказано: время отклика на запрос менее важно, чем обеспечение высокой пропускной способности. Однако востребованные сейчас приложения Google - как Gmail и YouTube - наоборот, требуют быстрого отклика на запросы пользователей.

Структурно GFS состоит из главного узла и блочных серверов (master node и chunkservers). Главный узел раздает запросы к серверам, которые в ответ возвращают блоки данных. Собственно, наличие только одного главного узла в Google и считают главным недостатком системы. Когда на несколько часов "валится" Gmail, Blogspot или другая служба - скорее всего, это результат проблем на главном узле. Никогда не "валится" только основной поисковый сервис, серверы которого многократно продублированы.


Лучшие против лучших

Конкуренция на рынке интернет-поиска явно обостряется. В июне корпорация Microsoft запустила удачный поисковик Bing. А недавно софтверный гигант заключил соглашение с Yahoo!, по которому Bing будет установлен на все ее сайты. За это Yahoo! на протяжении пяти лет будет получать 88% доходов от рекламы в поисковой выдаче. По данным компании Comscore, в июне поисковик Google обрабатывал 65% поисковых запросов в Интернете, Yahoo! - 19,6%, Microsoft - 8,4%.

Виктор ДЕМИДОВ


May the FOSS be with you!

Отсутствует

 

№221-08-2009 11:06:45

Rosenfeld
Linux registered user # 526899
 
Группа: Members
Откуда: ‎
Зарегистрирован: 21-10-2005
Сообщений: 4642
UA: Firefox 3.5
Веб-сайт

Re: Google Caffeine: средство взбодриться или уснуть?

Особой разницы, обрабатывает движок поисковый запрос за 1 секунду или 0,1 секунду нет (или мы так торопимся жить, что лишняя сотая секунды нам дорога?)...

Я искренне считаю, что все зависит от конечного пользователя - в частности, от его умения правильно формулировать поисковые запросы, а также от умения "видеть" страницу с поисковыми предположениями - т.е. определять по доменным именам и кратким аннотациям к ним -куда ходить стоит,  а куда нет... В Израиле, допустим, проводятся соревнования по быстроте поиска в интернете, так ведь там выигрывают не из-за того, каким движком - "быстрым" или "медленным" ты пользуешься, а из-за того, насколько хорошо работает твоя голова!

А вот тот факт, что будут в режиме реального времени обрабатываться Facebook и Twitter, вводит меня в уныние: это же сколько словесной шелухи, которую выливают в день любители написать "ни о чем" и радостно поведать об этом окружающему миру ("Hallo world" или "Я только что сходил в туалет, теперь сижу и пью пиво и это cool") будет падать на меня в поисковых обработках! Я, допустим, уже сталкивался с тем, что в качестве "верхней" ссылки Гугл услужливо подсовывал мне чей-то ЖЖ (только из-за того, что данная фраза была написана всего несколько часов назад!) Нафиг мне чей-то ЖЖ и испражнения в нем, я, честно говоря, не пойму!

Вот, кстати, в соседней теме:

http://forum.mozilla-russia.org/viewtop … 34#p367934

Отредактировано Rosenfeld (21-08-2009 11:11:35)


Project Rosenfox:  Pure, fast and secure inner settings for Mozilla Firefox. Global and complete manual on GitHub.

Отсутствует

 

№321-08-2009 11:14:40

Shredder
Забанен
 
Группа: Members
Зарегистрирован: 13-07-2009
Сообщений: 369
UA: Minefield 3.7

Re: Google Caffeine: средство взбодриться или уснуть?

Это придумано как раз для тех людей, кому бывает нужно иногда что-нибудь быстро найти, хотя лучше бы такой поисковик и Википедии сделать:)

Отсутствует

 

№421-08-2009 11:42:34

brici
Участник
 
Группа: Members
Откуда: Chisinau
Зарегистрирован: 03-05-2009
Сообщений: 603
UA: Firefox 3.5

Re: Google Caffeine: средство взбодриться или уснуть?

- Добавил интереса ради,этот Google Caffeine в панель поиска.Доли секунды это мелочь.А вот режим показывать предложения,пока не пашет.


Пизанская башня,- первое творение сюрреалистов.

Отсутствует

 

Board footer

Powered by PunBB
Modified by Mozilla Russia
Copyright © 2004–2020 Mozilla Russia GitHub mark
Язык отображения форума: [Русский] [English]