10 июн. 2010 г.

Google представил новую систему поискового индексирования – Caffeine

Компания Google на днях анонсировала запуск новой системы веб-индексирования, названной Caffeine. По словам компании, по сравнению со старым индексом, новый Caffeine обеспечивает более свежие результаты поиска, и также является самой большой коллекцией веб-контента, которую когда-либо предлагал Google. В независимости от того какой контент ищет пользователь - будь то новость, блог-пост или пост в форуме - с новым Caffeine, по словам Google, он сможет находить ссылки на релевантный контент гораздо быстрее после его опубликования, чем это было раньше.


Ранее, если пользователь запрашивал поиск, Google сканировал слои своего индекса. Эти слои приоритезировались по важности, поэтому вначале поиск осуществлялся по самым высокоприоритетным сайтам, а затем переходил на менее приоритезированные группы сайтов. Индекс каждого слоя обновлялся по расписанию с разными скоростями. Так, например, самый приоритетный слой обновлялся каждые две недели. Однако с Caffeine, компания Google отошла от архитектуры слоев и вместо нее теперь стала анализировать веб небольшими порциями и обновлять свой индекс на основе непрерывности. Это означает, что недавно опубликованный контент теперь будет добавлен в индекс Google гораздо быстрее, чем раньше. И пользователи Google смогут найти его быстрее, чем раньше.

Каждую секунду Caffeine одновременно обрабатывает сотни тысяч страниц, и каждый день добавляет в свой индекс сотни тысяч гигабайт информации. В целом же переход на Caffeine считается крупнейшим изменением в методологии поискового движка Google за последние четыре года. При этом Caffeine, как сообщается, обладает большей приспосабливаемостью к быстрому росту объема онлайновой информации.

Новости по теме:



Комментариев нет:

Отправить комментарий

 
Rambler's Top100