[ Поиск ] - [ Пользователи ] - [ Календарь ]
Полная Версия: Настольная поисковая
LeX
Настольная поисковая
Автор: Евгений Золотов
Опубликовано 15 октября 2004 года

Ручаюсь, каждый, вкусивший прелести поиска информации в Веб, хотя бы раз мечтал завести на компьютере свой собственный маленький поисковик наподобие того, что работает, скажем, на google.com. Простой запрос, моментальный ответ и ранжирование результатов - что ещё нужно для счастья? Сегодня у всех, кто принадлежит к многомиллионному пользовательскому мейнстриму (отличительные признаки: Windows XP/2k, MS Office, MS Outlook и т.п.) есть возможность воплотить свою мечту в жизнь. Компания Google, действуя в лучших традициях основанного ею же научно-делового жанра, выпустила бета-версию утилиты Google Desktop.

Да, Google Desktop - именно то, чего ждали миллионы и миллионы сетян. Инсталлировав это крохотное, едва ли в полмегабайта "весом" приложение на компьютер, вы получаете в своё распоряжение настоящую локальную поисковую машину а-ля Гугл. Однажды проиндексировав всё содержимое ваших жёстких дисков, она висит в трее и может использоваться для быстрого поиска локальных документов по их содержимому. Закладки и веб-странички в кэше Internet Explorer, документы MS Office, письма и контакты Outlook, записи переговоров в AIM - всё это и кое-что другое Google Desktop разберёт и разложит по невидимым полочкам локальной базы данных, так что отыскать письмо от нужного человека или DOC-файл с интересующим вас отрывком текста можно будет буквально за пару кликов из одного места. Документы прочих форматов Google Desktop индексирует по их файловым именам, не пытаясь вникнуть в структуру - но и этого вполне достаточно, чтобы пользователь смог быстро отыскать нужное фото или мпег. Поиск моментален, а обновление базы ведётся почти непрерывно: в моменты, когда компьютер не загружен другой работой, Google Desktop учитывает появившиеся на машине новые файлы.

Что самое удивительное, это то как ловко удалось создателям Google Desktop стереть грань между ресурсами Сети и ресурсами локальными. Инсталлировав микропоисковик на компьютер, загляните на google.com: к обычным закладкам "Web", "Images", "News" и прочим специально для вас будет добавлена ещё одна - "Desktop". Прямо из браузера, пользуясь веб-интерфейсом google.com, вы можете искать документы на своём компьютере, а можете организовать и комбинированный поиск: результаты поиска в Веб будут включать и то, что найдено на вашей машине, и то, что найдено в Сети. На самом деле, конечно, информация о содержимом ваших дисков не передаётся в Google, просто Google Desktop перехватывает обращения браузера к родному сайту и самостоятельно добавляет в отображаемые странички отчёт о локальном поиске.

На первый взгляд всё это - лишние сложности, но попробуйте Google Desktop сами и вы поймёте, что свой поисковик способен на многое, а прежде всего дарует избавление от заботы по систематизации данных на компьютере. Зачем нужны организованные коллекции, списки и подборки, если всё что угодно можно и так отыскать в мгновение ока? Говорят, на создание Google Desktop ушёл почти год работы целой научной группы, но продукт пока ещё сырой. Поддерживается только английский язык, крайне ограничен список типов документов, внутренняя структура которых понимается. Впрочем, у создателей большие планы: нарастить функциональность микропоисковика, опубликовать его программный интерфейс (API), чтобы сторонние разработчики могли навешивать на Google Desktop плагины. Наблюдая как медленно, но верно прогрессирует Gmail, легко верится, что Google Desktop ждёт большое будущее.

Слухи о десктоп-поисковике Google ходили давно, так что по большому счёту появление бета-версии продукта не стало неожиданностью. И всё же Google удивила: ведь она обставила многих, очень многих конкурентов на этом перспективном направлении! Первой из титанов, помнится, пообещала оснастить десктоп полноценной поисковой машиной Microsoft: её микропоисковик будет основан на файловой системе WinFS и появится в Windows Longhorn. Впрочем, недавно WinFS из Longhorn была официально исключена, так что теперь судьба продукта Microsoft неизвестна. Но есть и другие участники. Apple обещает в будущей версии Mac OS X (в следующем году) нечто подобное Google Desktop, AOL уже тестирует похожую программу и планирует её выпуск в ноябре, Yahoo! и AskJeeves должны показать свои аналогичные разработки в ближайшие месяцы, и всё это не считая множества утилит от мелких разработчиков - которые, конечно, теперь будут забыты. Но всё это завтра, а сегодня - пустите Google на свой компьютер!

http://www.computerra.ru/think/sentinel/36251/


\\192.168.64.100\Soft\GoogleDesktopSearchSetup.exe
LeX
Семь дней с Google Desktop Search
Автор: Олег Парамонов
Опубликовано 21 октября 2004 года

Ровно неделю назад Google выпустил бета-версию поисковой системы для персональных компьютеров (если вы пропустили эту новость, подробности ищите тут). Программу можно скачать по адресу http://desktop.google.com. Она работает под Windows.

Неожиданностью появление персонального поисковика не стало. Хотя в Google культивируют секретность, утечки всё же порой случаются. В мае о существовании секретного проекта сообщила газета "Нью-Йорк Таймс" ("Компьютерра-Онлайн" писала об этом так). Правда, как мы теперь знаем, ошибок в раздобытой журналистом "Нью-Йорк Таймс" информации хватало. В частности, кодовое имя проекта оказалось вовсе не Puffin, а значит и наша теория, будто персональный поисковик создаётся на базе приложения Google Deskbar, оказалась ложной.

Размер установочного файла - 400 килобайт. Google Desktop Search скачивается в мгновение ока даже при небыстром телефонном соединении. Это первое оружие в арсенале Google. Размеры установочных файлов конкурирующих программ будут сдерживать их распространение. Тут перещеголять Google под силу только Microsoft: если соответствующая программа входит в состав Windows или Office, то скачивать не нужно ничего.

Наполеоновские планы. По неофициальной информации, в Google были разочарованы количеством установок Google Toolbar, специальной поисковой панели для Internet Explorer. Скорее всего, любая другая компания может только мечтать о такой популярности своего продукта, но в Google желают большего. Google Desktop Search должен распространиться повсеместно. По замыслу создателей, он должен быть установлен на миллионах и миллионах компьютеров. Зачем?

Инсталляция. При установке программа просит закрыть все браузеры, в том числе и Firefox. Однако дополнительные компоненты оказываются установлены только в Internet Explorer. Похоже, поддержка Firefox планировалась, но так и не была реализована. Возможно, слухи, будто в Google решили выпустить недоделанную бета-версию Google Desktop Search раньше времени, когда узнали, насколько далеко зашла разработка аналогичного проекта в Microsoft, не лишены оснований.

Индекс. Наверное, когда-нибудь на накопителях обычных домашних компьютеров хватит места, чтобы уместить индекс всего современного интернета. Чтобы осознать его масштабы, стоило поставить Google Desktop Search. Индекс не интернета, а всего лишь моего жесткого диска потребовал не одной сотни мегабайт. Инсталлятор отказывается продолжать работу, если на диске нет свободного гигабайта, а размер индекса может достигать двух гигабайтов. Кажется, это очень много. Наверное, дело в том, что я ещё помню винчестеры размером сорок мегабайт.




Интерфейс. У Google Desktop Search нет собственных окон, только маленькая иконка на системной панели задач. Пока она видна рядом с часами, в памяти компьютера работает крохотный веб-сервер. Если дважды щёлкнуть по ней, откроется стандартный браузер (это может быть Internet Explorer, Firefox или Opera - неважно) со страницей до боли знакомого вида. От настоящего Google её отличает лишь чуть иной логотип и количество документов в индексе. У Google их 4 миллиарда, а у меня - только 40 тысяч.




Арахнология. О том, что документов у меня 40 тысяч, я узнал не сразу. Создание индекса требует времени. Этим занимается другой невидимый пользователю процесс-паук, который включается только тогда, когда компьютер ничем не занят. Зато тогда он работает так энергично, что хочется пожалеть отчаянно жужжащий жёсткий диск. За считанные минуты программа перебирает сотни файлов. Программисты Google не зря едят свой хлеб.




Типы файлов. Google Desktop Search позволяет вести полнотекстовый поиск в найденных на диске текстовых файлах и документах в форматах HTML, MS Word, MS Excel, MS Powerpoint. Кроме того, в индекс попадает электронная переписка, хранящаяся в почтовых программах Outlook или Outlook Express, а также архивы переговоров в интернет-пейджере AIM.

Внешняя память. Осталась неупомянутой ещё одна возможность. Её нет ни в одной другой стандартной для Windows программе, и она превращает Google Desktop Search в нечто большее, чем просто программа для поиска в файлах. С помощью Google Desktop Search можно вести поиск на интернетовских страницах, которые хоть раз открывались в браузере.




Сырость. Когда-то увиденные в интернете страницы попадут в индекс Google Desktop Search только в том случае, если они были открыты в браузере Internet Explorer. Другие браузеры не поддерживаются (просьба инсталлятора выключить Firefox даёт надежду, что поддержка этого браузера вскоре будет добавлена, пока же можно пользоваться обходным путём: специальным расширением Slogger). Google Desktop Search не знает ничего, кроме Outlook (не работает даже Gmail!), и никогда не слышал про существование ICQ. Для Google Desktop Search файлы в форматах PDF, метаинформация в звуковых и графических файлах - загадка за семью печатями. Поддержка русского языка в персональном поисковике есть не везде: в индекс текстовые файлы попадают уже без надписей на кириллице. В довершение всего, Google Desktop Search пока не поддерживает работу с несколькими пользователями на компьютере.

Если гора не идёт к Магомету... Есть шансы, что в Google Desktop Search когда-нибудь появится поддержка ICQ или Firefox. Однако можно ли всерьёз рассчитывать на то, что в Google будут тратить ресурсы на заботу о немногочисленных в масштабах интернета пользователях интернет-пейджера Miranda или почтового клиента The Bat? Вряд ли. Если Google не позволит сторонним разработчикам писать плагины для поддержки новых файловых форматов, создателям популярного софта придётся задуматься: не перейти ли на использование файловых форматов своих более популярных соперников?

Глас народа. Google позволил пользователям голосовать за введение новых функций. В списке: индексация кэша Firefox, почты в Thunderbird и переговоров в других интернет-пейджерах, поиск в PDF, музыкальных файлах и именах папок, поиск по неполным запросам, специальная кнопка для Google Desktop Search на Google Toolbar и показ более десяти результатов одновременно. Голосуйте.

Поисковый запрос. Запросы к Google Desktop Search формулируются так же, как и к "большому" Google. Это большой плюс. Несмотря на все недоработки, совершенный язык запросов позволяет программе выглядеть не столь бледно на фоне предшественников, которые поддерживают все существующие и несуществующие форматы файлов.

Скорость поиска. Ответ на любой запрос следует мгновенно. Без всякого преувеличения.




Результаты. Знакомый вид - почти Google.com. Добавилась маленькая иконка - указание на тип найденного документа. Четыре ссылки под строкой поиска позволяют отфильтровать результаты, чтобы посмотреть только файлы, только найденные письма, только найденные переговоры в интернет-пейджере или только веб-страницы, когда-то загружавшиеся в браузер. Любопытно, что для веб-страниц иногда показываются крохотные скриншоты. "Большой" Google такого не делает.

Без пейджранка. Google.com был выстроен на технологии PageRank. Она - его фундамент. Именно PageRank когда-то выделил этот поисковик из других. Оказалось, что учёт ссылок, соединяющих веб-страницы в интернете, позволяет сортировать результаты более точно. Жёсткий диск персонального компьютера - не интернет, и ссылки там встречаются редко. Это значит, что PageRank использовать нельзя, и Google лишён своего главного козыря. Первый же взгляд на результаты поиска обнаруживает, что сортировка по релевантности стыдливо отключена, а результаты рассортированы по дате изменения. Значит ли это, что в Google настолько не верят в собственный алгоритм сортировки?




Архив изменений - одна из тех возможностей, которые замечаешь не сразу. У Google Desktop Search, как и у его старшего брата, есть "кэш", в котором можно просмотреть, как выглядела найденная страница в момент индексации. Больше того, оказывается, Google Desktop Search сохраняет не одну, а несколько версий документа, так что потом можно проследить за историей его изменений.

Интеграция с "большим" Google. После установки Google Desktop Search на сайте Google.com появляется ссылка "Desktop", ведущая на локальную страницу персонального поисковика. Если же поискать при помощи Google в интернете, перед ссылками на удовлетворяющими запросу ресурсами появится информация о количестве найденных на локальных компьютере документов. Однако сведения о содержимом компьютера не отправляются в интернет, и угрозы конфиденциальности нет. Эту информацию в страницы Google добавляет работающий тут же Google Desktop Search (судя по всему, он действует как UDP-прокси, пропуская через себя приходящий с Google.com код).




"Вирусный маркетинг". Добавление персональной информации в страницы "большого" Google - великолепный рекламный ход. На пользователей видоизмененные страницы поисковика производят неизгладимое впечатление, а значит можно рассчитывать на хождение молвы о Google Desktop Search из уст в уста. Вирусный маркетинг никогда не подводил Google - им он и заработал свою популярность. Не подведёт и на этот раз.

Конфиденциальность. Google Desktop Search не передаёт никакой информации в "большой" Google. Результаты, которые отображаются в браузере, не покидают локального компьютера. Однако убедить в этом несведущих пользователей будет нелегко, а как показала недавняя история с другим детищем Google, почтовой системой Gmail, уровень паранойи достаточно высок, чтобы раздуть слона из самой маленькой мухи. Уже на следующий день после релиза Google Desktop Search некие аналитики объявили программу невиданной угрозой конфиденциальности: оказывается, если за одним компьютером работают несколько человек, и они не позаботились о том, чтобы защитить свои папки паролем, то персональный поисковик проиндексирует всё. Улавливаете логику?

Рекламы не будет. Кстати, из-за всё той же параноидальной борьбе за конфиденциальность Google Desktop Search лишен коммерческих перспектив. Показывать рекламу на его страницах нельзя, а основной источник доходов Google - это именно реклама. Чтобы получать с сервера контекстную рекламу, туда придётся отправлять какую-то информацию о содержимом компьютера. Это покажется бесцеремонным вторжением в частную жизнь слишком многим.

Несовместимость. Есть приложения, сосуществовать с которыми Google Desktop Search наотрез отказывается. В первую очередь, он не любит программы, которые пытаются фильтровать интернет тем же способом, которым это делает он сам. В их число входят некоторые антивирусы, персональные брандмауэры и средства для вырезания баннеров. Оправдание у Google Desktop Search простое: что вы хотите от первой бета-версии?

Пауки на галерах. Что будет, если связать все Google Desktop Search воедино? Получится гигантская пиринговая сеть. В воздухе давно витает идея пирингового поисковика, роль роботов-пауков в котором исполняют люди, установившие на свои компьютеры специальное программное обеспечение. Однако попытки её реализации попадают в замкнутый круг, из которого нет выхода: чтобы создать индекс подходящих размеров, сеть должна достигнуть определенной популярности, но пока индекса нет, популярности у неё не будет. Использование программы наподобие Google Desktop Search для того, чтобы вырваться из замкнутого круга, было бы остроумным решением, но нужно ли это Google?

Тень "Напстера". Есть и другое применения для гигантской пиринговой сети. Если скрестить Google Desktop Search с социальной сетью Orkut, которая тоже принадлежит Google, то появится прекрасный способ делиться файлами с друзьями - сравнительно легальный даже по строгим западным меркам.

Персонализация. Впрочем, у Google Desktop Search есть и ещё один путь развития. Программа уже сейчас модифицирует содержимое принимаемой из интернета страницы, когда встраивает результаты поиска в страницу с Google.com. Можно пойти дальше и позволить ей вносить изменения в состав и порядок результатов поиска в интернете в зависимости от информации о пользователе, которую она собрала. А если распространить эту тактику на другие сайты? Раньше эту идею пробовали применить компании Microsoft и Gator, каждая по-разному, но обе - безуспешно. Что выйдет у Google?

Где зарыта собака. Реакция на появление Google Desktop Search кажется слишком бурной. Все разговоры только о нём. Каждая крупная компания, считающая, что она чего-то стоит в интернете, сочла своим долгом протрубить о разработке собственного персонального поисковика. Microsoft, Apple, Yahoo, AOL - всех и не перечислить.

Зачем? Что их привлекло на этом рынке? (Да и рынок ли это? Есть ли в персональном поиске деньги?) Ведь ясно, что потребность в собственном поисковике испытывает лишь горстка продвинутых пользователей, а 99% прекрасно обходятся и без него.

Ответ на этот вопрос прост. На кону в грядущей битве - не поиск, а нечто совсем иное. Продолжение следует...
bam
Заманчиво это все, конечно wink.gif
Но:

1. Жалко тратить около 2 гиг, а может и больше, на индексирование...
2. Пока нет поддержки русского языка, нам, русскоязычным, он не особо интересен tongue.gif
3. Скорее будет лишний процесс в памяти wink.gif И засорение систрея wink.gif
4. Меня лично особо не интересуют форматы МС Офис. Зато пригодилось бы поддержка рисунков и музона smile.gif

Будем надеяться, что в окончательной версии многие недостатки беты будут пофиксены wink.gif

P.S. А жалко, что WinFS исключен из Longhorn'а sad.gif
Kildor
Скачал. попытался поставить..

Отказалась работать по очереди с:
дрВебб Панда, Нав (но последний - под вопросом)

Несмотря на то. что стандартный браузер - опера, при нажатии на иконку вылезает ИЕ..

Далее..
Индекс и кеш - быстро. факт. Правда не всегда дождешься того, чтоб он начал индексировать.. wink.gif

Русский поиск - имеется.
(я не знаю, что и кто говорили, но русские запросы он обрабатыает великолепно)

не работает с оперным кешем и с оперной почтовой базой.. Вопрос, будет ли.. :-(

Ищет файлы по дискам,
нет поддержки id3 тегов в mp3, нет поддержки OOo файлов, вопрос - появится ли.

Мозилла:
Уже есть экстеншион, который встраивает GD в браузер. Обещается поддержка моззильного кеша. не знаю насчет TB почтовой базы.. ;-)

Одно правда могу сказать - в оперу он встраивается также легко и быстро... wink.gif 3 минуты на то, чтоб опера могла искать из адресной строки, столько же - на создание поля для поиска.

Снес, ибо антивирь для меня важнее. Как научится дружить с дрвебом - поставлю, и буду рабоваться жизни.

видно, что продукт еще сырой, но на то она и бета. Но, думаю, что к финалу получится великолепный продукт.. wink.gif
LeX
Попробовал. С софтом не конфликтует. Браузер у меня основной, уж извините, IE. Антивирь, F-prot, тоже стоит себе, работает без проблем.

Незаметно (за 6 часов) при полностью загруженном процессоре (кодирование фильмов), проиндексировал 12 тыс. документов (плюс всю почту - 1,5 Гб). Выдает ответы на русские запросы, причем точно!!!

Определенно, надо поюзать. Так как у меня до получаса иногда уходит на поиск какого-нибудь старого, неожиданно понадобившегося документа.
Kildor
;-)
C оперой он работает очень неплохо.. только лишь ругается на несовместимость
(не удивлюсь, если это действительно так.. Gmail в свое время тоже не мог работать с оперой, только последняя ее версия (7.60tp1) приобрела нужную функциональность (xmlhttp))
может и тут тоже самое...

Наверное я через пару недель опять скачаю его, и установить постараюсь..
LeX
Первые скриншоты локального поисковика Microsoft
22 ноября 2004 года, 13:04
Текст: Юрий Ильин
Борьба Microsoft с Google вступила в новую фазу. От грозных обещаний корпорация переходит к действиям. Несколько дней назад была запущена поисковая система Microsoft, а скоро к ней добавится и локальный поисковик, напоминающий Google Desktop Search.

Первоначально планировалось сделать средства локального поиска частью нового поколения операционной системы Windows, которое пока известно под кодовым именем Longhorn. Однако разработка Longhorn затягивается, а в Microsoft понимают, что медлить нельзя. Локальный поисковик будет выпущен раньше.

Хотя Microsoft предпочитает не афишировать подробности, кое-какая информация о ходе разработки всё же просачивается за пределы компании. В распоряжении издания Neowin оказались скриншоты предварительной версии этого средства поиска (см. следующую страницу). Подлинность скриншотов подтвердили сами разработчики в официальном поисковом блоге Microsoft.

Как выясняется, локальный поисковик будет частью набора программ MSN Toolbar Suite. Как сообщает Neowin, при инсталляции MSN Toolbar интегрируется с Outlook, Internet Explorer, Windows Explorer и MSN Deskbar и представляет возможности поиска по базам всех этих программ. Бета-версия Google Desktop Search имеет сходные возможности.

MSN Desktop Search является отдельно устанавливаемым компонентом Toolbar'a, и, по словам тестировавших даже этот предварительный вариант сотрудников Neowin, результаты впечатляют - и по скорости, и по количеству выводимых данных.

http://soft.compulenta.ru/2004/11/22/51999/
Que
Вопрос поставившим: сравните с кнопочкой F3 в explorer? Что лучше-хуже?
Kildor
бесспорно лучше GD

во первых - скорость. Так как файлы постоянно индексируются, и хрянятся в базе поиск практически мгновенно.
Так как это идет через веб, можно настроить в браузере так, как хочешь (У меня в опере поиск вынесен на стартовую панель)
И, когда ты ищешь что-то в большом гугле, то в результатах тебе показывается и твой комп.

Que
т.е. если ищешь раз в неделю, и в основном в офисных документах можно ограничиться и встроенным поиском? Кстати, служба индексироания была включена? У меня отключена и поиск довольно долгий. GD только по индексам ищем. А M$ с включенным индексом тоже медленный?
Kildor
Вот уж не знаю, ищет ли встроенный поиск в винде внутри офисных файлов..
ГД - умеет.
Файлы для поиска встроенно не индексировал.

ГД ищет и по страницам, и, если ты пользуешься ИЕ, по его истории, что довольно удобно.
по поводу индекса гугля.
243 метра - индекс 80-гигового винта, забитого чем только не..wink.gif
Que
M$ ищет внутренности - это точно. По офисным документам весьма точно и достаточно шустро. Я им уже несколько лет пользуюсь.
Fast Reply:

 Enable Smilies |  Enable Signature
Здесь расположена полная версия этой страницы.
Invision Power Board © 2001-2012 Invision Power Services, Inc.