Правила пользования поисковиками : Сеть

OlegON · █ 26.08.2011 15:18

Цитата:

Специальные команды Google записываются в строке для ввода поискового запроса перед параметром поиска, а перед некоторыми командами необходимо указать символ «-». Обратите внимание, что после символа «-» пробел не ставится.

Вот некоторые из них:

-allinlinks – эта команда проводит поиск только в названиях ссылок, а не в тексте или названии страницы, например, -allinlinks itua;

-allintext – наоборот, ищет внутри текста на страницах, но не в ссылках или названии страницы, например, -allintext интернет-маркетинг;

-allintittle — показывает результаты поиска в заголовке страницы;

-allinurl: — показывает страницы, похожие на данный шаблон. Например, -allinurl:links.php;

cache: — находит копию страницы, проиндексированной Google, даже если эта страница уже недоступна по адресу в Интернете или изменила свое содержание. Иными словами, эта команда проводит поиск в кэше Google. Она пригодится для просмотра страниц, контент которых часто меняется. Например, cache:

filetype: — позволяет ограничить поиск только файлами с заданным расширением. Однако Google воспринимает как разные команды filetype:htm и filetype:html. Google поддерживает поиск в файлах наиболее популярных форматов ppt, pdf, xls и doc;

info — покажет страницу, содержащую ссылки на варианты поиска: поиск по похожим страницам, обратные ссылки, и страницы, содержащие такую же ссылку. Эта команда означает то же самое, что и вписать в строку поиска данный адрес веб-страницы;

intext —в этом случае при поиске не буду учитываться заголовки страниц и ссылки, а будет просматриваться только текст тела страницы (тега <body>). Это бывает полезно, когда вы ищите фрагмент текста и вам безразлично, какой у страницы заголовок и какие ссылки;

intitle: — эта команда, наоборот, ограничивает поиск только заголовком страницы, то есть содержимым тега {title}. Например, intitle:первая полоса (пробелов между командой и параметром быть не должно) приведет к тому, что Google выдаст ссылки на первую полосу русскоязычных интернет-газет;

inurl: — по этой команде поиск будет проводиться только в адресе страницы. Обычно эту команду используют не по одиночке, а вместе с другими, когда хотят отыскать страницу поиска. Например, команда inurl:search выведет список страниц, у которых в адресе встречается слово search, как в этих случаях: search.aol.com или home.netscape.com/home/internet-search.html;

link: — возвращает список страниц, которые ссылаются на заданный сайт. Для наглядности, введите link:itia.info и получите список страниц, ссылающихся на ресурс itua.info;

related: — с помощью этой команды вы сможете получить список страниц, похожих на данную. Например, указав related:lenta.ru вы получите список ссылок на другие онлайновые СМИ. Кроме этого, related: – удобное средство, если вы хотите узнать, к какой категории относит ваш сайт Google;

site: — это, наверное, одна из самых часто используемых команд Google. Она позволяет ограничить поиск только на указанном сайте.

А сейчас мы рассмотрим дополнительные команды поисковой машины Yandex:

$title (выражение) — позволяет провести поиск в заголовке страницы, например, $title (интернет-маркетинг);

$anchor (выражение) — эта команда означает поиск в тексте ссылок, например, $anchor (itua) — находит ссылки, в которых есть слово itua;

#keywords=(выражение) — с помощью этой команды можно провести поиск в ключевых словах, например, #keywords=(поисковая система);

#abstract=(выражение) — эта команда означает поиск в описании страницы, например, #abstract=(искалка | поиск);

#image=»значение» — такой запрос позволит произвести поиск картинок с указанным названием, например, #image=»nokia» — выберет ссылки на сайты, на которых есть картинки с названием nokia;

#hint=(выражение) — а эта команда проведет поиск в подписях к изображениям, например, #hint=(lenin | ленин);

#url=»значение» — означает поиск на заданном сайте (странице), например, #url=»

#link=»значение» — таким образом вы можете задать поиск ссылок на заданный сайт, например, #link=”

#mime=»значение» — эта команда ограничивает тип найденных документов, например, в результате запроса концепция Web 2.0 #mime=»pdf» вы найдете pdf-документы, в которых встречаются данные слова;

host=» — оператор аналогичен url с именем хоста, но учитывает все зеркала сайта, например, host=»

rhost=»ru.url.*» или rhost=»ru.url.www» – этот оператор аналогичен host, но имя хоста записывается в обратном порядке — вначале домен верхнего уровня, затем второго и т. д. Если в конце указано .*, то поиск идет по всем поддоменам заданного домена (но не включая домен ru.url!), например, rhost=»ru.yandex.*»;

lang=»язык» — такая команда отбирает для поиска страницы, написанные на определенном языке, например, на русском (ru), украинском (uk), белорусском (be), английском (en), французском (fr), немецком (de), например, lang=»de»;

like=»url.ru/file.html» — отбирает для поиска страницы, похожие на заданный адрес, например, like=»

domain=»домен» — с помощью такой записи можно произвести поиск по страницам, которые расположены в заданном домене: domain=»yandex» /+1 domain=»ru»;

date=»ГГГГ{*|ММ{*|ДД}}» — в этом случае поиск производится только по страницам, дата которых удовлетворяет заданному условию, например, date=»200310*»;

cat=(ID региона) или cat=(ID темы) — такой поиск включает только страницы сайтов, зарегистрированных в «Яндекс.Каталоге», тематическая рубрика или регион которых совпадают с заданным.

OlegON · █ 26.08.2011 15:20

Цитата:

ПОИСКОВЫЕ СИСТЕМЫ YANDEX И GOOGLE

Рассмотрим справочную таблицу примеров построения основных типов запросов в поисковой системе Yandex.ru ()

1. "К нам на утренний рассол" Цитата, т.е. слова в запросе идут подряд в точной форме
2. "Прибыл * посол" Пропущено слово в цитате
3. полгорбушки & мосол Слова в пределах одного предложения
4. снаряжайся && добудь Слова в пределах одного документа
5. глухаря | куропатку | кого-нибудь Поиск любого из слов
6. я должон /2 казнить Расстояние в пределах двух слов в любую сторону (то есть между заданными словами может встречаться одно слово)
7. государственное дело && /3 улавливаешь нить Расстояние в три предложения в любую сторону
8. нешто я ~~ пойму Исключение слова пойму из поиска
9. при моем /+2 уму Расстояние в пределах двух слов в прямом порядке
10. чай ~ лаптем Поиск предложения, где слово чай встречается без слова лаптем. Исключены документы, где слова запроса встречаются только в одном предложении со словом «лаптем»
11. щи /(-1 +2) хлебаю Расстояние от одного слова в обратном порядке до двух слов в прямом
12. !Соображаю !что !чему Слова в точной форме с заданным регистром
13. получается && (+на | !мне) Скобки формируют группы в сложных запросах
14. !!политика Словарная форма слова
15. title:(в стране) Поиск по заголовкам документов
16. url:dudikhin.narod.ru Поиск по URL
17. фашист inurl:vojne Поиск с учетом фрагмента URL
18. host:lib.ru филатов Поиск по хосту
19. site: Поиск по всем поддоменам и страницам заданного сайта
20. mime:pdf филатов федот Поиск по одному типу файлов
21. lang:en Поиск с ограничением по языку
22. domain:az федот Поиск с ограничением по домену
23. date:20110201 селедка Поиск с ограничением по дате
24. date:20071215..20080101, date:>20091231 Поиск с ограничением по интервалу дат

Рассмотрим основные примеры построения запросов в поисковой системе Google.com (

1. Один из нескольких (логическое ИЛИ.. По-умолчанию Google ищет страницы, которые содержат все слова из поискового запроса, но если требуется выдать и те, которые содержат хотя бы одно слово из заданного множества, можно воспользоваться логическим оператором ИЛИ. Ему соответствует символ "|".
Пример: мебель|диван|стол.

2. Кавычки. Если вам необходимо найти определенную фразу дословно, можно использовать кавычки.
Пример: "Hotel California" (аналогичный запрос без кавычек вернул бы не только ссылки на все упоминания одноименной песни, но и на множество сайтов тур-операторов и гостиниц).

3. Исключение (логическое НЕ). Для того, чтобы исключить из результата поиска те страницы, которые содержат определенное слово, в поисковом запросе необходимо использовать символ "-".

Пример: скачать linux -suse (запрос вернет ссылки на страницы для скачивания различных дистрибутивов Linux, за исключением Suse).

4. Похожие слова. Для того, чтобы Google искал слова, похожие на заданное, используйте символ "~" (тильда). Используется для поиска синонимов ключевого слова, а также для того, чтобы сделать поиск более полным.

Пример: ~авто.

5. Маски. Символ "*" можно использовать как маску - условное обозначение произвольного количества любых символов. Это может быть полезно, например, если вы пытаетесь найти текст песни, но не можете при этом точно вспомнить слова. Или отыскать сайт, домен которого запомнился только отчасти.
Пример: welcome to the hotel * such a lovely place; *pedia.org.

6. Расширенный поиск. Если вы забыли какой-либо из перечисленных операторов, всегда можно воспользоваться формой расширенного поиска.

7. Определения. Используйте оператор define: для быстрого поиска определений.

Пример: define:деньги

8. Калькулятор. Одной из полезных и при этом малоизвестных возможностей Google является вычисление арифметических выражений. Во многих случаях это быстрее, чем использование программы калькулятора. В выражениях можно использовать операторы +, -, *, /, ^ (степень), sqrt (квадратный корень), sin, cos, tan, ln, lg, exp (ex), скобки и много чего еще.

Пример: sqrt(25 * 25) * 768.

9. Числовые интервалы. В Google существует еще одна малоизвестная возможность - поиск числовых интервалов, которые можно задавать с помощью крайних значений, разделенных последовательностью из двух точек.

Пример: Оскар 2004..2007.

10. Поиск на заданном сайте. С помощью оператора site: можно ограничить результаты поиска определенным веб-сайтом.

Пример: оскар site:ru.wikipedia.org.

11. Ссылки извне. С помощью оператора link: можно найти страницы, которые ссылаются на заданный URL. Оператор можно использовать не только для главного адреса сайта, но и для отдельных страниц. Оператор не дает гарантии, что в результате поиска будут перечислены абсолютно все страницы.

Пример: link:7not.ru.

12. Вертикальный поиск. Вместо того, чтобы искать заданные слова во всем вебе, можно ограничить поиск какой-либо одной определенной сферой. В Google входит множество поисковых сервисов, позволяющих находить интересующую информацию в блогах, новостях, книгах, и многих других категориях:

Поиск по блогам ( )
Поиск книг ( )
Академия ( )
Поиск открытого программного кода ( )
Поиск в каталогах ( )
Финансы ( )
Поиск картинок ( )
Карты ( )
Новости ( )
Поиск патентов ( )
Поиск продуктов ( )
Поиск видео ( )
Поиск по ресурсам Linux ( ) и поиск по ресурсам BSD ( )

13. Кино. Для поиска обзоров фильмов и кинотеатров, где искомый фильм показывают, используется оператор movie:.

Пример: movie:Аватар.

14. Музыка. Оператор music: ограничит результаты поиска контентом, который тем или иным образом связан с музыкой.

Пример: music:Depeche Mode.

15. Преобразователь единиц измерения. Google можно использовать для быстрого преобразования метров в ярды, килограммов в фунты, литров в джоули. Для этого используется абсолютно естественный для человеческого понимания синтаксис.

Пример: 15 рублей в долларах

16. Числовые шаблоны. Алгоритмы Google умеют распознавать тип числовых данных по шаблону их ввода. К сожалению, большинство этих шаблонов соответствуют только американским стандартам. В частности можно искать:

- региональные телефонные коды;
- номера автомобилей (US only);
- инвентарные номера Федеральной Комиссии Коммуникаций FCC (US only);
- UPC (универсальные товарные коды, применяемые в США);
- регистрационные номера Федерального авиационного агентства (США);
- номера патентов (США);
- биржевые котировки (нужно использовать символы акций) и прогноз погоды на пять дней вперед.

17. Типы файлов. В случае, если вы хотите искать, например, только документы в формате PDF, Word или Excel, можно использовать оператор filetype:. Также, аналогично можно использовать оператор ext:. Полный список поддерживаемых форматов на момент написания данного текста:

Adobe Portable Document Format (pdf)
Adobe PostScript (ps)
Lotus 1-2-3 (wk1, wk2, wk3, wk4, wk5, wki, wks, wku)
Lotus WordPro (lwp)
MacWrite (mw)
Microsoft Excel (xls)
Microsoft PowerPoint (ppt)
Microsoft Word (doc)
Microsoft Works (wks, wps, wdb)
Microsoft Write (wri)
Rich Text Format (rtf)
Shockwave Flash (swf)
Text (ans, txt)

Пример: справочник по с++ filetype:pdf.

18. Местоположение слова. По-умолчанию Google ищет заданный текст внутри содержимого страниц. Но если есть необходимость искать в некоей определенной области, можно использовать такие операторы как "inurl:" (поиск внутри URL), "intitle:" (поиск в заголовке страницы), "intext:" (поиск в тексте страницы), и "inanchor:" (поиск в тексте ссылок).

Пример: intitle:статья по авто

19. Кэшированные страницы. Оператор cache: возвращает кэшированную копию страницы с указанным адресом или URL. При сочетании с поисковым термином выделяет его на кэшированной странице.

Пример: cache: или cache: город воров

20. Ответ на главный вопрос жизни, вселенной и всего такого. Google знает ответ даже на этот сакраментальный вопрос. Google даст ответ, если вопрос будет записан по-английски.

Т.е., если написать в строке

Answer to the Ultimate Question of Life, the Universe, and Everything, то Google даст ответ 42

21. Поиск лиц. У поисковика картинок есть интересная (и, насколько мне известно, пока официально недокументированная) возможность - выделять из всего множества найденных изображений лица. Для того, чтобы этим воспользоваться, необходимо добавить к URL результата поискового запроса дополнительный GET-параметр imgtype=face.

Пример:
запрос

найдёт Гейтса и всяческие ворота
но

— только лица всяких Гейтсов.
22. Информация о сайте. С помощью оператора info: можно получить известную Google информацию об указанном сайте.

Пример: info:habrahabr.ru.

23. Похожие сайты. С помощью оператора related: Google может выдать список сайтов, которые считает тематически похожими на заданный.

Пример: related:flickr.com.

Это далеко не все операторы. Имеются и не документированные возможности Google. Например те, что находятся на стадии тестирования или те, которые по определенным причинам разработчики не пожелали делать широко известными. Обычно информацию о них можно найти на официальном блоге Google (). Кроме того, большое количество интересных сведений можно почерпнуть в неофициальном блоге Google (Swartz’s unofficial Google Blog ).

СПЕЦИАЛИЗИРОВАННЫЕ ПОИСКОВЫЕ СИСТЕМЫ

Существует целый достаточно многочисленный класс специализированных поисковых систем, которые сосредотачиваются на одном или нескольких узких областях деятельности. Например, – позволяет осуществлять интернет-мониторинг, - для поиска в «блогосфере» и RSS2 лентах. Метапоисковые системы, такие как, и , оригинальная отечественная разработка и ряд других. Кроме этого имеется громадное количество «экзотических» поисковых систем. Например – поисковая система для правоверного мусульманина или поисковая система для ортодоксального иудея и многие, многие другие.

КОЕ-ЧТО ОБ ИСПОЛЬЗОВАНИИ УДАЛЕННЫХ БАЗ ДАННЫХ

Для эффективного решения различных задач анализа, например, деятельности предприятий, необходимо накапливать, систематизировать и анализировать экономическую информацию. Эта задача требует больших финансовых и трудовых затрат. Базам данных необходимо постоянное сопровождение, так они достаточно быстро устаревают. Такая задача под силу только информационным подразделениям весьма крупных компаний. Решением данной проблемы может стать использование удаленных специализированных баз данных доступных через Интернет, которые, концентрируют колоссальные объемы информации.

Следует выделять базы, предназначенные для экономического анализа, которые оперируют в основном числовой информацией и так называемые полнотекстовые - хранение данных в которых производится преимущественно в виде файлов.

Кратко перечислим основные онлайновые информационные системы. Ограничимся наиболее яркими представителями этого класса информационных продуктов, российскими: Артефакт (), Public.ru, Scan.interfax.ru, Spark.interfax.ru, Medialogia.ru, «CКРИН Эмитент» () и зарубежными: Lexis-Nexis (), Factiva () и D&B (). Это отнюдь не означает, что этим перечнем ограничивается круг информационных продуктов, достойных внимания. С каждым годом растет число интересных специализированных систем.

Кратко рассмотрим некоторые из наиболее интересных баз данных

Информационно-поисковая система «Артефакт» () – одна их самых больших, а может быть, и самая объемная публичная российская информационная система коллективного пользования, содержащая политическую, коммерческую, юридическую, научную и адресно-справочную информацию.

Электронная библиотека Public.ru () – крупнейшая интернет-библиотека русскоязычных СМИ. Предоставляет полный спектр услуг по работе с материалами масс-медиа: от онлайн-доступа к уникальной коллекции публикаций до мониторинга СМИ и эксклюзивных аналитических исследований. Специализация фирмы – эффективный поиск и профессиональный анализ информации СМИ.
Информационно-аналитическая система «Медиалогия» () - система анализа СМИ в реальном времени, предоставляет широкие возможности для проведения глубоких детальных исследований по открытым источникам информации. В основе Медиалогии - инновационная технология анализа массивов неструктурированной информации.
С Медиалогией работают маркетологи и PR-менеджеры, аналитики и сотрудники служб безопасности, руководители и топ-менеджеры компаний. Медиалогия обеспечивает компании получение максимальной выгоды от владения информацией, от умения быстро ее анализировать и использовать на всех уровнях управления бизнеса.
Система комплексного анализа новостей «СКАН»() - предоставляето доступ к электронным архивам СМИ, а также профессиональные инструменты мониторинга и анализа текстовой информации. Информационные базы системы уникальны, так как это единственная база данных, в которой содержится архив сообщений группы компаний Интерфакс с 1989 года. Кроме этого, интеграция с другими информационными системами "Интерфакса" обеспечивает уникальный набор инструментов для сопоставления данных и проведения более глубокого анализа.
Система профессионального анализа рынков и компаний «СПАРК» () - это продукт компании "Интерфакс-АКИ", входящей в группу компаний Интерфакс. Система создана в 2002-2003 годах специалистами группы компаний Интерфакс. Основой системы стала информация, полученная от Госкомстата РФ (в настоящее время Росстат) и ФКЦБ (в настоящее время ФСФР). Кроме этого СПАРК опирается на информационные потоки агентства Интерфакс, которое является признанным лидером информационного рынка России и других стран СНГ.
Из зарубежных информационно-аналитических сиестем, продвигающих свои услуги на российском рынке можно упомянуть системы factiva, lexis-nexis и D&B.

Информационная система Factiva ( , русская версия ) - продукт Factiva, совместно создан компаниями Dow Jones и Reuters. Он предоставляет своим клиентам доступ к информационной базе, включающей в себя одновременно новостные ленты Dow Jones, Reuters, а также The Wall Street Journal. Кроме того, в этой системе можно искать в более чем 8000 источниках на 22 языках разных стран мира.

Имеются специализированные отчеты о деятельности компаний, включающие материалы D&B по более 36,5 миллиона компаний, а также полную подборку информации Investext.

Прежде чем стать доступным для пользователя, содержание каждой статьи в Factiva.com соотносится к определенной рубрике - по принадлежности к стране, отрасли, региону, тематике или компании. Списки рубрик представлен в рубрикаторе (Intelligent Indexing) системы, включающий в себя более 300000 компаний, 720 отраслей, 340 тематик и 370 регионов.

Информационная система Lexis-Nexis () достаточно старый информационный продукт. Его основы закладывались в шестидесятые годы прошлого столетия как собрание баз данных для юристов. Сейчас Lexis-Nexis обладает базой данных в виде досье более чем на 300 миллионов человек. В базы данных также включена информация о фирмах участниках хозяйственной деятельности Америки, Японии и Европы. Их ежегодные отчеты, налоговые декларации, долги и обязательства. Lexis-Nexis аккумулируют всю значимую англо-франко- испаноязычную прессу по всему миру.

Некоторые источники утверждают, что в результате десятилетий работы сформирована база данных, которая по объему информации соизмерима со всем Интернет, что система накапливает только проверенные и лицензированные документы (в отличие от всемирной паутины, где большая часть информации неизвестного качества). Однако, профессиональная работа с системой LEXIS-NEXIS достаточно сложна и требует специальной подготовки.

OlegON · █ 26.08.2011 15:23

Среди специализированных поисковых систем нельзя не выделить , собственно, поисковик по базе знаний, увы, только на английском.

OlegON · █ 20.05.2014 16:37

Простейшая команда для Google и "Яндекс", которая делает поиск куда более простым. К сожалению, многие люди не знают об этой возможности. Если взять текст в кавычки, поисковая машина начинает искать точное совпадение фразы - с нужным порядком слов, только с этим значением. Очень часто это помогает отыскать нужную страничку, не копаясь в мусоре.

OlegON · █ 20.05.2014 16:37

Менее часто используемая, но также полезная команда. Если набрать значок ~ (тильда) перед каким-либо словом, поисковая машина будет учитывать все его синонимы.

OlegON · █ 20.05.2014 16:37

Используйте символ &, чтобы быстро найти два слова, которые будут стоять в одном предложении. К примеру, запрос "Лермонтов & Орел" найдет для вас соответствующее предложение.

OlegON · █ 20.05.2014 16:37

Чтобы найти в "Яндексе" документы нужного типа, нужно добавить в запрос оператор mime и двоеточие. К примеру, запрос "бланк ЕГЭ mime:pdf" оставит в выдаче только PDF-документы. В Google для того же служит команда ext:

OlegON · █ 20.05.2014 16:40

Порадовал поисковик nigma, например, с решением уравнений:
вот так вот

OlegON · █ 06.01.2015 09:27

можно искать гуглом в интернет-магазинах по цене, например:
"зеркальная фотокамера canon 15000..20000", т.е. диапазон цены через две точки. Не очень точно работает, но работает...

OlegON · █ 06.01.2015 09:29

Мировое время (Google): введите фразу, вроде
"время Париж"