Информационно-поисковые системы (ИПС) служат для анализа и хранения документов, их быстрого поиска и выдачи. Различают ИПС документального и фактографического типа, а также информационно-логические системы (ИЛС). Под документальной ИПС понимается система для выявления по заданным признакам всех документов, содержащих требуемую информацию. Наиболее простой документальной ИПС по патентам является, например, картотека или фильмотека микрофильмов описаний изобретений, расставленных по рубрикам патентной классификации или номерам патентов.

Под фактографической ИПС понимается система для выдачи фактических справок, представляющих собой ответы на заданные вопросы. Практически документальные ИПС мало отличаются от фактографических: первые в ответ на запрос выдают документ, вторые-конкретные сведения, содержащиеся в документах. В отличие от ИПС информационно-логические системы не только хранят и выдают по запросу необходимую информацию, но и осуществляют ее логическую переработку (преобразование).

Важнейшими элементами ИПС являются: информационно-поисковый язык (ИПЯ), правила перевода документа с естественного языка на ИПЯ, а также критерии смыслового соответствия между поисковым образом документа и поисковым предписанием, которое содержится в запросе. Под ИПЯ понимается формализованная система символов, предназначенных для выражения и передачи смыслового содержания документов.

В настоящее время наиболее широко распространены ИПЯ трех типов: библиотечно — библиографические классификации (МПК, УДК и др.); алфавитно-предметные классификации (различные алфавитно-предметные указатели и рубрикаторы); дескрипторные языки, представляющие собой перечень иерархически неупорядоченных «ключевых» слов. В соответствии с принятым языком ИПС бывают классификационного, предметного и дескрипторного типа. Дескрипторные ИПС являются наиболее современными системами и базируются на использовании принципа координатного индексирования.

Этот принцип основывается на представлении, что смысловое содержание любого документа или текста может быть достаточно полно и точно определено набором так называемых «ключевых» слов, то есть выбранных из текста существенных слов, наиболее полно отражающих содержание документа. Словари нормализованных ключевых слов называются тезаурусами.

Поисковый образ документа — это выраженное в терминах формализованного ИПЯ основное смысловое содержание документа, по которому его можно отыскать в массиве, других документов. Поисковое предписание — это выраженное в терминах формализованного ИПЯ смысловое содержание информационного запроса. Критерий смыслового соответствия — это правила формального определения степени совпадения поискового образа с поисковым предписанием.

Таким образом, ИПС — это совокупность ИПЯ, правил логической переработки документа (включая алгоритмы индексирования и поиска, а также критерии смыслового соответствия) и технических средств, обеспечивающих функционирование системы. Основными характеристиками ИПС являются полнота и точность выдачи.

Когда речь идет о полноте той или иной информации, то подразумевается совокупность документов, имеющих отношение к запросу. Так, например, известно, что по данному вопросу в фонде имеются 100 документов. При поиске из фонда отобрано 70, из которых при проверке выбрано 60 непосредственно относящихся к запросу документов.

Полнота выдачи при этом будет определяться — коэффициентом 0,6 (60/100), а точность выдачи 0,85 (60/70). Иногда также говорят, что в полученном ответе релевантных документов, то есть документов, по смыслу относящихся к запросу, и 10 иррелевантных документов, то есть не относящихся к запросу. Иногда эти 10 документов называют «поисковым шумом» или просто «шумом». Практика эксплуатации ИПС показывает, что увеличения точности можно достичь только путем уменьшения полноты, и наоборот.

Из опубликованных данных известно, что увеличение точности поиска на 1% ведет к уменьшению его полноты на 3%. В известных ИПС коэффициенты полноты обычно составляют 70-90%, а точности — 8-20% (Л2-12). По характеру используемых носителей ИПС подразделяются на ИПС с дискретными носителями (каталожные карточки, система унитермкарт, перфокарты, форматные микрофильмы, микрофиши, магнитные карты и т. д.) и непрерывными носителями (перфоленты, магнитные ленты, рулонные микрофильмы, магнитные диски и барабаны и т. д.).