Понятие об ииформациоиио-поисковой системе (ИПС). Струк тура ИПС. Структура и функционирование конкретной ИПС за висят от вида и состава информационных источников, от спосо бов реализации информационного поиска. В то же время есть некоторые общие принципы построения и функционирования ИПС. Представление об ИПС развивалось. Под ИПС первоначально понималась некоторая совокуп ность, или комплекс взаимосвязанных отдельных частей, пред назначенных для выявления в каком-либо множестве элементов информации (документов, сведений и т.д.), которые отвечают на информационный запрос, предъявляемый к системе [2]. С учетом сути процесса информационного поиска ИПС {IPS) определяли следующим образом: IPS = <D,Q.R, D' >, (I) (/ej D'aD где D - некоторое множество документов HJUI библиотека (поисковый массив); Q - множество информационных запросов; D' - ответ па информационный запрос; R - множество отношений, свойств, при наличии которых любому запросу q. G Q ставится в соответствие подмножество D\ Более полно А.И. Черный предложил представить ИПС в виде совокупности четырех основных компонентов [5, С.18]: IPS = <LS,DJS,N>. (^) def где LS - логико-семантический аппарат (т.е. информационно-поисковый язык, правила индексирования и критерии выдачи); D - поисковый массив (т.е. определенное множество снабженных по исковыми образами документов, в котором отыскиваются необ ходимые); TS ~ технические средства (т.е. некие приспособления или устройства, которые необходимы для записи и хранения поисковых образов, для хранения документов и осуществления процесса сопоставле ния поисковых образов документов с поисковым предписанием или поисковым образом запроса); 287 Л^ - люди, взаимодействующие с системой (т.е. те, кто пользуются дан ной ИПС и обслуживают ее - осуществляют индексирование до кументов и информационных запросов, выбирают стратегию по иска, а также выполняют другие интеллектуальные операции, без которых невозможен информационный поиск). Затем для обеспечения возможности автоматизации процеду ры информационного поиска было предложено [2, 5] в ИПС вы делить два уровня рассмотрения - абстрактный и конкретный. Абстрактной ИПС была названа совокупность ИПЯ {retrieval language - RL), правил индексирования (IND) и критерия выдачи или критерия смыслового соответствия (KSS): IPS = <RL,IND,KSS>. clef (3) Конкретной ИПС названа практически реализованная систе ма, включающая массив документов Z), в котором производится информационный поиск, технические средства TS реализации ИПС, а также взаимодействующих с ней людей Л^. Схема функционирования ИПС в таком понимании приведе на на рис. 1 [5]. Д Индексирование (формирование ПОД) Д - документы 3 - запросы Поиск в массиве ПОД с адресами их хранения I Документы •[ (или их • микрокопии) II Потребители Индексирование (формирование ПОЗ) Рис. 1 в дальнейшем в соответствии с рассмотренным выделением в ИПС абстрактного и конкретного уровней и с учетом особенно стей хранения документальной информации (библиотеки, архи вы и другие хранилища) процедуру информационного поиска до- 288 кументальной информации было предложено разделить на два контура [4]: 1) семантическое осмысление запроса и выдача адресов (шиф ров, кодов), соответствующих запросу документов; на рис. 1 этот контур показан сплошными линиями; 2) отыскание самих документов (вручную или с помощью спе циализированных технических средств, если ими оборудовано хранилище); на рис. 1 - штриховые линии. Второй контур связан с разработкой специализированных технических средств хранения больших массивов документов и работой по переоборудованию хранилищ, а собственно пробле мы информационного поиска решаются в первом контуре. С учетом рассмотренного первый контур ИПС состоит из трех основных блоков: информационно-поискового языка, системы перевода (индексирования) на этот язык и логики, обеспечиваю щей поиск, которые, в свою очередь, могут быть детализирова ны и реализованы разными способами (рис. 2). ИПС ИПЯ Система индексирования Логика I Алфавит Словарь Грамматика Морфология Синтаксис Базисные (парадигма тические) отношения Тезаурус Критерии выдачи Текстуальные (синтагматические) отношения Рис.2 Представление ИПС в виде двух контуров является в настоя щее время наиболее распространенным. В некоторых системах контуры могут быть совмещены, что имело место, например, при поиске в массивах стертурных пер фокарт типа Filmsort (микрокарты, выполненные на прозрачной подложке), в некоторых из первых документальных ИПС - на ди- амикрокартах Filmorex, диамикрокарта которой содержит зону 289 для п о д и зону для изображения одного кадра с микроизобра жением документа - письма, приказа, заявления и т.п.; Minicard, диамикрокарты которой содержат вместе с поисковым обра зом документа (ПОД) аэрофотоснимки, чертежи и т.д., представ ляющие собой документы, хранящиеся в таких ИПС, и др. [2]), в автоматизированных ИПС, содержащих тексты документов от носительно небольшого объема вместе с их адресами, и т.п. Напротив, иногда возникает необходимость выделять не два, а большее число контуров, что помогает организовать последо вательно углубленный анализ текстов документов. Такие вари анты реализуются, например, в документально-фактографичес ких системах нормативно-правовых и нормативно-методических документов. В принятой символической форме абстрактная ИПС (1-й кон тур) представляет собой совокупность ИПЯ {RL), правил (систе мы) индексирования (IND) и логики (LOG), включающей наряду с критериями смыслового соответствия базисные отношения: IPS = < RL, IND, LOG >. (4) c/ef
Ви переглядаєте статтю (реферат): «ИНФОРМАЦИОННО-ПОИСКОВАЯ СИСТЕМА» з дисципліни «Теорія систем і системний аналіз в управлінні організаціями»