Презентация Поиск информации. Борисов В. А. Красноармейский филиал ГОУ ВПО «Академия народного хозяйства при Правительстве РФ» Красноарме

Смотреть слайды в полном размере
Презентация Поиск информации. Борисов В. А. Красноармейский филиал ГОУ ВПО «Академия народного хозяйства при Правительстве РФ» Красноарме


Вашему вниманию предлагается презентация «Поиск информации. Борисов В. А. Красноармейский филиал ГОУ ВПО «Академия народного хозяйства при Правительстве РФ» Красноарме», с которой можно предварительно ознакомиться, просмотреть текст и слайды к ней, а так же, в случае, если она вам подходит - скачать файл для редактирования или печати.

Презентация содержит 22 слайда и доступна для скачивания в формате ppt. Размер скачиваемого файла: 309.50 KB

Просмотреть и скачать

Pic.1
Поиск информации. Борисов В. А. Красноармейский филиал ГОУ ВПО «Академия народного хозяйства при Пра
Поиск информации. Борисов В. А. Красноармейский филиал ГОУ ВПО «Академия народного хозяйства при Правительстве РФ» Красноармейск 2009 г.
Pic.2
Поиск информации Задача, которую человечество решает уже многие столетия.
Поиск информации Задача, которую человечество решает уже многие столетия.
Pic.3
Все найденные за много лет средства и приемы поиска информации доступны и эффективны и при поиске ин
Все найденные за много лет средства и приемы поиска информации доступны и эффективны и при поиске информации в Интернет.
Pic.4
“ПЕРТИНЕНТНЫЙ ДОКУМЕНТ” Слово “пертинентный” происходит от английского “pertinent”, что значит “отно
“ПЕРТИНЕНТНЫЙ ДОКУМЕНТ” Слово “пертинентный” происходит от английского “pertinent”, что значит “относящийся к делу, подходящий по сути”.
Pic.5
Цель информационного поиска Найти все пертинентные и только пертинентные документы (мы хотим найти “
Цель информационного поиска Найти все пертинентные и только пертинентные документы (мы хотим найти “только то, что хотим, и ничего больше”). Эта цель - идеальна и пока недостижима.
Pic.6
Для того, чтобы было с чем сравнивать, необходимо некоторое количество непертинентных документов. Эт
Для того, чтобы было с чем сравнивать, необходимо некоторое количество непертинентных документов. Эти документы называются - “ШУМ”.
Pic.7
Когда документов много, используется информационно-поисковая система (ИПС). В этом случае информацио
Когда документов много, используется информационно-поисковая система (ИПС). В этом случае информационная потребность должна быть выражена средствами, которые “понимает” ИПС - должен быть сформулирован ЗАПРОС.
Pic.8
РЕЛЕВАНТНОСТЬ Степень соответствия документа запросу.
РЕЛЕВАНТНОСТЬ Степень соответствия документа запросу.
Pic.9
Виды информационно поисковых систем
Виды информационно поисковых систем
Pic.10
Классификационные ИПС В классификационных ИПС используется иерархическая (древовидная) организация и
Классификационные ИПС В классификационных ИПС используется иерархическая (древовидная) организация информации, которая называется КЛАССИФИКАТОРОМ.
Pic.11
Разделы классификатора называются РУБРИКАМИ. Библиотечный аналог классификационной ИПС - систематиче
Разделы классификатора называются РУБРИКАМИ. Библиотечный аналог классификационной ИПС - систематический каталог.
Pic.12
Предметная ИПС Web-кольца Поиск названия нужного предмета своего интереса (предметом может быть и не
Предметная ИПС Web-кольца Поиск названия нужного предмета своего интереса (предметом может быть и нечто невещественное, например, индийская музыка), а с названием связаны списки соответствующих ресурсов Интернет.
Pic.13
Словарные ИПС Основная идея словарной ИПС - создать словарь из слов, встречающихся в документах Инте
Словарные ИПС Основная идея словарной ИПС - создать словарь из слов, встречающихся в документах Интернет, в котором при каждом слове будет храниться список документов, из которых взято данное слово.
Pic.14
Два основных алгоритма работы словарных ИПС: -с использованием ключевых слов, -с использованием деск
Два основных алгоритма работы словарных ИПС: -с использованием ключевых слов, -с использованием дескрипторов.
Pic.15
Использование ключевых слов Для оценки содержимого документа используются только те слова, которые в
Использование ключевых слов Для оценки содержимого документа используются только те слова, которые в нем встречаются, и по запросу ИПС сопоставляет слова из запроса со словами документа, определяя по количеству, расположению, весу слов из запроса в документе его релевантность.
Pic.16
Использование дескрипторов Индексируемые документы переводятся на некоторый дескрипторный информацио
Использование дескрипторов Индексируемые документы переводятся на некоторый дескрипторный информационный язык. Дескрипторный информационный язык, как и любой другой язык, состоит из алфавита (символов), слов, средств выражения парадигматических и синтагматических отношений между словами.
Pic.17
Ранжирование результатов поиска Все ИПС в настоящее время уделяют основное внимание именно алгоритму
Ранжирование результатов поиска Все ИПС в настоящее время уделяют основное внимание именно алгоритму ранжирования полученных ссылок.
Pic.18
Критерии при ранжировании в ИПС наличие слов из запроса в документе, их количество, близость к начал
Критерии при ранжировании в ИПС наличие слов из запроса в документе, их количество, близость к началу документа, близость друг к другу; наличие слов из запроса в заголовках и подзаголовках документов; количество ссылок на данный документ с других документов; «респектабельность» ссылающихся документов.
Pic.19
Современные проблемы поисковых систем Когда эти технологии разрабатывались никто из разработчиков не
Современные проблемы поисковых систем Когда эти технологии разрабатывались никто из разработчиков не представлял себе, что Интернет станет глобальной информационной средой.
Pic.20
Архитектура crawler (сборщик) - осуществляет сканирование Интернет ресурсов в поисках изменений на с
Архитектура crawler (сборщик) - осуществляет сканирование Интернет ресурсов в поисках изменений на страницах; indexer (индексатор) - индексирует ресурсы, строит базы данных по ключевым словам, хранит эти базы данных в виде, удобном для поиска по ним; gateway (шлюз) - осуществляет прием запросов от пользователей и выдачу им информации из базы данных.
Pic.21
Алгоритмы поиска и ранжирования Основной проблемой современных поисковых систем является то, что по
Алгоритмы поиска и ранжирования Основной проблемой современных поисковых систем является то, что по причине фактически устаревшей архитектуры они не могут обеспечить качественный поиск информации.
Pic.22
Основные моменты новой архитектуры ИПС Переход к распределенной модели вычислений; Переход от модели
Основные моменты новой архитектуры ИПС Переход к распределенной модели вычислений; Переход от модели «один поиск на всех» к модели персонального поиска; Переход от критериев релевантности к критерию пертинентности; Переход от поиска только текстовой информации к распознаванию и поиску мультимедийной информации.


Скачать презентацию

Если вам понравился сайт и размещенные на нем материалы, пожалуйста, не забывайте поделиться этой страничкой в социальных сетях и с друзьями! Спасибо!