Слайды и текст доклада
Pic.1
Кластерная индексация файлов для оптимизации поиска информации в распределенной файловой системе Кушвид Евгений Сергеевич ст. гр. СШИм-15-1
Pic.2
Актуальность: Высокие темпы роста объема текстовой информации Накопление неклассифицированных данных в распределенной структуре Отсутствие возможности оптимального смыслового определения архитектуры …
Pic.3
Цель: Целью работы является разработка метода эффективного поиска текстовой информации в распределенной файловой системе с высокой производительностью и качеством при малых ресурсных затратах …
Pic.5
Выборка: Иерархическая структурированная библиотека открытая для скачивания объемом 21гб
Pic.6
Сбор и очистка данных:
Pic.7
Формирование входного вектора для кластеризатора
Pic.8
Существующие подходы к кластеризации:
Pic.9
Существующие подходы к индексации
Pic.10
Обоснование выбранного решение: Устойчивость к шумам Скорость Точность Адаптивность Отсутствие необходимости в эвристиках
Pic.11
Формирование структуры кластеров
Pic.12
Индексация Каждому кластеру присваивается уникальный индекс в порядке вложенности Пределом кластеризации является сведение к один кластер это один файл и таким образом можно определить вложенность …
Pic.13
Пример иерархической индексированной кластерной структуры файлов
Pic.14
Пример вида метаинформации в документе
Pic.15
Пример сохраненной метаинформации в текстовом файле
Pic.18
Визуальный интерфейс
Pic.20
Расширение поискового запроса
Pic.22
Анализ эффективности:
Pic.23
Сравнительная характеристика алгоритмов поиска
Скачать презентацию
Если вам понравился сайт и размещенные на нем материалы, пожалуйста, не забывайте поделиться этой страничкой в социальных сетях и с друзьями! Спасибо!