на сайт факультета информатики ТГУ
на сайт Томского государственного университета
  


НАЧАЛО БИБЛИОТЕКА ДИПЛОМНЫЕ РАБОТЫ

     ДИПЛОМНЫЕ РАБОТЫ



Бормашов Д.А.

Кластерный анализ текстов - Томск: Томск. гос. ун-т. Факультет информатики, 2006.- 43 с.

http://www.inf.tsu.ru/library/DiplomaWorks/CompScience/2006/bormashov/diplom.pdf

    Объект исследования: Текстовые данные.
    Цель работы: Создание программного инструментария для кластеризации текстов на основе частотных характеристик признаков стиля, заданных пользователем.
    Метод исследования: Теоретический и экспериментальный (на ЭВМ)
    Полученные результаты и новизна: Решена задача кластеризации текстов по частотным признакам с использованием гипергеометрического критерия и критерия хи-квадрат. Создан программный инструментарий, реализующий возможность кластеризации текстов по заданному признаку или группам признаков, с последующей визуализацией результатов в виде деревьев кластеризации – дендрограмм, и оценкой качества кластеризации.

Текст PDF
Объем 998 Кбайт
Copyright © 2010 Факультет информатики Томского государственного университета  
  Служба сервера