на сайт факультета информатики ТГУ
на сайт Томского государственного университета
  


НАЧАЛО БИБЛИОТЕКА ДИПЛОМНЫЕ РАБОТЫ

     ДИПЛОМНЫЕ РАБОТЫ



Разин В.В.

Разработка и реализация модуля полуавтоматического аннотирования текстовых документов на естественном русском языке для семантических систем управления знаниями - Томск: Томск. гос. ун-т. Факультет информатики, 2010.- 42 с.

http://www.inf.tsu.ru/library/DiplomaWorks/CompScience/2010/Razin/diplom.pdf

Цель работы: разработка и реализация модуля полуавтоматического семантического аннотирования текстовых документов на естественном русском языке для семантических систем управления знаниями.

Результаты работы: разработан программный комплекс, позволяющий формировать семантическое метаописание текстового документа на естественном русском языке в терминах онтологической модели некоторой предметной области в форме набора RDF-триплетов. Разработана и реализована мера оценки релевантности метаданных документа, основанная на мере TF-IDF и данных о семантической связи элементов метаданных, упомянутой в тексте. Разработаны схемы хранения метаданных: с применением реляционной базы данных либо онтологии.

Область применения: использование в качестве компонента для формирования семантических метаописаний текстовых документов в системах управления знаниями, использующих онтологические базы знаний.

Прогноз о развитии исследования: система нуждается в разработке средств эффективной обработки синонимических групп, а также кореферентных (ссылочных) сущностей, встречающихся в тексте.

Текст PDF
Объем 6293 Кбайт

Copyright © 2010 Факультет информатики Томского государственного университета  
  Служба сервера