Слайд №3 Каково сейчас положение дел в данной области? В настоящее время имеется много систем семантического анализа текстов и различных новостных агрегаторов. Слайд №4



бет5/5
Дата06.09.2023
өлшемі27.36 Kb.
#476780
түріРассказ
1   2   3   4   5
доклад-текст

СЛАЙД №16
В основе построение новостных текстов заложен принцип «перевернутой пирамиды», который требует размещения основной информации в самом начале материала и последующее ее раскрытие далее по тексту в деталях. По факту, для содержимого новости работает формула, закон «пять W и одно H»
Оптимальным в силу особенностей построение и удобства визуального представления новости является использование графового метода. В комбинации с графовым методом авторами статьи также разработан собственный алгоритм подсчета веса ключевых слов.
СЛАЙД №17
Алгоритм заключается в поиске ключевых предложений (для установления повышающего коэффициента для сущностей из этого предложения) и далее нахождении в цикле ключевых слов из всех выделенных сущностей. Кандидатами в ключевые слова добавляются уникальные слова. Также в кандидаты добавляются слова, которые не удалось определить при помощи морфологического словаря, и слова-сущности в именительном падеже. Пороговое значение относительной частоты для отнесения сущности к ключевым словам экспериментально установлено равным 0,2 х количество сущностей.
СЛАЙД №18
На данном слайде представлен скриншот главного окна разработанной программы, осуществляющей комплексный анализ новостного текста и его визуализацию. Для выбранной с новостного сайта статьи на основе алгоритма определения ключевых сущностей и предложений строится ее аннотация.
СЛАЙД №19
Выводы со слайда

Достарыңызбен бөлісу:
1   2   3   4   5




©dereksiz.org 2024
әкімшілігінің қараңыз

    Басты бет