СЛАЙД №16
В основе построение новостных текстов заложен принцип «перевернутой пирамиды», который требует размещения основной информации в самом начале материала и последующее ее раскрытие далее по тексту в деталях. По факту, для содержимого новости работает формула, закон «пять W и одно H»
Оптимальным в силу особенностей построение и удобства визуального представления новости является использование графового метода. В комбинации с графовым методом авторами статьи также разработан собственный алгоритм подсчета веса ключевых слов.
СЛАЙД №17
Алгоритм заключается в поиске ключевых предложений (для установления повышающего коэффициента для сущностей из этого предложения) и далее нахождении в цикле ключевых слов из всех выделенных сущностей. Кандидатами в ключевые слова добавляются уникальные слова. Также в кандидаты добавляются слова, которые не удалось определить при помощи морфологического словаря, и слова-сущности в именительном падеже. Пороговое значение относительной частоты для отнесения сущности к ключевым словам экспериментально установлено равным 0,2 х количество сущностей.
СЛАЙД №18
На данном слайде представлен скриншот главного окна разработанной программы, осуществляющей комплексный анализ новостного текста и его визуализацию. Для выбранной с новостного сайта статьи на основе алгоритма определения ключевых сущностей и предложений строится ее аннотация.
СЛАЙД №19
Выводы со слайда
Достарыңызбен бөлісу: |