Слайд №3 Каково сейчас положение дел в данной области? В настоящее время имеется много систем семантического анализа текстов и различных новостных агрегаторов. Слайд №4



бет4/5
Дата06.09.2023
өлшемі27.36 Kb.
#476780
түріРассказ
1   2   3   4   5
доклад-текст

СЛАЙД №12
Чтобы сохранить высокую точность определения тематической близости, свойственную алгоритму шинглов, и при этом сократить длительность его работы без сокращения числа сравнений, авторы распараллеливают сравнение значений хеш-функций и нахождение тематически близких текстов.
В алгоритме шинглов основную вычислительную нагрузку несет вычисление кеша. В результате экспериментальной оценки работы алгоритма с помощью четырех разных реализаций, для каждой из них была получена сводная таблица с оценкой времени вычислений. Число итераций можно рассматривать как число анализируемых новостных текстов.
Давайте рассмотрим результаты тестирование разработанных авторами статьи и программно-реализованных алгоритмов шинглов, которые используют разные технологии распараллеливания.
Первый способ – реализация алгоритма шинглов с использованием технологий CUDA и Open CL.
Второй способ – реализация алгоритма шинглов с использованием технологий Google App Engine.
СЛАЙД №13 – №14
Отметим, что тестирование производилось на устройстве с процессором Intel core i5 3.0 GHz, и видеокартой (Cuda) – NVIDIA GeForce GTX 650Ti 2GB и OpenCL AMD Radeon 7870 2GB
По сравнению с последовательным алгоритмом, для параллельной реализации алгоритма шинглов с использованием технологии Cuda (вторая кривая снизу) среднее ускорение составило 5.10, а с применением технологии OpenCL (первая кривая снизу) – 10.12. При этом параллельно выполнялся только подсчет и сравнение хешей, а нормализация текста проводилась последовательно. OpenCL превосходит CUDA в 1.93 раза, что в данном случае объясняется тем, что тестируемая с OpenCL видеокарта незначительно превосходит своего конкурента по вычислительной мощности.
СЛАЙД №15
Тестирование работы программы проводилось на 30 текстах размером от 46 до 50 Кб. В тестовой выборке содержалось по 10 текстов на 3 новостных темы. Сначала запускалась программа Google App Engine, затем локально. Время разделения текстов по 3-м тематикам приведено в таблице на слайде.
Таким образом, за счет введения распараллеливания процессов обработки можно существенно увеличить скорость объединения новостных текстов в тематические кластеры. Google App Engine позволяет достичь ускорения порядка 1.2 раза по сравнению с локальным запуском приложения с последовательным выполнением процессов.
Далее для каждого такого кластера осуществляется выделение ключевых фраз и слов, которые используются для построения визуального представления новости.



Достарыңызбен бөлісу:
1   2   3   4   5




©dereksiz.org 2024
әкімшілігінің қараңыз

    Басты бет