Абай институтының хабаршысы. № 2(8) 2011
93
на жестком диске вручную или с помощью
программы докачки.
d) Все основные поисковые системы имеют
т.н. "stop lists", т.е. списки сверхчастотных слов
(the, and, is, to), которые не подлежат
индексации. Переводчика же зачастую интере-
суют особенности употребления выражений,
содержащих такие служебные слова. [53]
2) Профессиональные поисковые программы
предоставляют гораздо более широкий набор
функций, чем онлайновые поисковые системы:
поиск с заданным интервалом между клюю-
чевыми словами, варианты интерпретации
дефиса, многочисленные логические операторы
и маски, "нечеткий поиск" (fuzzy search),
одновременный поиск по нескольким корпусам
и проч.
3) Наличие корпуса на жестком диске,
естественно, не требует выхода в Интернет.
Переход от одного результата поиска к другому
также происходит на порядок быстрее, при этом
все
результаты
поиска
автоматически
подсвечиваются.
Технические рекомендации
1) Для формирования корпусов текстов
лучше всего использовать популярный оффлай-
новый браузер Teleport Pro. В тех случаях,
когда сайт не поддается автоматическому ска-
чиванию, интересующие вас материалы можно
загрузить вручную, используя программу
докачки ReGet или ее аналоги.
2) Для индексации и поиска информации
можно рекомендовать программу dtSearch (ее
полнофункциональную демо-версию можно
бесплатно скачать из Интернета: www.dtsearch.-
com/download.html). Программа поддерживает
все основные типы файлов (htm*, doc, txt (ANSI
и ASCII), xls), индексирует zip-архивы с
минимальной потерей скорости, может работать
с любыми языками на основе латиницы, с
кириллицей и греческими шрифтами. Платная
версия также поддерживает формат pdf.
Достарыңызбен бөлісу: |