ПРОБЛЕМЫ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА
Искусственный интеллект. ЭВМ – хранилище гигантских объемов информации. Информационные сети. Реферирование текстов. Смысловой анализ.
Машинный перевод. Слово : рисунок. Композиция : рисунок. Звуковое слово : рисунок. Ситуация : рисунок. Ввод и обработка звуковой информации. Компьютер = советник? помощник? конкурент? Языковые и неязыковые проблемы ИИ.
Проблемы ограничения на всех уровнях языка. Естественный язык как избыточная система. Проблемы сжатия языковой информации без потерь. Системокоды на уровне словаря и ситуации.
Машинные (формальные) словари. Достоинства и недостатки современных методов упаковки знаний в словаре. Машинные грамматики. Грамматические эталоны и проблемы омонимии и многозначности.
Машинный синтаксис. Проблема расширенных композиций с точки зрения структуры порождения текста и смысла. Проблема анализа и синтеза текста.
Экспертные системы. Диагностико-обучающие системы. Проблематика вопросно-ответных систем. Данные текста и данные картины мира у пользователя.
Языковая картина мира. Неединственность картин мира. Пересекаемость в системах. Поиск оптимального критерия.
Традиционные методы представления знаний на естественном языке. Декларативные и процедурные знания. Логические методы, семантические сети, фреймы, сценарии. Можно ли создать сценарий жизни индивида? Неоднозначный синтез предложений и текстов. (сборка на базе словаря словоформ по имеющимся отношениям единства и законам композиции). Выявление помех. Поиски нестандартных решений.
Связность текста. Проблемы семантических связей между композициями. Обнаружение связей и их формализация. Сложность картины мира в виде: персона = Иван Иванович Иванов = он = внук = сын = отец = муж = инженер = футболист = христианин = = водитель = курильщик =
друг = … со всеми вытекающими из персонификаций связями, признаками, действиями, обстоятельствами и т.п. Попытки формализовать этот мир и представить иные миры изоморфно.
Неоднозначный синтез композиций (предложений и текстов) при создании сценариев разных картин мира. Неоднородный синтез композиций (предложений) и текстов (на базе словаря словоформ по отношениям единства и законам композиции). Выяснение помех. Поиски стандартных и нестандартных решений.
КВАНТИТАТИВНАЯ ЛИНГВИСТИКА
Основные статистические категории: выборка и совокупность, типы переменных, их классификация применительно к соответствующему уровню лингвистического анализа. Частота и распределение частот встречаемости для больших и малых инвентарей.
Меры центральной тенденции и рассеяния.
Нормальное распределение. Выборочные статистики и параметры распределения: методы оценивания. Планирование статистического эксперимента и проверка гипотез. Параметрические критерии значимости.
Методы корреляционного анализа.
Прикладная часть: применение статистики в лингвистических исследованиях. Системная и прагматическая выборки лингвистических данных. Частоты: индивидуальная, частота класса, абсолютная, относительная, условная и позиционная.
Статистико–комбинаторные, дистрибутивно–статистические и дешифровочные методы в грамматике. Меры автономности грамматических структур и их семантики. Функциональная нагрузка грамматических категорий и маркированность.
Частотные словари, словари–индексы, машинные фонды лексики. Характеристики частотных словарей и индексы покрытия текста.
Оценки повторяемости отдельных элементов.
ПРИКЛАДНАЯ ЛЕКСИКОГРАФИЯ
Соотношение прикладной лексикографии с общей лексикологией и другими смежными дисциплинами. Задачи прикладной лексикографии. Теоретическое и методическое обеспечение разработок машинных словарей.
Существующие машинные словари. Принцип разделения подачи грамматической и семантической информации в машинных словарях. Соотношение морфемного, словообразовательного, словоизменительного и словосочетательного анализа лексических единиц в лингвистических процессорах.
Словарь словоформ, его достоинства и недостатки, принципы разработки. Моделирование полной парадигмы слова. Способы подачи омонимичных словоформ. Словарь типа «машинная основа + машинная флексия», его достоинства и недостатки, принципы разработки. Омонимия машинных основ и машинных флексий и способы ее снятия при анализе словоформы.
Системное тегирование (кодирование) морфологической информации на уровне словаря. Требования к тегам: полнота, минимальность, непересекаемость (однозначность), избыточность. Автоматизация тегирования парадигм слов при составлении словаря словоформ. Каноническая (начальная) форма слова.
Неполнота словарей (печатных и машинных) и ее причины. Распознавание незнакомых слов человеком. Возможные пути распознавания машиной слов, отсутствующих в словаре. Создание пользовательских словарей. Моделирование парадигмы незнакомого слова на основе симметрии финалей словоформ. Возможности вариантного моделирования парадигмы. Концепция матричного гнездового (словообразовательного) словаря как один из способов снятия неполноты словарей.
Семантические машинные словари. Типология толковых словарей 8 принципы лексикографического описания слов в традиционных и машинных словарях. Возможности сетевого и фреймового представления и использования лексико-семантической информации при моделировании семантики словаря и текста.
Автоматизация лексикографических работ. Разработка и реализация принципов построения автоматизированных текстовых лексикографических систем. Автоматизированное построение и использование конкордансов и словоуказателей в лексикографической работе. Автоматизированное построение, анализ и использование семейства частотных словарей – словоформ, лексем, лексико-семантические группы (ЛСГ) лексем, гиперлексем, синонимов, антонимов, семантических полей, лексико–грамматических групп, словообразовательных гнезд и т.п. Разработка лексического компонента лингвистического обеспечения автоматизированных информационно–поисковых систем.
Примеры машинных словарей и лексикографических систем. Словарь в системах естественно-языкового анализа и синтеза текстов, информационно–поисковых системах, системах машинного перевода. Одно– и многоязычные терминологические базы данных. Автоматические словари–консультанты и переводчики. Словари в автоматизированных системах обучения родному и иностранному языкам.
МАШИННЫЕ ГРАММАТИКИ
Методы выявления и обработки синтаксической структуры словосочетаний и предложений в системах МП и автоматического анализа ЕЯ-текстов. Локальный синтаксический анализ. Выделение именных групп в структуре предложения. Принципы контекстно-свободной грамматики (Context Free Grammar).
Универсальные алгоритмы многовариантного синтаксического анализа по непосредственно составляющим: последовательный восходящий анализ; последовательный нисходящий анализ; параллельный восходящий анализ; параллельный нисходящий анализ.
Методы синтаксического анализа, опирающиеся на грамматику зависимостей: одновариантные алгоритмы анализа структуры синтаксических зависимостей; многовариантные алгоритмы построения структуры синтаксических зависимостей по методу фильтров.
Понятие и структура «признака» в обобщенной грамматике составляющих (Generalized Phrase Structure Grammar). Представление структуры предложения в рамках лексико–функциональной грамматики (Lexical Functional Grammar).
Возможности учета семантических аспектов естественного языка при синтаксическом анализе текста (предложения). Синтаксическая семантика и ее описание с помощью формальных методов. Концепция «глубинных» падежей Ч. Филлмора и В.В. Бондарко. Трансформационная грамматика. Модели управления глаголов и алгоритмы выделения глагольных групп в структуре предложения в грамматике зависимостей, непосредственно составляющих и контекстно-свободной грамматике.
Проблема синтеза связного осмысленного текста на заданную тему в системах ИИ.
Принципы организации лингвистической информации и процедур ее обработки в современных системах МП.
ОМОНИМИЯ КАК СИСТЕМА
Концептуальное поле омонимии. Системы поведенческого акта и концептуального поля омонимии. Системная методологическая, языковая концептуальная и моделирующая компоненты и их взаимосвязь.
Межпарадигматическая омонимия трех родов. Род, одушевленность и омонимия. Комбинированная омонимия.
Система преобразований. Изменения в системе языка и изменения в системе омонимии.
Формальная система омонимии. Место омонимии в языке-системе. Структурно–морфологическая сторона омонимии. Система структурной омонимии. Общая классификация омонимов в письменных и устных текстах.
Обобщение омонимии существительных. Комбинированная грамматическая омонимия. Классификация существительных по 3-м базовым признакам (падеж, род, число) и разнообразие (внутрипарадигматическая/ межпарадигматическая, внутрикатегориальная/ межкатегориальная, однокорневая/ разнокорневая) омонимии в соответствии с теоретической полнотой и непротиворечивостью.
Обобщение внутрисистемной языковой омонимии (внутриклассовой и межклассовой омонимии). При множественности классов - множественность категориально–позиционных значений и форм их выражения (несколько десятков грамматических позиций - лица, числа, падежа, рода, времени, вида и т.п.), множественность корневых гнезд и словообразовательных матриц. При множественности указанных типов может возникать и возникает омонимия. Омофакторы.
Межъязыковая омонимия (межсистемная). Если в одной языковой системе существует омонимия, а в другой системе того же рода также существует омонимия, то и между системами должна существовать межъязыковая, или межсистемная, омонимия.
Пересечение/ непересечение семантик в аббревиатурах. Омонимия аббревиатур и степень совпадения семантик элементов, составляющих аббревиатурное слово. Пересечение/ непересечение структурных элементов моделей сжатия. Представление синтаксической омонимии моделей на кубе. Качественный анализ омонимии аббревиатур.
Омонимия ядерных и расширенных моделей. Омонимия аббревиатур в рамках модели на кубе. Снятие омонимии в речи и на письме. Помехи, которые создает омонимия при автоматическом переводе, и возможные пути их устранения.
КОРПУСНАЯ ЛИНГВИСТИКА
Языковой материал в лингвистическом исследовании. Новые информационные технологии сбора лингвистического материала. Исходные понятия корпусной лингвистики: проблемная область, корпус данных, корпус текстов, параллельный многоязычный корпус текстов. Динамические и статические корпусы текстов. Требования к корпусу текстов: репрезентативность, экономичность, полнота. Аннотированные корпусы текстов, автоматизация их создания и коррекции. Программное обеспечение корпусной лингвистики. Опыт разработки корпусов текстов в Беларуси и за рубежом.
СПИСОК ЛИТЕРАТУРЫ
Автоматизация подготовки словарей. – М., 1988.
Алексеев П.М. Семантические частотные словари // Статистика речи и автоматический анализ текста. – Л., 1973.
Алексеев П.М. Статистическая лексикография. – Л., 1980.
Алексеев П.М. Частотные словари английского языка и их практическое применение // Статистика речи и автоматический анализ текста. – Л., 1971.
Апресян Ю.Д. и. др. Лингвистическое обеспечение системы ЭТАП-2. – М., 1989.
Апресян Ю.Д. Толковый словарь и интегральное описание языка // ВЯ, 1986, № 5.
Арапов М.В. Квантитативная лингвистика. – М., 1988.
Арапов М.В., Херц М.М. Математические методы в исторической лингвистике – М., 1975
Ахманова О.С. Словарь омонимов русского языка. – М., 1986.
Баранов А.Н. Автоматизация лингвистических исследований: корпус текстов как лингвистическая проблема // Русистика сегодня. 1998. № 1 – 2, с. 179 – 191.
Баранов А.Н. Введение в прикладную лингвистику. – М., 2001.
Баранов А.Н. Фреймы и сценарии. Категории искусственного интеллекта в лингвистической семантике. – М., 1987.
Баранов А.Н., Кобозева И.М. Метаязыковые средства описания семантики предложения: опыт типологии // Лингвистическое обеспечение информационных систем. – М., 1987.
Баранов А.Н., Сергеев В.М. Искусственный интеллект и традиционные методы анализа текста // Когнитивные исследования за рубежом. – М., 1990.
Борода М.Г., Поликарпов А.А. Закон Ципфа – Мандельброта и единицы различных уровней организации текста // УЗ Тартуского гос. ун-та. Вып. 689. (Квантитативная лингвистика и автоматический анализ текстов.) – Тарту, 1984.
Виноград. Т. Программа, понимающая естественный язык. – М., 1976.
Герд А.С. Специальные словари и их источники // Современная русская лексикография: 1981.– Л., 1983.
Герд А.С., Богданов В.В., Роменская В.Ф. и др. Информационно-поисковый тезаурус как объект лексикографии // Структурная и прикладная лингвистика. Вып. 1. – Л., 1978.
Гиндин С.И. Частота слова и его значимость в системе языка // Труды по лингвостатистике. УЗ Тартуского ун-та. Вып. 628. – Тарту, 1982.
Головин В.Н. Язык и статистика. – М., 1971.
Головня А.И. Омонимия как системная категория языка: Дис. … канд. Фил. Наук:10.02.19. // Бгу. – Минск, 1996.
Гомон Д.Н. Системные проблемы лексической омонимии: Дис. … канд. фил. наук:10.02.19. // БГУ. – Минск, 2004
Городецкий Б.Ю. Проблемы и методы современной лексикографии // НЗЛ. Вып. XIV. – М., 1985.
Городецкий Б.Ю. Актуальные проблемы прикладной лингвистики // НЗЛ. Вып. XII. – М., 1983.
Грязнухина Т.А. и др. Использование ЭВМ в лингвистических исследованиях. – Киев, 1990.
Денисов П.Н. Лексика русского языка и принципы ее описания. Изд. 2-е. – М., 1993.
Жолковский А.К. О правилах семантического анализа // Машинный перевод и прикладная лингвистика. Вып. 8. – М., 1964.
Жолковский А.К., Мельчук И.А. О семантическом синтезе // Проблемы кибернетики. Вып. 19. – М., 1967.]
Жолковский А.К., Леонтьева Н.И., Мартемьянов Ю.С. О принципиальном использовании смысла при машинном переводе // Машинный перевод. – М., 1961.
Задорожный М.И. О границах полисемии и омонимии. – М., 1971.
Звегинцев В.А. Теоретическая и прикладная лингвистика. – М., 1968.
Златоустова Л.В. и др. Актуальные проблемы прикладной лингвистики // Вестник МГУ. Сер. 9. Филология. 1989, № 5.
Зубов А.В. Обработка на ЭВМ текстов естественных языков. – Минск, 1977.
Зубов А.В., Зубова И.И. Основы лингвистической информатики. Часть 2. Компьютерная лингвистика, Минск, 1992, Часть 3. Искусственный интеллект. – Минск, 1993.
Зубов А.В., Чапля А.И., Чапля С.В. Автоматическое выделение ключевых слов // Структурная и прикладная лингвистика. Вып. 1. – Л., 1983.
Искусственный интеллект. (В 3-х кн.) Кн. 1. Системы общения и экспертные системы.. Кн. 2. Модели и методы. – М., 1990.
Караулов Ю.Н. Лингвистическое конструирование и тезаурус литературного языка.– М., 1981.
Караулов Ю.Н. Общая и русская идеография. – М., 1976.
Каримова Г.О., Поликарпов А.А. Принципы выделения гиперлексемы как единицы лексической системы языка // Деривационные гнезда и типы в синхронии и диахронии. – Владивосток, 1989.
Карпов В.А. Язык как система. Минск, 1992; М., 2003.
Катц Дж. Дж. Семантическая теория // НЗЛ. Вып. X. – М., 1981.
Кибрик А.Е. Очерки по общим и прикладным вопросам языкознания. – М., 1992.
Колесников Н.П. Словарь омонимов русского языка. – Тбилиси, 1978.
Колодяжная Л.И., Поликарпов А.А. Исследование системных характеристик лексики на основе компьютерной версии синонимического словаря // Труды машинного фонда русского языка. Т. 2. – М., 1992.
Кондратьева В.А. Оптимизация усвоения лексики иностранного языка. – М., 1974.
Кулагина О.С. Исследования по машинному переводу. – М., 1979.
Кулагина О.С., Мельчук И.А. Автоматический перевод: краткая история, современное состояние, возможные перспективы // Автоматический перевод. – М., 1971.
Лакофф Дж. Мышление в зеркале классификаторов // НЗЛ. Вып. XXIII. Когнитивные аспекты языка. – М., 1988.
Лекомцев Ю.К. Введение в формальный язык лингвистики. М., 1983.
Ленерт В., Дайер М.-Г., Джонсон П.Н., Янг К. Дж., Харли С. BORIS – экспериментальная система глубинного понимания повествовательных текстов // НЗЛ. Вып. XXIV. Компьютерная лингвистика. – М., 1989.
Мальковский М.Г. Диалог с системой искусственного интеллекта. – М., 1985.
Мандельброт В. Теория информации и психолингвистика: теория частот слов // Математические методы в социальных науках. – М., 19㜷3.
Мартынов В.В. Универсальный семантический код: УСК-3. – Минск, 1984.
Марусенко М.А. О формировании словника словаря статистически устойчивых научно-технических терминов // Структурная и прикладная лингвистика. Вып. 2. – Л., 1983.
Марчук Ю.Н. Проблемы машинного перевода. – М., 1983.
Машинный фонд русского языка: идеи и суждения. – М., 1986.
Мельников Г.П. Системология и языковые аспекты кибернетики. – М., 1978.
Минский М. Структура для представления знаний // Психология машинного зрения. – М., 1978.
Михайлов М.Н. Компьютерное обеспечение корпуса текстов (взгляд пользователя) // Русистика сегодня. 1998. № 1 – 2, с. 192 – 201.
Модина Л.С., Шаляпина 3.М. Принципы организации лингвистических знаний в объектно-ориентированной модели лексико-морфологической системы японского языка // DIALOG '95. Труды Международного семинара по компьютерной лингвистике и ее приложениям. – Казань, 1995.
Нагао П., Цудзии Дз., Накамура Дз. Машинный перевод с японского языка на английский // Труды Института инженеров по электронике и радиотехнике. Тематический выпуск. Обработка естественных языков. Т. 74, № 7, июль 1986.
Новое в зарубежной лингвистике. Вып. X. Лексическая семантика. – М., 1981.
Новое в зарубежной лингвистике. Вып. XII. Прикладная лингвистика– М., 1983.
Новое в зарубежной лингвистике. Вып. XXIV. Компьютерная лингвистика. – М., 1989.
Обработка знаний. – М.: Мир, 1989.
Олкер X.Р. Волшебные сказки, трагедии, и способы изложения мировой истории // Язык и моделирование социального взаимодействия. – М., 1987.
Павиленис Р.И. Проблема смысла. – М., 1983.
Падучева Е.В. О способах представления синтаксической структуры предложения // ВЯ, 1964, № 2.
Панов Д.Ю. И.К. Бельская и ее исследования по алгоритму автоматического лингвистического анализа // И.К. Бельская. Язык человека и машина. – М., 1969.
Пешковский А.М. 10 тысяч звуков // Пешковский А. М. Избранные труды. – М., 1969.
Пиотровский Р.Г. Инженерная лингвистика и теория языка. – Л., 1979.
Поликарпов А.А. Полисемия: системно-квантитативные аспекты // УЗ Тартуского гос. ун-та. Вып. 774. – Тарту, 1987.
Поликарпов А.А. Теоретические проблемы прикладной лексикологии // Вестник МГУ. Сер. 9. Филология. 1989. № 5.
Поликарпов А.А., Курлов В.Я. Стилистика, семантика, грамматика: опыт анализа системных взаимосвязей (По данным толков. словаря) // ВЯ, 1994, № 1.
Поликарпов А.А., Бушуева О.В. Опыт построения контекстуального словаря и анализ его устройства // Теоретические и практические проблемы прикладной лингвистики. – М., 1988.
Поликарпов А.А. Проблемы и перспективы автоматизации лексикологического и лексикографического анализа с помощью ЭВМ // Использование ЭВМ в лингвистических исследованиях. – Киев, 1989.
Попов Э.В. Общение с ЭВМ на естественном языке. – М., 1982.
Представление и использование знаний. – М., 1989.
Пропп В.Я. Морфология сказки. – М., 1969.
Ревзин И.И. Структура языка как моделирующей системы. – М., 1979.
Ревзин И.И., Розенцвейг В.Ю. Основы общего и машинного перевода. – М., 1964.
Сахарный Л.В. Частотный словарь индексирования. – Пермь, 1974.
Слокум Дж. Обзор разработок по машинному переводу: история вопроса, современное состояние и перспективы развития // НЗЛ. Вып. XXIV. – М., 1989.
Субботин М.М. Гипертекст. Новая форма письменной коммуникации. // Итоги науки и техники. Сер. Информатика. Т. 18. – М., 1994.
Субботин М.М. Новая информационная технология: создание и обработка гипертекстов // НТИ. Сер. 2. 1988, № 5.
Сухотин В.В. Исследование грамматики числовыми методами. – М., 1990.
Труды Института инженеров по электронике и радиотехнике. Тематический выпуск. Обработка естественных языков. Т. 74, № 7. – М., 1986.
Фрэнсис У.Н. Проблемы формирования и машинного представления большого корпуса текстов // НЗЛ. Вып. XIV. Проблемы и методы лексикографии. – М., 1983.
Когнитивные аспекты языка. – М., 1988.
Цейтин Г.С., Откупщикова М.И., Лейкина Б.М., Невлева Т.М. Система анализа текста с процедурным представлением словарной информации // Актуальные вопросы практической реализации систем АП. Часть 1. – М., 1982.
Шайкевич АЯ. Дистрибутивно-статистический анализ в семантике // Принципы и методы семантических исследований. – М., 1976.
Шаляпина З. М. Текст как объект автоматического перевода. – М., 1988.
Шенк Р. Обработка концептуальной информации. – М., 1980.
Шенк Р., Лебовиц М., Бирнбаум Л. Интегральная понимающая система // НЗЛ. Вып. XII. – М., 1983.
Щерба Л.В. Опыт общей теории лексикографии // Щерба Л. В. Языковая система и речевая деятельность. – Л., 1974.
ФИЛОСОФСКО-КОГНИТИВНАЯ БАЗА ИНТЕЛЛЕКТУАЛЬНЫХ КОМПЬЮТЕРНЫХ СИСТЕМ
ФИЛОСОФИЯ ЯЗЫКА
Мозг как универсальное отражательное устройство. Опережающее отражение действительности. Функциональный подход. Поведенческий акт как система. Математическая модель условного рефлекса на базе исходных признаков - цель, средство, действие = результат. Язык как элемент модели системы "средство". Математическая модель мышления.
Объект анализа – язык. Ф. Соссюр, К.–Л. Бюлер о языке. Неданность языка как объекта. Деятельностный подход. Аксиоматика цепочки "человек – деятельность – процесс – невозможность анализировать процесс с точки зрения системности – продукт (результат) в виде множества текстов – анализ текстов и вывод системы языка". Снятие антиномии "язык : речь". Насколько системен продукт – настолько системна речемыслительная деятельность.
Методы анализа языка. Системный подход. Общая теория систем по Ю.А. Урманцеву (ОТСУ) как общая методология. Системные цели, системные средства, системные действия – системные результаты. Унификация терминологии. Изоморфизм знаний. Единство мира и единство науки о мире.
Объект–система и система объектов одного и того же и разных родов. Статика и динамика систем. Симметрия как сохранение, совпадение признаков. Асимметрия – предел несохранения. Диссимметрия – частичное совпадение при несовпадениях. Обоснование лингвистической точечной, линейной и точечно–линейной симметрии, их антиподов. Симметро–асимметрийные уровни анализа.
Рефлексивность, симметричность и транзитивность на разных языковых уровнях как исходные системные характеристики, их формализм. Теоретико–множественный характер лингвистического универсума на разных уровнях членения. Сочетания, размещения и перестановки.
Изоморфизм и полиморфизм языковых объектов. Изо-полиморфизм как база для системного кодирования и создания базы знаний.
Словообразование, словоизменение и текстопорождение как направленные и ненаправленные изменения в системе. Направленно-ненаправленный характер эволюции языка.
Конвергенция и дивергенция на уровне словообразования и словоизменения. Проблема кодирования омонимов. Энмерные кубы и матричные представления лексики и возможность их системного кодирования. Треугольник Паскаля как структура точного исчисления сходств и различий объектов.
Взаимодействия и взаимонедействия по Ю.А. Урманцеву. Взаимосодействия по П.К. Анохину. Отраженный характер лингвистических взаимодействий. Экстралингвистические факторы.
Прикладной аспект симметризации–асимметризации в экспертных системах, системах искусственного интеллекта и обучающих системах.
Понятие лингвистического универсума как предельно достижимого множества однородных текстов. Понятие множества. Неполнота лингвистического универсума.
Случайность/детерминированность элементов и связей как основа периодических систем. Ярусы языка. Иерархо–неиерархические системы, их автономность и переходы.
Лингвосимметрика – симметрия, асимметрия, диссимметрия как база для вывода множеств "первичных" элементов. Классификация первичных элементов. Вывод частей речи и групп изменения. Родство через симметрию. Форма и содержание.
Синхрония/диахрония/панхрония в симметрично-асимметричном представлении. Сжатие в системе. Сорбция. Аббревиация. Словосложение. Композиты. Цикличность действия закона сжатия. Транзитивность. Номинация как система.
Квазисимметрия (омонимия) и ее не лингвистический, а системный характер - многогранники и кристаллы. Многозначность как многослойная симметрия формы и асимметрия значений. Антонимия как система. Измеримость антонимии. Синонимия как система. Эвфемизмы.
Гомологические ряды в биологии и в лингвистике. Системный изоморфизм на уровне первичных элементов. Уровни гомологии: словоизменение, словообразование, словосложение, композиты, тексты (пародии). Ассоциативные словари. Конвергенция и дивергенция. Треугольник Паскаля как симметрично-асимметричная система схождений и расхождений.
Системы с точки зрения признаков "вход" : "выход". Кибернетический характер языка=системы. Словообразование, создание новых по наполнению композиций - вход. Архаизмы, историзмы как выход. Заимствования как выход и вход. Изоморфизм систем со входом и выходом.
Метафора как система. Метафоричность человеческого мышления. Метафора в физике, биологии, математике. Антропоцентризм и его следствия. Формализация метафоры.
Отражение в языке действительности разного рода (субъект, действие, объект, продукт, инструмент, место, адресат) через части речи (субституция и реализация), через грамматические позиции. Взаимонедействия и их отражение в языке. Небытийная лингвистика.
Отношения единства первичных элементов как системообразующий фактор. Ядерная композиция первичных элементов. Классификация ядерных композиций по отношениям единства. Отношения единства как код, группа, трансформационные операции. Разрешения и запреты. Изоморфизм с генетикой.
3акон композиции как декартово произведение. Снятие двойственности и неопределенности законами композиции. Синтетические, аналитические и синтетико-аналитические композиции.
Ядерная композиция и законы ее расширения. Пик встречаемости расширенных композиций. Пределы памяти (7 плюс/минус 2).
RZ-системы. Языковые рефлексивность, симметричность и транзитивность. Лингвистические сочетания, размещения и перестановки. Системный изоморфизм.
Вывод модусов, моделей и модификаций на ядерном уровне Лингвистические и экстралингвистические факторы отражения. Ситуативность = модификация. Обобщение ситуаций - логика = модели ситуаций. Обобщение обобщений = философии = модусы.
Тождественные, количественные, качественные и относительные преобразования. Их комбинаторика. Групповой характер преобразований. Операторика и алгоритмика.
Порядок слов в ядерной и расширенных композициях. Изомерия в химии, физике, биологии. Языковая изомерия, ее уровни. Понятие левизны/ правизны / лево–правизны. Системный изоморфизм.
Семантика возможных миров. Истинность и ложность. Неединственность критериев смысла. Логика и язык, их соотношения. Модели могут быть равны, содержание различно. Включенность логики в язык и ее специфика. Логика условий.
Симметрия / асимметрия / диссимметрия и информация. Вероятностные модели с переменными. Системный изоморфизм.
Асимметризация систем и приращение информации. Изоморфизм уровней информации. Повторяемость элементов и структур.
Понятие языковой нормы, его нечеткость. Норма и ее нарушение, системный характер отклонений. Кодифицированный и некодифицированный языки. Идиолект. Предметные разновидности текстов (художественные – проза, поэзия; деловая проза, научная проза).
Фразеологизация синтаксиса. Устойчивость и идиоматичность. Причины. Асимметризация фразеологизмов и связь со структурными моделями предложений и словосочетаний.
Закон композиции как лингвистическое взаимодействие, отражающее взаимодействие / взаимонедействие объектов материального мира.
Закон композиции как упаковка информации о мире. Номинативные упаковки. Функциональные упаковки. Одномерные и многомерные упаковки. Увеличение длины упаковки и усложнение структуры как снятие энтропии сообщения. Простота и сложность. Глубина познания и отражения мира через упаковку. Параметры. Формульное представление лексики любого языка.
Текст как суперинформационная творческая структура. Лингвистическо-нелингвистический аспекты текста как системы. Белковые цепочки как тексты без пробелов.
ОТСУ как база для создания общей теории языка. Неспецифичность для любых объектов-систем признаков U, А, М, R, Z. Функции языка=системы: отражательная, номинативная (имена, названия, комплексы; действия, процессы; признаки; субституты; количества; служебные слова; знаки). Эмоциональность номинации. Моделирующая (генерирующая). Кодирующая/ декодирующая. Эвристическая (творческая). Коммуникативное намерение и человек. Волюнтативная, социативная, апеллятивная.
Язык ребенка и взрослого. Общность и специфика. Встроенность языка=системы в человека. Невозможность иметь язык вне общества. Гипотезы о происхождении языка.
Знание и понимание с точки зрения человека, животного, машины. Думают ли животные? Будут ли думать машины? Принятие решений и экспертизация.
Генезис языка человека и языка животных. Изоморфизм и специфика систем отражения. Системная модель русского языка. Адаптация как система.
Языкознание. Когнитология. Нейролингвистика. Компьютерная лингвистика. Естественный и искусственный интеллект.
ЯЗЫК КАК СИСТЕМА
Деятельностный и функциональный подходы. Системный подход и его приложение к языку. Лингвосимметрика как метаязык представления и получения знаний.
Наиболее важные антиномии – язык : речь; фонема : буква; левый : правый порядок слов. Способы разрешения антиномий. Математизация языковых представлений – основа доказательности гипотез. Роль слова, формулы и числа. Теории – теоремы – термины.
Лингвистические банки данных и Машинный фонд русского языка. Возможности компьютеризации обучения. Теории и метатеории. Гёделизация в науке. Пути ее преодоления. Смена научных парадигм (Т. Кун).
Структуры текстов: проза, поэзия, деловая проза, фольклор, бытовой диалог. Их общность и специфика, дифференциация стилей – стабилитет, варьетет, специалитет.
Глобальность разрешающих способностей принципов симметрии/ асимметрии. Их универсальные возможности и реализации в различных предметных областях от физики до лингвистики. Системный изоморфизм/полиморфизм. Языковая изомерия. Языковые гомологии. Языковые аддитивность и неаддитивность.
Системные структуры представления знаний о языке. Кубы, суперкубы, декартовы матрицы. Вероятностные модели. Системокоды (грамматические и семантические).
Внешний отражаемый мир как система и эта система в системе отражения – языке. Неполнота языка=системы на разных уровнях и неполнота коллективной картины мира, мозаичность. Моделирование знаний.
Три формы существования материи - вещество, энергия, информация. Периодика цивилизации: освоение вещества, создание материального производства, овладение принципом единства материи (от становления человека до наших дней); освоение энергии, создание энергетического изобилия, передача энергии на расстояние, овладение принципом единства энергии и ее связи с веществом (18 – 21 вв.); освоение информации языковой (зарождение и эволюция языков), освоение информации как информации, передача информации на расстояние, овладение принципом единства процессов обработки информации в естественных и искусственных системах.
Отражение как процесс и результат. Отражательные системы. Память = система-хранилище. Безбумажная информатика и экология.
Тенденция к объединению человеческого знания: Менделеев, Вернадский, Урманцев. Язык=система как средство познания и приращения знаний. Системная лингвистика – фундаментальная наука о человеке и мире.
СИСТЕМА ЯЗЫКОВОЙ ИЗОМЕРИИ
Явление изомерии – сущность, фундаментальный характер (математический и философский аспекты). Изомерия в химии, физике, биологии, геологии. Ускорение в получении результатов по аналогии при использовании принципов симметро–асимметрии. Необходимость отыскания левизны–правизны и изомерии в языке-системе и ее обнаружение.
Основные виды языковой изомерии: субстанциальная = статическая и динамическая (создание изомеров при словоизменении и словообразовании; создание изомерийных композиций).
Симметро–асимметрия как сходство различного и различие сходного. Изомерия – способ различения объектов–систем (объемы, структура, грамматика, семантика, отношения и связи). Изомерия внутрисистемная и межсистемная.
Уровни изомерии – слоги, морфемы, лексемы, композиции. Количественно–качественные параметры, семантическая нагрузка.
Изомерия на уровне словоформ. Теоретическая возможность образования слов–изомеров, вероятностные параметры и конкретное наполнение. Математический вывод типологии изомеров и омонимов. Изомерия лексики и формульный язык. Цис–, транс– языковые изомеры.
Системная изомерия в аббревиатурах. Криптоизомерия. Изомерия и уплотняющая и склеивающие функции омонимии.
Проблемы левого и правого в философии, физике, химии, биологии. Левые, правые и лево–правые или право–левые языковые объекты–системы на уровне префиксов, корней сложных слов. Условность левизны–правизны.
Порядок слов и изомерия. Порядок слов в традиционной лингвистике. Формула порядка слов и её реализация в языке. Специфика изомеров при увеличении длины словоформ и композиций. Логика и изомерия.
Типы изомерии по Ю.А. Урманцеву. Типы лингвистической изомерии. Специфика языковой изомерии. Изомеризационные факторы. Операторика и преобразования.
Ядро и периферия изомерии в лексике.
Тенденция к максимуму изомеризации в системах барионного кода и изоморфного ему кода аминокислот – причина сверхустойчивости систем.
Необходимость изучения изомерии – один из путей формализации знаний о языке, вскрытия неявных механизмов словоизменения, словообразования, создания композиций и хранения языковой информации в памяти человека и ЭВМ.
СПИСОК ЛИТЕРАТУРЫ
Анохин П.К. Избранные труды. Философские аспекты теории функциональных систем. –М., 1978.
Барбук С. Г. Изомерия как система. АКД. – Минск, 2000.
Карпаў У. Iзамерыя ў беларускай мове // Роднае слова № 11, 2003.
Карпов В.А. Язык как система. – Минск, 1992; М., 2003.
Карпов В.А. Языковой универсум как система // Вестник МГЛУ. Сер.1. Филология № 13, 2004, (стр. 35 – 46).
Принцип симметрии. – М., 1977.
Урманцев Ю.А. Девять плюс один этюд о системной философии. – М., 2001.
Урманцев Ю.А. Общая теория систем: состояние, приложения и перспективы // Система. Симметрия. Гармония. – М., 1988.
Урманцев Ю.А. Эволюционика. – Пущино, 1988.
ПРИКЛАДНЫЕ ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ
ТЕОРИЯ И ПРАКТИКА МАШИННОГО ПЕРЕВОДА
Язык как средство отражения и познания реального мира. Перевод как способ отражения одного и того же мира разными языковыми средствами. Неизбежность и границы неточности при переводе.
Перевод как вид языковой деятельности. Общая формальная модель переводческой деятельности человека как основа ее моделирования в системах МП. Виды переводов: письменный и устный. Полный письменный, реферативный, аннотационный перевод. Перевод заголовков. Особенности перевода патентов. Перевод «с листа», последовательный и синхронный перевод.
Машинный (автоматизированный и автоматический) перевод как одно из направлений искусственного интеллекта. Возникновение и развитие идеи МП; уроки начального периода разработок в этой области. Три подхода к моделированию процесса перевода в системах МП: прямой (подстрочный) перевод; перевод через язык-посредник; перевод как трехэтапный процесс, включающий анализ, межъязыковые операции и синтез. Инженерные и лингвистические проблемы машинного перевода. Некоторые результаты и анализ ошибок в этой области.
Основные типы «человеко-машинных» систем МП, ориентированных на практическое применение: вспомогательные компьютерные системы в помощь переводчику; практические системы МП с постредактированием; практические системы МП с предредактированием.
Лингвистические проблемы МП. Проблема полноты/ неполноты словарей для осуществления перевода. Способы организации машинных словарей в зависимости от стратегии перевода. Полисемия и способы выбора лексического эквивалента при переводе.
Омонимия как одна из проблем перевода (устного и письменного). Общее в системе омонимии в разных языках. Классификация омонимов. Специфика систем омонимии. Межъязыковые омонимы («ложные друзья переводчика»). Способы снятия омонимии в языке.
Омонимия при автоматическом переводе. Способы обнаружения морфологических омонимов в тексте. Синтаксический анализ как способ снятия грамматической омонимии при автоматическом переводе.
Перевод имен собственных, морфологические и орфографические трудности при передаче имен собственных.
Способы отражения при переводе грамматических категорий, отсутствующих в языке перевода (определенности/ неопределенности, несовпадающих падежных форм имен и временных форм глагола, специфических для ряда языков синтаксических конструкций).
Стилистика перевода. Перевод метафор. Способы перевода игры слов в художественных текстах. Особенности поэтического перевода: сохранение/ несохранение ритмики и рифмы, приоритет формы или смысла.
Особенности научного и технического перевода. Перевод терминов. Терминологические системы разных предметных областей и омонимия в терминологии. Перевод цитат, введенных в текст на другом языке, отсылка к источнику. Проблема автоматического определения языка цитаты.
Подстрочный перевод, редактирование и оценка качества.
Современное состояние промышленных и исследовательских Разработок в области АП в Японии, Европе, США и России.
КОМПЬЮТЕРНЫЕ ЭКСПЕРТНЫЕ СИСТЕМЫ
Экспертизация знаний. Знания о языке-системе, знания о предметной области, знания о структурах формализации двух типов (энмерные кубы, гиперкубы и матрицы).
Матричное представление знаний. Матрицы как порождающие и классификационные системы. Прямая и треугольная декартовы матрицы. Теоретическая и системная полнота матричных представлений.
Экспертизация науки. Верификация истинности знаний. Критерии надежности (количественные, качественные, структурные).
Аппарат полноты и надежности как экспертных оценок. Заложенная конечность структур при данном числе признаков экспертизации. Связь теории упаковок с теорией информации. Связь теории упаковок с треугольными и пирамидальными числами.
Экспертизация языковых знаний. Суть треугольных и пирамидальных чисел как показатель плотных упаковок лексики любого языка мира двумя десятками формул.
Экспертизация помех автоматической обработки. Формализация знаний об омонимии как лексико-синтаксическом явлении. Снятие омонимии.
Языковая изомерия и плотные упаковки. Системное представление знаний с помощью формул. Связь изомерии с омонимией. Количественные и качественные параметры явления изомерии в языке. Изомерия – один из путей формализации знаний о языке, раскрывающий неявные
механизмы связей словоизменения, словообразования, создания композиций и сохранение языковой информации в памяти человека и ЭВМ.
Экспертизация лексики. Построение классификационных систем-матриц открытого типа для словообразования и словоизменения. Метафора как система. Метафоричность человеческого мышления. Метафора в физике, биологии, математике. Антропоцентризм и его результаты. Многозначность как симметричная многослойная упаковка формы при асимметрии значений. Антонимия как система. Синонимия как система. Эвфемизмы, дублеты и варианты.
Экспертизация синтаксиса. Построение экспертно-классификацион-ных систем (языковые сочетания, размещения, перестановки).
Экспертизация школьных учебников на базе машинных словарей. Дифференциальный словарь белорусского школьника по пяти учебным дисциплинам как объект экспертизации общности и специфики.
Экспертизация обычных и машинных словарей. Проблемы и способы кодирования грамматики и семантики (омонимия, полисемия). Способы лингвистического кодирования, требования к кодам (простота алгоритма, краткость кода, полнота кодирования признаков).
Экспертизация языковой симметрии/асимметрии. Связь симметрии и асимметрии с информацией. Увеличение объема информации при асимметризации. Причины, вытормаживающие объем информации при жестких требованиях симметрии корня, класса и т.п.
АВТОМАТИЧЕСКИЙ АНАЛИЗ ЕСТЕСТВЕННОЯЗЫКОВОГО ТЕКСТА
Автоматическая обработка текста как проблема компьютерной лингвистики. Стратегии обработки информации и место в них естественного языка. Языковая способность как важнейший компонент интеллектуальных способностей человека. Коммуникативные, когнитивные и информационные процессы. Принципы многоэтапности и многовариантности обработки текста. Проблема глубины обработки.
Автоматизированные системы обработки текста и их архитектура. Лингвистический процессор как сложная автоматизированная система обработки текста. Анализ, синтез, диалоговое взаимодействие, логическая обработка информации. Структура лингвистического банка данных: машинные словари, базы данных и знаний. Виды машинных словарей. Роль и структура информационного тезауруса.
Проблема ограничения естественного языка для действующей системы обработки ЕЯ–текстов. Проблема универсальности лингвистических средств обработки текста.
Языки представления текста как инструмент его автоматической обработки. Семантические метаязыки и представление знаний в лингвистических процессорах. Языки представления морфолого-синтаксической информации в лингвистических процессорах. Проблемы глубины лингвистических репрезентаций текста.
Основные виды понимания текста и методы формализации понимания. Анализаторы текста как модели различных видов понимания. Процедуры экспликационного и информационного анализа текста. Морфологический, синтаксический и семантический этапы экспликационного анализа текста.
Автоматизация синтеза текста. Алгоритмы синтеза текста для вербализации заданного содержания. Семантические, морфологические, синтаксические проблемы синтеза.
Диалоговые системы. Принципы организации информационного диалога. Процедуры предупреждения, выявления и преодоления коммуникативных неудач.
Лингвистическое обеспечение прикладных систем различного назначения.
Автоматическое аннотирование и индексирование научно-технической документации. Автоматическое реферирование. Принцип частотности ключевых слов при автоматическом реферировании. Пути повышения информационности текста за счет восстановления информации, выраженной местоимениями. Типы текстов, подлежащих и не подлежащих реферированию.
Анализ запросов пользователя на естественном языке к информационной системе. Естественноязыковой интеллектуальный интерфейс для общения с базой данных и базой знаний. Обучающие диалоговые системы. Автоматическое извлечение знаний из текстов для экспертных систем. Системы автоматизированного редактирования. Терминологические банки данных. Системы машинных фондов естественных языков. Создание АРМ лингвиста.
ДИСТАНЦИОННОЕ ОБУЧЕНИЕ
Разработка и внедрение новых информационных технологий в систему образования Республики Беларусь. Модернизация и развитие существующей сетевой инфраструктуры и увеличение пропускной способности используемых каналов доступа к информационным ресурсам. Создание учебных программ и электронных библиотек. Развитие дистанционного обучения.
Основные направления и этапы работ по созданию информационной компьютерной сети системы образования. Развитие коммуникационной инфраструктуры, разработка оптимальных механизмов доступа к информационным образовательным ресурсам. Анализ информационных потоков и выбор информационных технологий для организации сети на различных уровнях. Разработка и реализации архитектуры сети, типовых проектов подключения учебных заведений и индивидуальных пользователей. Разработка механизмов доступа к информационным образовательным ресурсам на различных уровнях. Обеспечение доступа во внешние сети (RUNET, Internet и др.).
Создание национальных и адаптация русскоязычных и иных образовательных информационных ресурсов. Создание и развитие типовых информационных узлов учреждений образования. Создание информационных ресурсов для учащихся школ, для педагогических и научных кадров. Создание информационных ресурсов для управления системой образования. Адаптация и зеркалирование русскоязычных и иных образовательных информационных ресурсов. Формирование информационных ресурсов, необходимых для реализации программы дистанционного обучения. Виртуализация библиотечных ресурсов учреждений образования, ведомственных и публичных библиотек с обеспечением к ним сетевого доступа.
Развитие и внедрение новых образовательных информационных технологий. Создание нормативной правовой и организационно-методической базы дистанционного обучения Республики Беларусь. Создание механизма массовой разработки электронных учебных пособий. Опытное внедрение системы дистанционного обучения (БГУ, БГУИР и др.).
СПИСОК ЛИТЕРАТУРЫ
Апресян Ю.Д., Богуславский И.М., Иомдин Л.Л. и др. Лингвистический процессор для сложных информационных систем. – М., 1992
Белоногов Г.Г., Кузнецов Б.А. Языковые средства автоматизированных информационных систем. – М., 1983.
Виноград Т. Программа, понимающая естественный язык. – М., 1976.
Голенков В.В., Елисеева О.Е., Гулякина Н.А. и др. Интеллектуальные обучающие системы и виртуальные учебные организации. – Мн.: БГУИР, 2001.
Городецкий Б. Ю. Семантические проблемы построения автоматизированных систем обработки текстовой информации // Вычислительная лингвистика. – М., 1976.
Городецкий Б. Ю., Раскин В. В. Методы семантического исследования ограниченного подъязыка. – М., 1971.
Городецкий Б.Ю. Компьютерная лингвистика: моделирование языкового общения // НЗЛ. Вып. XXIV. – М., 1989.
Дракин В.П., Попов Э.В., Преображенский А.Б. Общение конечных пользователей с системами обработки данных. – М., 1988.
Ершов А.П. Машинный фонд русского языка: внешняя постановка. // В сб.: Машинный фонд русского языка: идеи и суждения. – М., 1986.
Звегинцев В.А. Язык как фактор компьютерной революции // НТИ. Сер. 2. 1985, № 9.
Искусственный интеллект. (В 3-х кн.) Кн. 1. Системы общения и экспертные системы: Справочник / Под ред. Э. В. Попова. – М., 1990.
Карпов В.А. Язык как система. Минск, 1992; – М., 2003.
Карпова Г.Д., Пирогова Ю.К., Кобзарева Т.Ю., Микаэлян Е.В. Компьютерный синтаксический анализ: описание моделей и направлений разработок (Итоги науки и техники. Серия «Вычислительные науки». Т. 6. – М., 1991.
Кейтер Дж. Компьютеры - синтезаторы речи. – М., 1985.
Kибрик А. Е. Очерки по общим и прикладным вопросам языкознания. – М., 1992.
Мальковский М.Г. Диалог с системой искусственного интеллекта. – М., 1986.
Марчук Ю.Н. Проблемы машинного перевода. – М., 1983.
Машинный фонд русского языка: Идеи и суждения. – М., 1986.
Мельчук И. А. Опыт теории лингвистических моделей «Смысл Текст». – М., 1974.
Минский М. Фреймы для представления знаний // Психология машинного зрения. – М., 1978.
Моделирование языковой деятельности в интеллектуальных системах. – М., 1987.
Моль А. Социодинамика культуры. – М., 1973.
Научно-технический перевод. – М., 1987.
Нелаев В.В., Казитов М.В. Активная виртуальная лаборатория в сети Internet как универсальное средство дистанционного образования // Адукацыя і выхаванне. – Минск, 1999, № 7. С. 52 – 56.
Попов Э. В. Экспертные системы. – М., 1987.
Поспелов Д. А. Логико-лингвистические модели в системах управления. – М., 1981.
Психологические проблемы переработки знаковой информации. – М., 1977.
Растригин Л.А. Вычислительные машины, системы, сети. – М., 1982.
Реальность и прогнозы искусственного интеллекта. М., 1987.
Скрэгг Г. Семантические сети как модели памяти // НЗЛ. Вып. XII. – М., 1983.
Урманцев Ю.А. Общая теория систем: состояние, приложения и перспективы. – В сб.: Система. Симметрия. Гармония. – М., 1988.
Файн B.C. Распознавание образов и машинное понимание естественного языка. – М., 1987.
Федоров А.В. Основы общей теории перевода. – М., 1968.
Христочевский С.А. Электронные мультимедийные учебники и энциклопедии. / Информатика и образование № 2. – М., 2000.
Хуторской А.В. Принципы дистанционного творческого обучения. – http: //www.eidos.techno. ru/joumal/issue l/khutorskoj/htm
Чарняк Ю. Умозаключения и знания (Части I и II) // НЗЛ. Вып. ХП. – М., 1983.
Чижаковский В.А. Беляева Л.Л. Тезаурус в системах автоматической переработки текста. – Кишинев, 1983.
Романские языки
Достарыңызбен бөлісу: |