Институт лингвистики Абитуриентам Магистратура Компьютерная лингвистика (направление «Фундаментальная и прикладная лингвистика»)

Компьютерная лингвистика

В Институте лингвистики РГГУ с 2012 года осуществляется подготовка магистров по программе магистратуры Компьютерная лингвистика (направление Фундаментальная и прикладная лингвистика). Эта программа предназначена для подготовки профессиональных лингвистов, владеющих как основами языкознания, так и современными методами научно-исследовательской, экспертно-аналитической, инженерной работы и способных эффективно участвовать в разработке инновационных языковых компьютерных технологий.

В образовательном процессе участвуют разработчики крупных исследовательских и коммерческих систем в области автоматической обработки текста, что обеспечивает связь обучения магистров с мейнстримом современной компьютерной лингвистики. Особое внимание уделяется участию магистров в российских и международных конференциях.

Среди преподавателей авторы базовых учебников по лингвистическим специальностям, специалисты мирового уровня, руководители проектов крупных систем автоматической обработки языка: Я.Г. Тестелец, И.М. Богуславский, В.И. Беликов, В.И. Подлесская, В.П. Селегей, Л.Л. Иомдин,  А.С. Старостин, С.А. Шаров, а также сотрудники компаний, являющихся мировыми лидерами в области компьютерной лингвистики: IBM (система Watson), Яндекс, ABBYY (системы Lingvo, FineReader, Compreno).

Основой подготовки магистров по данной программе является проектный подход. Привлечение магистрантов к научно-исследовательской работе в области компьютерной лингвистики происходит на базе РГГУ и на базе компаний, занимающихся разработкой программ в области АОТ (ABBYY, IBM и др.), что, безусловно, является большим плюсом как для самих магистров, так и для их возможных работодателей. В частности, осуществляется приём в магистратуру целевых магистров, обучение которых обеспечивается будущими работодателями.

Вступительные испытания: "Формальные модели и методы современной лингвистики". Точную информацию о времени экзамена можно получить на сайте отдела магистратуры РГГУ.

Руководители магистратуры — зав. кафедрой компьютерной лингвистики, директор по лингвистическим исследованиям компании ABBYY Владимир Павлович Селегей и д.ф.н., профессор Вера Исааковна Подлесская.


Программа вступительного  экзамена и собеседования  по  дисциплине «Формальные модели и методы современной лингвистики».

 Комментарии к программе

  • Любой вопрос программы может сопровождаться задачами,  связанными с описаниями конкретных языковых явлений, относящихся к разделу вопроса: построению структур, описанию ограничений, возможным алгоритмам построения и/или идентификации. 
  • Вопросы, отмеченные звездочками, являются факультативными (в билетах стоят под №3). Владение соответствующим материалом является серьезным бонусом для кандидатов, но не обязательно.
  • Помимо теоретических вопросов в билетах на экзамене будет предложен небольшой фрагмент специального (лингвистического) текста на английском языке – для перевода и обсуждения. От поступающих требуется продемонстрировать удовлетворительный уровень владения англоязычной научной терминологией и навыками анализа научного текста. В качестве примера текста, который не должен вызвать у поступающего серьезных трудностей,  ниже приводится фрагмент статьи https://en.wikipedia.org/wiki/Anaphora_(linguistics)

In linguistics, anaphora (/əˈnæfərə/) is the use of an expression whose interpretation depends upon another expression in context (its antecedent or postcedent). In a narrower sense, anaphora is the use of an expression that depends specifically upon an antecedent expression and thus is contrasted with cataphora, which is the use of an expression that depends upon a postcedent expression. The anaphoric (referring) term is called an anaphor. For example, in the sentence Sally arrived, but nobody saw her, the pronoun her is an anaphor, referring back to the antecedent Sally. In the sentence Before her arrival, nobody saw Sally, the pronoun her refers forward to the postcedent Sally, so her is now a cataphor (and an anaphor in the broader, but not the narrower, sense). Usually, an anaphoric expression is a proform or some other kind of deictic (contextually-dependent) expression.[1] Both anaphora and cataphora are species of endophora, referring to something mentioned elsewhere in a dialog or text.

Anaphora is an important concept for different reasons and on different levels: first, anaphora indicates how discourse is constructed and maintained; second, anaphora binds different syntactical elements together at the level of the sentence; third, anaphora presents a challenge to natural language processing in computational linguistics, since the identification of the reference can be difficult; and fourth, anaphora tells some things about how language is understood and processed, which is relevant to fields of linguistics interested in cognitive psychology.


ТЕОРЕТИЧЕСКИЕ ВОПРОСЫ 

ОБЩИЕ ВОПРОСЫ ЯЗЫКОЗНАНИЯ 

  • Объект лингвистики. Язык и речь. Синхрония и диахрония.
  • Уровни языка. Формальные модели уровней языка.
  • Синтагматика и парадигматика. Понятие дистрибуции.
  • Основания межъязыковых сравнений: типологическая, генеалогическая и ареальная лингвистика. 
  • *Математическая лингвистика: объект и методы исследований 

ФОНЕТИКА 

  • Предмет фонетики. Артикуляционная и акустическая фонетика.
  • Сегментная и супрасегментная фонетика. Просодия и интонация.
  • Основные понятия фонологии. Типология фонологических систем и их фонетических реализаций. 
  • *Компьютерные инструменты и методы фонетических исследований
  • *Анализ и синтез речи.

МОРФОЛОГИЯ 

  • Предмет морфологии. Морфы, морфемы, алломорфы.
  • Словоизменение и словообразование.
  • Грамматические значения и способы их реализации. Грамматические категории и граммемы. Морфологические и синтаксические грамматические значения.
  • Понятия словоформы, основы, леммы и парадигмы.
  • Части речи; основные подходы к выделению частей речи. 
  • *Формальные модели описания словоизменения и словообразования.
  • *Морфология в задачах автоматической обработки языка: проверка орфографии, лемматизация, POS-tagging 

СИНТАКСИС

  • Предмет синтаксиса. Способы  выражения синтаксических отношений.
  • Способы представления синтаксической структуры предложения. Достоинства и недостатки деревьев зависимостей и составляющих.
  • Способы описания линейного порядка.  Непроективность и разрыв составляющих. Понятие трансформации; трансформации, связанные с линейным порядком.
  • Связь между синтаксисом и семантикой: валентности, модели управления, актанты и сирконстанты.
  • Диатеза и залог. Актантная деривация.
  • Коммуникативная организация высказывания. Тема и рема, данное и новое, контрастивность. 
  • *Основные синтаксичеcкие теории: МСТ, генеративизм, функциональная грамматика, HPSG
  • *Математические модели синтаксиса: классификация формальных языков по Хомскому, алгоритмы распознавания и их сложность. 

СЕМАНТИКА 

  • Предмет семантики. Наивная и научная языковые картины мира. Гипотеза Сепира – Уорфа.
  • Значение в языке и речи: смысл и референт. Тип референции (денотативный статус).
  • Лексическая семантика. Способы описания семантики слова.
  • Грамматическая семантика. Основные категории на примере русского языка.
  • Семантика предложения. Пропозициональный компонент. Дейксис и анафора. Кванторы и связки. Модальность.
  • Иерархия и системность лексических значений. Полисемия и омонимия. Семантическая структура многозначного слова. Понятия инварианта и прототипа.
  • Парадигматические и синтагматические отношения в лексике. Лексические функции.
  • Толкование. Язык толкований. Московская семантическая школа
  • Семантика и логика. Истинностное значение высказывания.
  • Теория речевых актов. Высказывание и его иллокутивная сила. Перформативы. Классификация речевых актов.
  • Фразеология: инвентарь  и способы описания фразеологических единиц. 
  • *Модели и методы  формальной семантики.
  • *Модели семантики в современной компьютерной лингвистике.
  • *Дистрибутивная и операциональная  семантики.
  • *Основные идеи грамматики конструкций. 

 ТИПОЛОГИЯ 

  • Традиционные типологические классификации языков.
  • Типология грамматических категорий имени и глагола.
  • Типология простого предложения. Основные типы конструкций: аккузативная, эргативная, активная.
  • Типология порядка слов и гринберговские корреляции. Лево- и правоветвящиеся языки. 

ЛЕКСИКОГРАФИЯ 

  • Лексика как инвентарь культуры; социальное варьирование лексики, лексические узус, норма, кодификация.
  • Типология словарей (на русском материале). Отражение лексики в словарях различных типов.
  • Двуязычная лексикография с привлечением русского языка.
  • Дескриптивная и прескриптивная лексикография. Профессиональные лингвистические словари.
  • Специфика основных русских толковых словарей. Структура словарной статьи. Толкование и энциклопедическая информация.
  • Лексика и грамматика. Представление об интегральной модели языка в Московской семантической школе.
  • *Методика работы лексикографа.
  • *Корпусные методы в лексикографии. 

ЛИНГВИСТИКА ТЕКСТА И ДИСКУРС 

  • Понятие текста и дискурса.
  • Механизмы межфразовой связи. Основные разновидности средств их языковой реализации.
  • Предложение как единица языка и как элемент текста.
  • Сверхфразовые единства, принципы их формирования и выделения, основные свойства.
  • Основные категории классификации текстов (жанр, стиль, регистр, предметная область и т.д) 
  • *Методы автоматической жанровой классфикации. 

СОЦИОЛИНГВИСТИКА 

  • Проблема предмета и границ социолингвистики, ее междисциплинарный характер. Основные понятия социологии и демографии. Уровни языковой структуры и социолингвистика. Основные понятия и направления социолингвистики.
  • Языковые контакты. Билингвизм и диглоссия. Дивергентные и конвергентные процессы в истории языка.
  • Социальная дифференциация языка. Формы существования языка. Литературный язык: узус—норма—кодификация. Функциональные сферы языка. 
  • Языковая социализация. Иерархический характер социальной и языковой идентичности. Языковое поведение индивида и его коммуникативный репертуар.
  • Методы социолингвистических исследований. 

КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА 

  • Задачи и методы компьютерной лингвистики.
  • Корпусная лингвистика. Основные характеристики корпуса.
  • Представление знаний. Основные  идеи теории фреймов М. Минского. Система  FrameNet.
  • Тезаурусы и  онтологии.  WordNet.
  • Основы статистического анализа текстов. Частотные словари. Анализ коллокаций. 
  • *Понятие машинного обучения. 


ЛИТЕРАТУРА

 Учебная (базовый уровень) 

Баранов А.Н. Введение в прикладную лингвистику. М.: Едиториал УРРС, 2001.

Баранов А.Н., Добровольский Д.О. Основы фразеологии (краткий курс) Учебное пособие. 2-е издание.  Москва: Флинта, 2014.

Беликов В.А., Крысин Л.П. Социолингвистика. М., РГГУ, 2001.

Бурлак С.А., Старостин С.А. Сравнительно-историческое языкознание. М.: Академия. 2005

Вахтин Н.Б., Головко Е.В.. Социолингвистика и социология языка. СПб., 2004.

Князев С. В.,   Пожарицкая С. К. Современный русский литературный язык:   Фонетика,   графика, орфография, орфоэпия. 2 изд. М., 2010

Кобозева И.М. Лингвистическая семантика. М.: Едиториал УРСС. 2004.

Кодзасов С.В., Кривнова О.Ф. Общая фонетика. М.: РГГУ, 2001.

Кронгауз М.А. Семантика. М.: РГГУ. 2001.

Кронгауз М.А. Семантика: Задачи, задания, тексты. М.: Академия. 2006..

Маслов Ю.С. Ведение  в языкознание. Изд. 6-е, стер. М.: Академия, фил. фак. СПбГУ,

Плунгян В.А. Общая морфология: Введение в проблематику. Изд. 2-е. М.: Едиториал УРСС, 2003.

Тестелец Я.Г. Введение в общий синтаксис. М., 2001.

Шайкевич А.Я. Введение в лингвистику. М.: Академия. 2005. 

Научная и справочная

Апресян Ю.Д. Избранные труды, том I. Лексическая семантика: 2-е изд., исп. и доп. М.: Школа "Языки русской культуры", 1995.

Апресян Ю.Д. Избранные труды, том II. Интегральное описание языка и системная лексикография. М.: Школа "Языки русской культуры", 1995.

Апресян Ю.Д. (ред.) Новый объяснительный словарь синонимов русского языка. Москва - Вена: "Языки русской культуры", Wiener Slavistischer Almanach, Sonderband 60, 2004. 

Апресян Ю.Д. (ред.) Языковая картина мира и системная лексикография (отв. ред. Ю. Д. Апресян). М.: "Языки славянских культур", 2006, Предисловие и гл. 1, с.26 -- 74.

Булыгина Т.В., Шмелев А.Д. Языковая концептуализация мира (на материале русской грамматики). М.: Школа "Языки русской культуры", 1997.

Вайнрайх У. Языковые контакты. Киев, 1983.

Вежбицкая А. Семантические универсалии и описание языков. М.: Школа "Языки русской культуры". 1999.

Гальперин И.Р. Текст как объект лингвистического исследования. 6-е изд. М.: ЛКИ, 2008 ("Лингвистическое наследие XX века")

Зализняк А.А. “Русское именное словоизменение” с приложением избранных работ по современному русскому языку и общему языкознанию. М.: Языки славянской культуры, 2002.

Зализняк А.А., Падучева Е.В. К типологии относительного предложения. / Семиотика и информатика, вып. 35. М., 1997, с. 59-107.

Иванов Вяч. Вс.. Лингвистика третьего тысячелетия. Вопросы к будущему. М., 2004. С. 89-100 (11. Языковая ситуация мира и прогноз на ближайшее будущее).

Кибрик А.Е. Очерки по общим и прикладным вопросам языкознания. М.: Изд-во МГУ, 1992.

Кибрик А.Е. Константы и переменные языка. СПб: Алетейя, 2003.

Лабов У. О механизме языковых изменений // Новое в лингвистике. Вып.7. М., 1975. С.320-335.

Лайонз Дж. Лингвистическая семантика: Введение. М.: Языки славянской культуры. 2003.

Лайонс Джон. Язык и лингвистика. Вводный курс. М: УРСС, 2004

Лакофф Дж. Женщины, огонь и опасные вещи: Что категории языка говорят нам о мышлении. М.: Языки славянской культуры. 2004.

Лакофф Дж., Джонсон М. Метафоры, которыми мы живем. Пер. с англ. Изд.2. М.: УРСС. 2008.

Лингвистический энциклопедический словарь / Под ред. В.И. Ярцевой. М.: Научное изд-во «Большая российская энциклопедия», 2002.

2007.

Мельчук И.А. Курс общей морфологии. Тт. I—IV. Москва—Вена: "Языки славянской культуры", Wiener Slavistischer Almanach, Sonderband 38/1—38/4, 1997—2001.

Мельчук И. А. Опыт теории лингвистических моделей «СМЫСЛ ↔ ТЕКСТ». М.: Школа "Языки русской культуры", 1999.

Фёдорова Л.Л. Семиотика. М., 2004.

Филиппов К. А. Лингвистика текста: Курс лекций - 2-е изд., исп. и доп. Изд. С.-Петерб. ун-та, 2007.

Энциклопедия «Кругосвет»: www.krugosvet.ru

Haspelmath, M., et al. (eds.). World Atlas of Language Structures. Oxford, 2005.

Dryer, M.S. and Haspelmath, M. (eds.) The World Atlas of Language Structures Online. Leipzig: Max Planck Institute for Evolutionary Anthropology, 2013. (http://wals.info)

Croft W. Typology and Universals. Cambridge: Cambridge University Press, 2003. Shopen, T. (ed.). Language Typology and Syntactic Description. 2nd edition. Cambridge, 2007.

Wikipedia: Computational_linguistics (http://en.wikipedia.org/wiki/Computational_linguistics), включая упоминаемые там статьи.

The Oxford handbook of computational linguistics (Ruslan Mitkov ed.) N.Y.: Oxford university press, 2003.

Jurafsky, Daniel and Martin, James H. Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition. Second Edition, Pearson, 2009

Дополнительная 

Берков В. П. Двуязычная лексикография. Учебник. 2-е изд., перераб. и доп. — М.: Астрель; АСТ; Тразиткнига, 2004.

В. И. Беликов. Методические новости в социальной лексикографии XXI века // Slavica Helsingiensia 40 Instrumentarium of Linguistics Sociolinguistic Approaches to Non-Standard Russian, Helsinki, 2010 A. Mustajoki, E. Protassova, N. Vakhtin (eds.). Рр.32—49. (http://www.helsinki.fi/slavicahelsingiensia/preview/sh40/pdf/03-sh40.pdf)

В. И. Беликов. О словарях, «содержащих нормы современного русского литературного языка при его использовании в качестве государственного языка Российской Федерации». 2010 // Портал Грамота.Ру (http://gramota.ru/biblio/research/slovari-norm)

Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной Международной конференции «Диалог». Вып. 1—11. — М.: Изд-во Наука, из-во РГГУ, 2002—2012. (Статьи по компьютерной лингвистике, http://www.dialog-21.ru).

Национальный корпус русского языка : 2006—2008. Новые результаты и перспективы. / Отв. ред. В. А. Плунгян. — СПб.: Нестор-История, 2009.

Новое в зарубежной лингвистике. Вып. XXIV, Компьютерная лингвистика / Сост. Б. Ю. Городецкий. М.: Прогресс, 1989.

Шимчук Э. Г. Русская лексикография: Учебное пособие. М.: Академия, 2009.

Национальный корпус русского языка: 2003—2005. Сборник статей. М.: Индрик, 2005.


См. также презентацию программы, учебный план, описание программы и аннотации читаемых курсов.


Для контактов:

Кафедра компьютерной лингвистики Института лингвистики РГГУ
coling-rsuh@abbyy.ru
(499) 9734253