Темы курсовых работ

СПИСОК НАПРАВЛЕНИЙ ДЛЯ ВЫБОРА ТЕМ КУРСОВЫХ И ДИПЛОМНЫХ РАБОТ ДЛЯ СТУДЕНТОВ ОБРАЗОВАТЕЛЬНОЙ ПРОГРАММЫ "ПРИКЛАДНАЯ, КОМПЬЮТЕРНАЯ И МАТЕМАТИЧЕСКАЯ ЛИНГВИСТИКА"

Азарова Ирина Владимировна, к.ф.н., доцент кафедры матлингвистики
• Подготовка данных для интеграции компьютерного словаря RussNet в YARN.
o Автоматизированное формирование глагольных RussNet.
o Автоматизированное формирование структур существительных RussNet.
o Автоматизированное формирование структур прилагательных RussNet.
o Автоматизированное формирование структур наречий RussNet.
• Разработка процедур использования данных RussNet
o Снятие лексической неоднозначности в терминах структур RussNet.
o Вычисление семантической близости синсетов и слов в терминах структур RussNet
• Разработка процедур автоматического анализа текстов
o Модуль использования валентностей при семантико-синтаксическом анализе предложения
o Модуль коммуникативного анализа предложения
o Модуль разрешения анафоры

Алексеева Елена Леонидовна, к.ф.н., доцент кафедры матлингвистики
• Кластерный анализ повторяющихся чтений в полных апракосах.

Гребенников Александр Олегович, к.ф.н., доцент кафедры матлингвистики
• Частотные словари художественной прозы и словари языка писателя
• Автоматическая обработка текста (проблема лемматизации)
• Метаязык современной лексикографии

Добров Алексей Владимирович, к.ф.н., ст. преподаватель кафедры матлингвистики
• Компьютерный синтаксис:
o Оценка эффективности синтаксических анализаторов
o Разработка синтаксически размеченных корпусов текстов на русском языке
o Комбинирование грамматик зависимостей и НС-грамматик в компьютерном синтаксисе
• Синтаксическая семантика:
o Разрешение синтаксической неоднозначности средствами онтологической семантики
o Синтаксические и семантические валентности в компьютерной онтологии
o Семантико-синтаксическая интерпретация лексикографических дефиниций для автоматического построения компьютерных онтологий
o Семантическая разметка синтаксически размеченных корпусов текстов на русском языке

Захаров Виктор Павлович, к.ф.н., доцент кафедры матлингвистики
• Корпусная лингвистика
o Создание корпусов, в том числе
• Создание корпусов специальных текстов
• Создание мегакорпусов на основе текстов из веба
• Создание параллельного корпуса русско-чешских устойчивых сочетаний
o Корпусно-ориентированные исследования и разработки
• Автоматизированное выявление устойчивых словосочетаний (коллокаций)
• Корпусно-ориентированные методы построения словарей и терминосистем
• Корпусные исследования различных языковых явлений (на материале одного или нескольких языков)
• Сравнение региональных вариантов одного и того же языка (русский, английский)
o Сравнение и оценка корпусных менеджеров
o Сравнение и оценка корпусов
o Ведение портала СПбГУ по корпусной лингвистике
o Социолингвистические и культурометрические исследования на основе корпусов (в первую очередь, Google Books Ngram Viewer)
• Общие вопросы компьютерной лингвистики
o История математической лингвистики
o Составление хрестоматии и глоссария по корпусной лингвистике

Мартыненко Григорий Яковлевич, д.ф.н., профессор кафедры матлингвистики
• Сравнительный частотный словарь слов, вводящих прямую речь в художественной прозе (на материале русского рассказа)
• Использование метода корреляционного отношения в частотных словарях для определения границы между ядром и периферией
• Синтаксис русского классического сонета: Бальмонт – Бунин – Северянин
• Динамика энергии текста сквозь призму синтактико-стилистических параметров
• Построение и анализ структуры частотного словаря слова-стимула «математическая лингвистика»
• Зависимость размера предложения от числа предложений в абзаце и от его позиции в абзаце (на материале научной и художественной прозы)
• Зависимость размера словоупотребления от размера предложения, которому принадлежит данное словоупотребление, а также от его позиции в предложении (на материале научной и художественной прозы)
• Зависимость размера словесной массы от ее положения относительно синтаксического центра (на материале научной и художественной прозы)
• Зависимость размера члена предложения относительно порядка их следования друг относительно друга (проверка закона Отто Бехагеля) (на материале научной и художественной прозы)

Марусенко Михаил Александрович, д.ф.н., профессор кафедры матлингвистики
• Атрибуция «12 стульев» и «Золотого телёнка».

Митренина Ольга Владимировна, к.ф.н., доцент кафедры матлингвистики
• Анализ языковых данных с помощью машинного обучения (на материале социальных сетей)
• Создание чат-ботов

Митрофанова Ольга Александровна, к.ф.н., доцент кафедры матлингвистики
• лингвистика конструкций, дистрибутивная семантика:
o контекстное профилирование целевых слов, автоматическое выделение конструкций,
o оценка частотности конструкций, оценка устойчивости и композиционности конструкций,
o разрешение лексико-семантической и морфологической неоднозначности целевых слов на основе конструкций,
o исследование квазисинонимии (контекстной синонимии) целевых слов и их конструкций, кластеризация конструкций,
o сравнение различных мер семантической близости слов и конструкций,
o автоматическое выделение классов слов с близкой дистрибуцией (контекстных синонимов),
o использование контекстных данных для развития открытого морфосинтаксического анализатора для русскоязычных корпусов текстов на основе NLTK,
o исследование конструкций с пространственно-временным значением, с именованными сущностями, с оценочным значением и.т.д.,
o разработка программного обеспечения для решения данных задач;
• автоматическое извлечение лингвистических данных из корпусов и тематическое моделирование:
o автоматическая классификация и кластеризация лексики и текстов в корпусах
o автоматическое выделение ключевых слов в текстах
o автоматическое пополнение многоязычных словарей на основе контекстных данных
o построение тематических моделей текстов с учетом конструкций
o оценка близости текстов по тематике на основе ключевых слов, классов контекстных синонимов и т.п.
o создание формальных онтологий на основе корпусов текстов
o автоматическое извлечение фактов и оценка тональности текстов
o сравнение различных алгоритмов кластеризации лексики и текстов в корпусах, алгоритмов тематического моделирования
o разработка метрик для оценки качества моделей
o разработка программного обеспечения для решения данных задач
Используемые методы и формализмы:
– дистрибутивно-статистический анализ, композиционная дистрибутивная семантика
– тематические модели текста: алгебраические (VSM, LSA) и вероятностные (pLSA, LDA)
– машинное обучение и распознавание образов
– алгоритмы классификации и кластеризации
– логические исчисления (исчисление Ламбека, семантика Монтегю, нечеткая логика)
Возможные сферы применения результатов:
− каталог лексических конструкций
− открытый лингвистический процессор на основе NLTK, GenSim и других библиотек Python
− поддержка систем машинного перевода
− экспертные системы, рекомендательные системы

Николаев Илья Сергеевич, к.ф.н., доцент
• Лингвистические экспертные системы
o Экспертная система по грамматике языка N.
o Экспертная система по лингвистической терминологии.
• Компьютерные диалоговые системы
o Моделирование неформальных диалогов в социальных сетях.
o Компьютерное моделирование диалогов в стандартных ситуациях.
• Интеллектуальный анализ текстов (Text Mining)
o Автоматизированный морфологический анализ нестандартных словоформ.
o Автоматизированное выделение парадигм и конструкций.
• Моделирование диахронических процессов
o Меделирование исторических фонологических процессов языка N.
o База данных по исторической грамматике языка N.
• Документирование и архивирование редких и исчезающих языков
o Полнотекстовая база данных языка N.
o База данных по грамматике языка N.
• Исследование топонимии Ингерманландии
o Запросы и представления в базе данных по топонимике.
o Анализ данных картографических источников и их представление в базе данных по топонимике.
o Анализ данных исторических источников и их представление в базе данных по топонимике.
o Структурный и этимологический анализ топонимов.
• Компьютерная фольклористика
o Компьютерные методы анализа языка фольклорных произведений: устойчивые словосочетания.
o Компьютерные методы анализа языка фольклорных произведений: именные и глагольные парадигмы.
• Диалектометрия
o Определение степени близости говоров математическими методами.
o Моделирование явлений лингвистической непрерывности на территории распространения диалекта.

Скребцова Татьяна Георгиевна, к.ф.н., доцент кафедры матлингвистики
• Дискурс о путешествиях: структура, семантика, прагматика различных жанров
• Метафоры в музыковедческом дискурсе
• Синестезия в описаниях вкуса и запаха
• Десемантизированные существительные (дело, вещь, факт, проблема и т.п.): грамматические и дискурсивные особенности (корпусное исследование)

Хохлова Мария Владимировна, к.ф.н., доцент кафедры матлингвистики
• Изучение совместной встречаемости единиц на материале разных функциональных стилей (корпусное исследование)
• Морфологическая разметка корпусов текстов (тестирование инструментов)
• Синтаксическая разметка корпусов текстов (тестирование инструментов)

Чебанов Сергей Викторович, д.ф.н., профессор кафедры матлингвистики
• История и предыстория биогерменевтики (в мире и в России).
• История и предыстория биосемиотики (в мире и в России).
• Принципы и практика англо-русского перевода текстов по биосемиотике.
• Принципы и практика русско-английского перевода текстов по биосемиотике.
• Принципы и практика англо-русского перевода текстов по биогерменевтике.
• Принципы и практика русско-английского перевода текстов по биогерменевтике.
• Принципы и практика англо-русского перевода текстов по биостилистике.
• Принципы и практика русско-английского перевода текстов по биостилистике.
• Принципы и практика англо-русского перевода текстов по философии биологии.
• Принципы и практика русско-английского перевода текстов по философии биологии.
• Лингвистика и семиотика описаний (разные аспекты разных типов описаний).
• Социальные институты в беллетристике (русской, французской, английской и т.д.).
• Лингвистика (стилистика, когнитивная семантика) классических политических текстов (в том числе, сопоставительная, включая сравнение переводов - речи Цицерона, "Слово..." митрополита Иллариона, конституция США, кодекс Наполеона и т.д.).
• Концепты социальных институтов в классических политических текстах.
• Создание корпусов по политической концептологии.
• Лингвистика и риторика речей на современных резонансных судебных процессов.
• Ценологический подход к изучению длины слова (графического и фонетического).
• Система техник понимания Г.И.Богина.
• Конституции государств и национальный политический язык.
• Лингво-семиотический статус системы описания составов RHA.
• Лингво-семиотический статус свиста сильбо о. Ла Гомера.
• Лингво-семиотический статус трапеции гласных Щербы.
• Хозяйственные концепты в национальной картине мире (разных).

Шерстинова Татьяна Юрьевна, к.ф.н., доцент кафедры матлингвистики
• Корпусные исследования повседневной устной речи
• Прагматический аспект повседневной речевой коммуникации
• Тематическое индексирование повседневных разговоров
• Фонетические исследования спонтанной устной речи
• Методы автоматической обработки устной речи и речевых транскриптов