Анализ естественных языков (Natural Language Processing, NLP) – направление исследований в области искусственного интеллекта и компьютерной лингвистики, которое изучает проблемы понимания естественного языка (речи и текстов) с помощью компьютера. Зарождение этого направления связывают с необходимостью решения задач машинного перевода и взаимодействия (общения) человека с компьютером на естественном языке. В наше время актуальность данного направления определяется необходимостью обрабатывать большие массивы текстовой информации. Тексты на естественном языке – слабоструктурированная информация, поэтому их обработка представляет собой непростую задачу, выходящую за рамки традиционной алгоритмической обработки структурированных данных. Для того, чтобы получить из текстов полезную информацию, необходимы специальные подходы и методы, разработкой которых мы и будем заниматься в рамках проектов AI-NLP.
AI-NLP: Intelligent Virtual Assistant – Как научить машину разговаривать и выполнять наши команды?
В 2016 года число пользователей мессенджеров превысило количество пользователей социальных сетей. По оценкам многих экспертов, скоро мессенджеры на мобильных устройствах заменят многие приложения и даже функции операционных систем. Кроме того, с развитием интернета вещей и технологий умного дома возрастает необходимость коммуникации человека и искусственных устройств с помощью естественного языка. Интеллектуальный виртуальный ассистент – это программа, которая помогает человеку решать его задачи, общаясь с ним на естественном языке. Такой ассистент может быть встроен в любое техническое устройство, от мобильного телефона до холодильника. Задача этого направления состоит в создании виртуальных ассистентов различного назначения с применением передовых достижений компьютерной лингвистики и искусственного интеллекта.
Необходимые умения: владение Python, технический английский, знание методов анализа текстов и машинного обучения приветствуется.
Ключевые слова: диалоговые системы, чат-боты, лингвистический анализ текстов, синтез текстов, мультимодальность, машинное обучение.
Примерные темы:
- Создание чат-бота, поддерживающего беседу на произвольную или заданную тему, в том числе от лица некоторого персонажа
- Создание интеллектуального виртуального ассистента узкого назначения (банковский, медицинский, ассистент-психотерапевт, консультант и т.п.)
- Разработка методов синтеза текстов на естественном языке
- Моделирование эмоций в диалоге
- Мультимодальные виртуальные ассистенты
AI-NLP: Text Mining & Understanding – Что содержат тексты и может ли машина понимать тексты?
Сегодня значительная часть неструктурированной информации представлена в виде текстов на естественных языках. Эта информация содержит много полезных данных и знаний, необходимых для решения различных задач. Как научить машину находить в текстах ответы на вопросы, выполнять логический вывод по текстам? Можно ли автоматически построить психологический портрет автора текста и понять его намерения? Для решения этих вопросов необходимо применять методы глубокого анализа текстов и искусственного интеллекта.
Необходимые умения: владение Python, технический английский, знание методов анализа текстов и машинного обучения приветствуется.
Ключевые слова: интеллектуальный анализ текстов, понимание текстов, извлечение информации, машинное обучение.
Примерные темы:
- Рассуждения по текстам
- Поиск в текстах ответов на вопросы
- Атрибуция текстов: определение пола, возраста автора и т.п.
- Извлечение информации и знаний из текстов
- Психолингвистический анализ текстов
- Составление психологических портретов пользователей социальных сетей
Участие в проектах по направлению «Анализ естественного языка» позволит вам:
- познакомиться с основами анализа естественного языка;
- под руководством опытных наставников получить практические навыки компьютерной обработки текстов;
- получить доступ к высокопроизводительным вычислительным установкам для проведения необходимых экспериментов;
- реализовать своего чат-бота или виртуального ассистента;
- успешно написать/защитить курсовую/выпускную работу и получить все необходимые знания для продолжения научной работы по тематике «искусственный интеллект», «анализ естественного языка», «диалоговые системы», «обработка текстов».