Skip to content

Pupy101/Challenge-2021-NLP

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

8 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Кейс-чемпионат Changellenge >> Cup IT 2021

Была поставлена задача обучения классификатора, который должен определять по входным данным (двум пердложениям) следующие классы:

  1. entailment (из параграфа 1 следует параграф 2)
  2. contradiction (параграф 1 противоречит параграфу 2)
  3. neutral (в параграфе 1 и параграфе 2 содержится схожая по смыслу информация)

Данные от Стэмфордского университета представлены в виде хорошо размеченного датасета в котором имеются обучающая/валиационная и тестовая выборки.

Пример данных издатасета:

image

Корпус был приведен к нижнему регистру и нормализован с помощью библиотеки spaCy, также была отброшена находившаяся в датасете разметка для графовых сетей.

После предобработки: image

Лэйблы данных распределены следующим образом:

image

Первой была обучена простая сверочная модель c 1D свертками:

image

Результаты CNN:

image

Второй моделью стала рекуррентная сеть на основе BiLSTM:

image

Результаты RNN:

image

Ноутбук с обучением.

Третьей моделью была сделана рекуррентная сеть с изменённой архитектурой:

image

Результаты BiLSTM + feature generation:

image

Ноутбук обучения поледней модели.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published