G-Transformer

This code is for ACL 2021 paper G-Transformer for Document-level Machine Translation.

Python Version: Python3.6

Package Requirements: torch==1.4.0 tensorboardX numpy==1.19.0

Framework: Our model and experiments are built upon fairseq. We use a snapshot version between 0.9.0 and 1.10.0 as our initial code.

Before running the scripts, please install fairseq dependencies by:

    pip install --editable .

Please also follow the readmes under folder raw_data and mbart.cc25 to download raw data and pretrained model. (Notes: Our models were trained on 4 GPUs. If you trained them on 2 GPUs, in theory you could double the number for argument --update-freq. However, we haven't tested such settings.)

Non-pretraining Settings

G-Transformer random initialized

Prepare data:

    mkdir exp_randinit
    bash exp_gtrans/run-all.sh prepare-randinit exp_randinit

Train model:

    CUDA_VISIBLE_DEVICES=0,1,2,3 bash exp_gtrans/run-all.sh run-randinit train exp_randinit

Evaluate model:

    bash exp_gtrans/run-all.sh run-randinit test exp_randinit

G-Transformer fine-tuned on sent Transformer

Prepare data:

    mkdir exp_finetune
    bash exp_gtrans/run-all.sh prepare-finetune exp_finetune

Train model:

    CUDA_VISIBLE_DEVICES=0,1,2,3 bash exp_gtrans/run-all.sh run-finetune train exp_finetune

Evaluate model:

    bash exp_gtrans/run-all.sh run-finetune test exp_finetune

Pretraining Settings

G-Transformer fine-tuned on mBART25

Prepare data:

    mkdir exp_mbart
    bash exp_gtrans/run-all.sh prepare-mbart exp_mbart

Train model:

    CUDA_VISIBLE_DEVICES=0,1,2,3 bash exp_gtrans/run-all.sh run-mbart train exp_mbart

Evaluate model:

    bash exp_gtrans/run-all.sh run-mbart test exp_mbart

Name		Name	Last commit message	Last commit date
Latest commit History 35 Commits
baselines		baselines
docs		docs
examples		examples
exp_gtrans		exp_gtrans
fairseq		fairseq
fairseq_cli		fairseq_cli
mbart.cc25		mbart.cc25
raw_data @ 47a2b96		raw_data @ 47a2b96
scripts		scripts
tests		tests
.gitmodules		.gitmodules
CODE_OF_CONDUCT.md		CODE_OF_CONDUCT.md
LICENSE		LICENSE
README.md		README.md
generate.py		generate.py
hubconf.py		hubconf.py
preprocess.py		preprocess.py
pyproject.toml		pyproject.toml
setup.py		setup.py
train.py		train.py
utils.py		utils.py
validate.py		validate.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

G-Transformer

Non-pretraining Settings

G-Transformer random initialized

G-Transformer fine-tuned on sent Transformer

Pretraining Settings

G-Transformer fine-tuned on mBART25

About

Releases

Packages

Languages

License

baoguangsheng/g-transformer

Folders and files

Latest commit

History

Repository files navigation

G-Transformer

Non-pretraining Settings

G-Transformer random initialized

G-Transformer fine-tuned on sent Transformer

Pretraining Settings

G-Transformer fine-tuned on mBART25

About

Resources

License

Code of conduct

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages