switch-base-8-finetuned

This model is a fine-tuned version of google/switch-base-8 on the SemEval-2018-Task-2 emojis english dataset with Federated Learning in IID setting. It achieves the following results on the evaluation set:

Accuracy: 50.750 %
Mac-F1: 37.355 %

Model description

More information needed

Model type: Language model
Language(s) (NLP): English
License: Apache 2.0
Related Models: All Switch Transformers Checkpoints
Original Checkpoints: All Original Switch Transformers Checkpoints
Resources for more information:

Training hyperparameters

The following hyperparameters were used during training:

learning_rate: 1e-4
train_batch_size: 464
eval_batch_size: 512
seed: 42
num_epochs: 30

Testing results

SemEval Testing Data	accuracy	Mac-F1
"Tubingen-Oslo" First SemEval Team	47.09%	35.99%
switch-base-8-finetuned-SemEval-2018-emojis-cen-1	48.040%	33.239%
switch-base-8-finetuned-SemEval-2018-emojis-cen-2	50.174%	36.660%
switch-base-8-finetuned-SemEval-2018-emojis-IID-Fed	50.750%	37.355%

Google colab to test the models on SemEval test dataset : The Notebook

Framework versions

Transformers 4.25.1
Pytorch 1.13.1+cu116
Tokenizers 0.13.2

Downloads last month: 1

Safetensors

Model size

0.6B params

Tensor type

BF16

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Spaces using Karim-Gamal/switch-base-8-finetuned-SemEval-2018-emojis-IID-Fed 3

Paper for Karim-Gamal/switch-base-8-finetuned-SemEval-2018-emojis-IID-Fed

Switch Transformers: Scaling to Trillion Parameter Models with Simple and Efficient Sparsity

Paper • 2101.03961 • Published Jan 11, 2021 • 13