ML/DL 공부하는 방

[Feedback Prize - English Language Learning] Speeding up Transformer w/ Optimization Strategies

November 14, 2022 22 분 소요

Introduction state-of-the-art 또는 SOTA model을 훈련시키기 위해서는 GPU가 절대적으로 필요합니다. 그리고 Google Colab이나 Kaggle에서 사용할 수 있다고 해도 메모리 제약 문제가 여전히 발생합니다.

November 9, 2022 44 분 소요

SWA-LP & Interpreting Transformer Interactively

November 5, 2022 13 분 소요

DeBERTa LLRD + LastLayerReinit with TensorFlow MultilabelStratifiedKFold split of the data

November 2, 2022 2 분 소요

[공지사항] “출처: https://syslog.ravelin.com/classification-with-tabnet-deep-dive-49a0dcc8f7e8”

October 29, 2022 7 분 소요

출처: https://arxiv.org/abs/2006.03654