ACL | 2022

Dataset Debt in Biomedical Language Modeling

J. Fries, et al

Abstract

This paper finds that only 13% of biomedical datasets are available via programmatic access and 30% lack documentation on licensing and permitted reuse, highlighting the dataset debt in biomedical NLP.

Read the paper

Dataset Debt in Biomedical Language Modeling

Abstract

How do you want to work with Snorkel?