Abstract: This paper introduces the human-curated Pandas-PlotBench dataset, designed to evaluate language models’ effectiveness as assistants in visual data exploration. Our benchmark focuses on ...
Sommige resultaten zijn verborgen omdat ze mogelijk niet toegankelijk zijn voor u.
Niet-toegankelijke resultaten weergeven