(常用)数据集:为某个目的(如分析、训练模型、统计研究)而整理在一起的一组数据,通常按一定结构或规则组织。
/ˈdeɪtəˌsɛt/;/ˈdætəˌsɛt/
The dataset contains 10,000 images.
这个数据集包含一万张图片。
After cleaning the dataset, we found that missing values were concentrated in older records, which changed our final conclusions.
清洗数据集后,我们发现缺失值主要集中在较早的记录中,这改变了我们的最终结论。
dataset 由 data(数据)+ set(集合)构成,字面意思是“数据的集合”。其中 data 来自拉丁语 datum(“给出的东西”),后来在英语中发展为表示信息与数据的常用词。