#加载某类文件作为数据集
dataset = load_dataset("json", data_files="./train_pair_1w.json", split="train")
?
#加载数据集中的子数据集
datasets = load_dataset("clue",name="afqmc")
train_dataset=datasets[“train”]
#构造数据集
try_dataset=train_dataset[:10]
dataset = Dataset.from_dict(try_dataset)
dataset_dict = DatasetDict({'train': dataset})
dataset_dict才可以使用map方法