Pytorch数据读取¶

torch.utils.data¶

声明：torch.utils.data.DataLoader(dataset, batch_size=1, shuffle=None, sampler=None, batch_sampler=None, num_workers=0, collate_fn=None, pin_memory=False, drop_last=False, timeout=0, worker_init_fn=None, multiprocessing_context=None, generator=None, , prefetch_factor=None, persistent_workers=False, pin_memory_device=''*)
参数解释：
dataset：torch.utils.data.dataset类型对象
drop_last：如果batch_size不能整除数据集长度，此时最后一个batch大小会不足一个batch_size大小，drop_last为真时将会删去这个batch。

Dataset基类，实际项目中往往需要以此类为父类建立子类，子类必须重载__getitem__和__len__这两个函数。
声明：torch.utils.data.Dataset(args, *kwds)
重载的__getitem__函数形式为def __getitem__(self, index),其中index参数表示索引，此函数返回对应索引对应的数据（包括输入、输出等）；重载的__len__函数形式为def __len__(self),返回数据集的长度。