方法:
可以借助github或者gitee间接将批量数据集上传到colab
如果你想将文件快速上传到google drive ,也可以尝试这种方式,将下面提到的数据集视为你要上传的文件即可。
由于如果直接从github/gitee平台上传数据集的话,一次上传有文件数量的限制。这里利用了本地api上传,借助git来上传。
推荐用gitee,服务器在国内,上传较快,以gitee为例,说明过程:
1,在gitee新建仓库。

2.设置为公开

3.下载git并安装(已经有的跳转下一步)
官网:https://git-scm.com/
windows版本

4.将要上传的文件夹设置为git仓库
4.1 git bash here

4.2 配置用户名以及邮箱
git config --global user.name "xxx"
git config --global user.email "xxx"
4.3 初始化本地环境,把该项目变成可被git管理的仓库,添加该项目下的所有文件
git init
git add .
4.4 将本地代码库与远程代码库相关联
git remote add origin https://gitee.com/moluggg/datasets
格式为:git remote add origin https://gitee.com/gitee用户名/仓库名
4.5 强制把远程仓库跟新到当前分支上面
ps:如果仓库为空这一步可以跳过
git pull --rebase origin master
4.6 将本地代码推送到指定远程的仓库中
git push -u origin master

5.在google colab上载
from google.colab import drive
drive.mount('/content/drive')
colab装在google drive,并选择你将要上载到的位置:
!ls
%cd /content/drive/MyDrive/XX
上载gitee仓库数据集

!git clone https://gitee.com/moluggg/datasets.git

|