?今天在win10使用git bash的wget下载数据集时,发现出现了404 not found,但是同一个url复制在浏览器中可以访问并下载。
仔细对比后发现shell中的url后面多了个'%0D',经过一顿查询和尝试解决了这个问题。
https://s3.amazonaws.com/kinetics/400/train/part_1.tar.gz
--2021-09-11 18:03:36-- https://s3.amazonaws.com/kinetics/400/train/part_1.tar.gz%0D
Resolving s3.amazonaws.com (s3.amazonaws.com)... 52.217.129.112
Connecting to s3.amazonaws.com (s3.amazonaws.com)|52.217.129.112|:443... connected.
HTTP request sent, awaiting response... 404 Not Found
2021-09-11 18:03:37 ERROR 404: Not Found.
这个'%0D'是'\r'的编码,windows的crlf格式以两个字符来'\r\n'作为换行符,但在shell中只有最后的'\n'被识别为换行符,前面的'\r'自然就变成了'%0D'。
??
解决:
将WINDOWS(CRLF)的换行符格式转变成UNIX(LF)即可,具体教程有很多,可以自查。
如图即可正常wget下载。
?
|