2013-10-07 16:05:46 +0000 2013-10-07 16:05:46 +0000
21
21
Advertisement

Скачать ВСЕ Папки, Вложенные Папки и Файлы с помощью Wget

Advertisement

Я использовал Угета и столкнулся с проблемой. У меня есть сайт, на котором есть несколько папок и подпапок. Мне нужно загрузить все содержимое в каждой папке и вложенной папке. Я попробовал несколько методов с помощью Wget, и когда я проверяю завершение, все, что я вижу в папках - это “индексный” файл. Я могу кликнуть на индексный файл, и он приведет меня к файлам, но мне нужны реальные файлы.

есть ли у кого-нибудь команда для Wget, которую я пропустил, или есть другая программа, которую я мог бы использовать, чтобы получить всю эту информацию? Пример сайта

:

www.mysite.com/Pictures/ в Диспетчере рисунков есть несколько папок……

www.mysite.com/Pictures/Accounting/

www.mysite.com/Pictures/Managers/North America/California/JoeUser.jpg

Мне нужны все файлы, папки и т.д…….

Advertisement

Ответы (3)

38
38
38
2013-10-07 16:23:25 +0000

Хочу предположить, что ты не пробовал этого:

wget -r --no-parent http://www.mysite.com/Pictures/

или получить содержимое без загрузки файлов “index.html”:

wget -r --no-parent --reject "index.html\*" http://www.mysite.com/Pictures/

Ссылка: Использование wget для рекурсивного извлечения каталога с произвольными файлами в нем

20
20
20
2014-12-20 09:22:17 +0000

Я использую wget -rkpN -e robots=off http://www.example.com/

-r означает рекурсивно

-k означает преобразование ссылок. Таким образом, ссылки на веб-странице будут локальными, а не example.com/bla

-p означает получить все ресурсы веб-страницы, чтобы получить изображения и javascript-файлы для корректной работы сайта.

-N означает получение временных меток, поэтому если локальные файлы новее файлов на удаленном веб-сайте, пропустите их.

-e - это флаг, который должен быть там, чтобы robots=off работал.

robots=off означает игнорировать файл робота.

у меня также была опция -c в этой команде, поэтому если они оборвут соединение, если оно продолжится с того места, где оно было прервано при повторном запуске команды. Я подумал, что -N будет хорошо работать с -c.

1
Advertisement
1
1
2014-12-20 09:11:52 +0000

wget -m -A * -pk -e robots=off www.mysite.com/ загрузит все типы файлов локально и укажет на них из html файла и проигнорирует файл робота.

Похожие вопросы

19
5
8
5
15
Advertisement
Advertisement