Инструменты пользователя

Инструменты сайта


wget

Различия

Показаны различия между двумя версиями страницы.

Ссылка на это сравнение

wget [2019/06/20 12:52]
wget [2020/06/13 13:47] (текущий)
Строка 1: Строка 1:
 +====== Утилита wget ======
  
 +~~Title: Примеры использования wget ~~
 +{{htmlmetatags>
 +metatag-description=(Примеры использования утилиты wget для Linux и Windows.)
 +}}
 +
 +{{::wget-logo.jpg?nolink&400|}}
 +
 +
 +  * [[https://sourceforge.net/projects/tumagcc/files/|Скачать wget для Windows]]
 +
 +**wget** - консольная программа для загрузки файлов по сети. Wget как WWW робот. <note>[[wput]] -полная противоположность программы wget. Программа может загружать файлы на FTP-серверы с помощью простого интерфейса командной строки, похожего на интерфейс wget.</note>
 +
 +<note>cURL альтернатива wget.</note>
 +
 +Ключи утилиты wget:
 +  * -r рекурсивно обойти каталоги и подкаталоги на удалённом сервере с глубиной заданной параметром -l
 +  * -l максимальная глубина рекурсии
 +  * -k,  --convert-links делать ссылки локальными в загруженном [[HTML5]] или [[CSS]]
 +  * -c,  --continue продолжить загрузку ранее частично загруженного файла
 +  * -P определить месторасположение копируемых файлов, по умолчанию всё будет сохраняться в рабочей директории wget
 +  * -O,  --output-document=FILE записать документ в файл/переименовать скачиваемый файл.
 +
 +  * **Рекурсивно скачать сайт [[http://www.mm6world.ru|www.mm6world.ru]]:**<file bash>
 +wget -r -l4 -k http://www.mm6world.ru -P $HOME/temp -c
 +</file>
 +===== Сохранение удаленной страницы на сервер с сжатием =====
 +
 +<file bash>
 +wget http://www.site.com/page15.html -O - | gzip > /path/to/local/file/`date +%d.%m.%y.%R`.html.gz
 +</file bash>
 +===== wget скачать файл с переименованием =====
 +
 +Скачивание файла Lite_PHP_BrowsCapINI и сохранение его под именем lite_php_browscap.ini в заданной директории<file bash>
 +wget -c http://browscap.org/stream?q=Lite_PHP_BrowsCapINI -O /usr/share/lite_php_browscap.ini
 +</file>
 +===== wget cкачать лендинг =====
 +
 +Скачать любой лендинг пейдж, сайт на Wordpress и прочих платформах CMS, вместе со стилями CSS, изображениями, скриптами, шрифтами, текстовым контентом. Команда для консоли Windows cmd. Позволяет скачивать HTTPS сайты:<file bash>
 +wget --page-requisites -r -l 10 --no-check-certificate сайт.ru
 +</file>
 +Вариант 2 (не тестировал):
 +<file bash>
 +wget —no-parent -nd -k -p -H -E -K —restrict-file-names=windows http://сайт
 +</file>
 +===== Загрузка всех URL, указанных в файле (вариант для Windows) =====
 +<file bash>
 +$ wget -i FILE
 +</file>
 +
 +Мне понадобилось скачивать много картинок с вебсайтов, зная их URL. Делюсь тем как я это делаю под Windows 10.
 +
 +  - [[https://sourceforge.net/projects/tumagcc/files/|Скачать wget для Windows]]
 +  - Распаковать в директорию wget, в моем случае chdir /D d:\wget
 +  - В диалоговом окне "Выполнить" (Windows+R), набираем cmd, жмем выполнить
 +  - В cmd переходим в нужную директорию, при помощи команды<file bash>
 +chdir /D d:\wget
 +</file>
 +  - создаем текстовый файл downloads.txt, каждая строка в которой это отедльный url
 +<file bash>
 +d:\wget>wget -i downloads.txt
 +</file>
 +{{ ::wget-cmd-01.jpg?nolink&600 |}}
Kwork.ru - услуги фрилансеров от 500 руб.