Як встановити та користуватись Wayback Machine Downloader
Як встановити та користуватись Wayback Machine Downloader на Віндовс і команди для завантаження сайтів з вебархіву.
Репозиторй Wayback Machine Downloader - дивитись.
1. Встановити Ruby - Завантажити тут
Я ставив версію 2.7, так як на репозиторії Wayback Machine Downloader рекомендують більше версії 1.9. Тут звичайний віндовський інсталятор - всі галочки мають бути активні, по замовчуванню. ПІсля встановлення заходимо в -
2. Пуск - Start Command Prompt with Ruby - запуститься вікно з командним рядком.
ПІсля введення команди: gem install wayback_machine_downloader
дочекайтесь такого тексту:
C:\Users\games>gem install wayback_machine_downloader
Fetching wayback_machine_downloader-2.3.1.gem
Successfully installed wayback_machine_downloader-2.3.1
Parsing documentation for wayback_machine_downloader-2.3.1
Installing ri documentation for wayback_machine_downloader-2.3.1
Done installing documentation for wayback_machine_downloader after 0 seconds
1 gem installed
:winked: Wayback Machine Downloader встановлено на ваш віндовс.
Як завантажити сайт?
Додатковою командою --directory можна вказати утиліті, куди потрібно завантажувати файли. Однак необхідно враховувати, що за умовчанням утиліта вважає основною директорією шлях c:UsersAdmin, тому, найімовірніше, завантажені файли треба буде шукати саме там.
Наприклад, якщо задати Wayback machine downloader команду --directory d://1/, то утиліта завантажуватиме файли по шляху c:\Users\Admin\D%3a\1\.
wayback_machine_downloader http://supersite.com --directory downloaded-backup/ --from 20060716231334 --to 20100916231334
Щоб завантажити точний URL
wayback_machine_downloader http://example.com --exact-url
Інші команди waybac:
- -d, --directory PATH Directory to save the downloaded files into Default is ./websites/ plus the domain name
- -s, --all-timestamps Download all snapshots/timestamps for a given website
- -f, --from TIMESTAMP Only files on or after timestamp supplied (ie. 20060716231334)
- -t, --to TIMESTAMP Only files on or before timestamp supplied (ie. 20100916231334)
- -e, --exact-url Download only the url provided and not the full site
- -o, --only ONLY_FILTER Restrict downloading to urls that match this filter (use // notation for the filter to be treated as a regex)
- -x, --exclude EXCLUDE_FILTER Skip downloading of urls that match this filter (use // notation for the filter to be treated as a regex)
- -a, --all Expand downloading to error files (40x and 50x) and redirections (30x)
- -c, --concurrency NUMBER Number of multiple files to download at a time Default is one file at a time (ie. 20)
- -p, --maximum-snapshot NUMBER Maximum snapshot pages to consider (Default is 100) Count an average of 150,000 snapshots per page
- -l, --list Only list file urls in a JSON format with the archived timestamps, won't download anythin
Альтернативною програмою, для ЗВИЧАЙНИХ САЙТІВ є WGET для Віндовс - це теж консольна програма.