😎 » Як встановити та користуватись Wayback Machine Downloader
38 0  

Як встановити та користуватись Wayback Machine Downloader

Як встановити та користуватись Wayback Machine Downloader на Віндовс і команди для завантаження сайтів з вебархіву.

Репозиторй Wayback Machine Downloader - дивитись.

1. Встановити Ruby - Завантажити тут
Я ставив версію 2.7, так як на репозиторії Wayback Machine Downloader рекомендують більше версії 1.9. Тут звичайний віндовський інсталятор - всі галочки мають бути активні, по замовчуванню. ПІсля встановлення заходимо в -

2. Пуск - Start Command Prompt with Ruby - запуститься вікно з командним рядком.
ПІсля введення команди: gem install wayback_machine_downloader
дочекайтесь такого тексту:

C:\Users\games>gem install wayback_machine_downloader
Fetching wayback_machine_downloader-2.3.1.gem
Successfully installed wayback_machine_downloader-2.3.1
Parsing documentation for wayback_machine_downloader-2.3.1
Installing ri documentation for wayback_machine_downloader-2.3.1
Done installing documentation for wayback_machine_downloader after 0 seconds
1 gem installed

:winked: Wayback Machine Downloader встановлено на ваш віндовс.

Як завантажити сайт?

Додатковою командою --directory можна вказати утиліті, куди потрібно завантажувати файли. Однак необхідно враховувати, що за умовчанням утиліта вважає основною директорією шлях c:UsersAdmin, тому, найімовірніше, завантажені файли треба буде шукати саме там.

Наприклад, якщо задати Wayback machine downloader команду --directory d://1/, то утиліта завантажуватиме файли по шляху c:\Users\Admin\D%3a\1\.

wayback_machine_downloader http://supersite.com --directory downloaded-backup/  --from 20060716231334  --to 20100916231334

Щоб завантажити точний URL

wayback_machine_downloader http://example.com --exact-url


Інші команди waybac:

  •     -d, --directory PATH             Directory to save the downloaded files into Default is ./websites/ plus the domain name
  •     -s, --all-timestamps             Download all snapshots/timestamps for a given website
  •     -f, --from TIMESTAMP          Only files on or after timestamp supplied (ie. 20060716231334)
  •     -t, --to TIMESTAMP             Only files on or before timestamp supplied (ie. 20100916231334)
  •     -e, --exact-url                      Download only the url provided and not the full site
  •     -o, --only ONLY_FILTER       Restrict downloading to urls that match this filter (use // notation for the filter to be treated as a regex)
  •     -x, --exclude EXCLUDE_FILTER     Skip downloading of urls that match this filter (use // notation for the filter to be treated as a regex)
  •     -a, --all                        Expand downloading to error files (40x and 50x) and redirections (30x)
  •     -c, --concurrency NUMBER         Number of multiple files to download at a time Default is one file at a time (ie. 20)
  •     -p, --maximum-snapshot NUMBER    Maximum snapshot pages to consider (Default is 100) Count an average of 150,000 snapshots per page
  •     -l, --list                       Only list file urls in a JSON format with the archived timestamps, won't download anythin


Альтернативною програмою, для ЗВИЧАЙНИХ САЙТІВ  є  WGET для Віндовс  - це теж консольна програма.



Залишити свій коментар:

Досвід у веброзробці:

2009
2010
2011
2012
2013
2014
2015
2016
2017
2018
2019
2020
2021
2022
2023
2024
2025
2026
2027
2028
2009
2023