Download Article
Mirror a website to your computer with this simple tool
Download Article
HTTrack is a free and open source web crawler you can use to download entire websites. By default, HTTrack arranges the downloaded site by the original site’s relative link-structure. Once you download a website with HTTrack, you can browse it in your preferred web browser. This wikiHow will teach you how to use HTTrack on Windows or Linux to download a website to your PC.
-
You can download it from https://www.httrack.com. The software is available on both Windows and Linux.
-
This will be the name of the folder containing your project. One project can include copies of multiple websites.
Advertisement
-
The default path creates a websites directory in your home directory, but you can choose another location if you’d like.
-
-
Click the menu at the top, and choose the option that fits what you want to do. The most common options are:
- Chose Download web site(s) to mirror a website with its default options.
- Choose Download website(s) + questions if you want to be prompted about links to download.[1]
-
If you’re downloading multiple websites, place each URL on a separate line.
- You can click Set options… to choose other options, including certain file types to download or skip, recursion preferences, and the address of your proxy server.
-
-
If you want, you can choose options such as delaying the start of the downloading or disconnecting when finished first.
-
HTTrack will now download the websites you entered with your preferred preferences.
Advertisement
Add New Question
-
Question
Can I use HTTrack to copy all of the code on a website? Also, can I use this code to develop on my own site?
Ollie Potterton
Community Answer
It depends. If you’re planning to rip the website from a forum or from big websites, those websites depend on scripts located outside of the website, so the code is only compatible with that website. I suppose if it’s a small website and doesn’t depend on a database, then that might work.
Ask a Question
200 characters left
Include your email address to get a message when this question is answered.
Submit
Advertisement
Thanks for submitting a tip for review!
About This Article
Thanks to all authors for creating a page that has been read 158,950 times.
Is this article up to date?
Программа httrack website copier представляет собой мощный инструмент для копирования веб-сайтов. Она позволяет скачивать и сохранять веб-страницы, файлы и другие ресурсы с любого сайта. Если вы хотите сохранить информацию с интересующего вас веб-ресурса целиком или выборочно, то httrack website copier может стать вашим незаменимым помощником.
Для начала работы с программой вам потребуется запустить WinHTTrack Website Copier. После входа в программу вы можете менять настройки в соответствии с вашими потребностями. Затем выберите веб-сайт, который вы хотите скопировать. Программа позволяет использовать фильтры, чтобы ограничить копирование только нужной информации. Вы можете указать, какие типы файлов нужно скачивать, а какие – игнорировать. Также можно задать ограничения на глубину копирования или количество страниц.
Одним из ограничений httrack website copier является защита авторских прав. Программа не позволяет копировать сайты, защищенные авторским правом или запрещающие копирование. Для тестирования и обучения вы можете использовать публичные сайты, на которых размещена информация, доступная для свободного скачивания.
Поздравляю, вы готовы начать копирование сайта! После выбора всех необходимых опций и настроек, программа начнет скачивание и сохранение всех файлов и страниц сайта. В процессе скачивания вы можете следить за прогрессом и отслеживать возможные ошибки с помощью встроенной системы диагностики. Также можно просмотреть таблицу зеркал, которая покажет, как выглядит скопированный сайт в сравнении с оригиналом.
Как пользоваться программой httrack website copier
Программа httrack website copier позволяет создавать копии веб-сайтов для офлайн просмотра. Для использования программы необходимо запустить WinHTTrack Website Copier.
1. Запустите программу WinHTTrack Website Copier.
2. В открывшемся окне выберите нужную вам папку для сохранения скопированных файлов.
3. Введите URL-адрес сайта, который вы хотите скопировать, в поле “Web address (URL)”.
4. Нажмите кнопку “Next”, чтобы перейти к следующему шагу.
5. Выберите желаемые параметры копирования:
- Фильтры: можно указать, какие файлы и страницы нужно скопировать, а какие исключить. Например, можно скопировать только страницы с определенным расширением или только файлы из определенной директории.
- Структура сайта: можно указать, как нужно сохранять структуру сайта в скопированной копии. Например, можно сохранить только главную страницу и все ссылки на другие страницы, или можно сохранить все страницы сайта в исходной структуре.
- Ограничения копий: можно указать, какие файлы и страницы нужно исключить из копии. Например, можно исключить файлы большого размера или страницы, требующие авторизации.
6. Нажмите кнопку “Next” и дождитесь завершения процесса копирования.
7. После завершения копирования можно открыть скопированный сайт в любом веб-браузере, открыв файл index.html в папке, указанной в шаге 2.
Важно учитывать, что при использовании программы httrack website copier необходимо соблюдать этичные принципы и права авторов. Необходимо учитывать ограничения копирования, указанные на сайте, и не копировать информацию, защищенную авторскими правами без разрешения владельца.
В заключение, программа httrack website copier является удобным инструментом для создания офлайн-копий веб-сайтов. Она позволяет скопировать нужную информацию с сайта и сохранить ее на жестком диске для последующего просмотра. Однако, перед использованием программы, необходимо учитывать ограничения копирования и обеспечивать безопасность своего компьютера, чтобы избежать загрузки вредоносного ПО.
Запуск WinHTTrack Website Copier
Для начала скачайте и установите программу WinHTTrack Website Copier с официального сайта. После установки запустите программу.
Окно ввода
После запуска программы откроется окно ввода, где вы можете указать адрес сайта, который хотите скопировать. Введите URL сайта в поле “Web address (URL)” и нажмите кнопку “Next”.
Настройки
На следующем окне вы можете настроить параметры скачивания. Здесь вы можете выбрать, какие ссылки и страницы нужно скачать, установить ограничения размера файлов, задать шаблон имен файлов и т. д. Выберите нужные настройки и нажмите кнопку “Next”.
Скачивание
После настройки параметров скачивания программа начнет копировать сайт. В процессе скачивания вы можете следить за прогрессом в окне программы. По завершении скачивания программа покажет уведомление о завершении и поздравит вас с успешным скачиванием.
Дополнительные функции
В программе WinHTTrack Website Copier также есть дополнительные функции, такие как диагностика сайта, тестирование сайта на наличие ошибок, настройка языка программы и другие. Вы можете использовать эти функции, если они вам необходимы.
Вот и всё! Теперь вы знаете, как запустить программу WinHTTrack Website Copier и начать копирование сайта. Удачного использования!
Ограничения копий
Программа httrack website copier предоставляет возможность создания оффлайн-копий веб-сайтов, однако существуют определенные ограничения, которые следует учитывать при использовании данного программного обеспечения.
Во-первых, при копировании статей или других материалов с веб-сайта, необходимо обратить внимание на авторские права. Пользователям следует быть осведомленными о том, что копирование и распространение материалов без разрешения правообладателя может нарушать закон о защите авторских прав.
Во-вторых, программа httrack website copier может иметь ограничения в отношении определенных типов файлов. Например, некоторые файлы могут быть скачаны только в оригинальном формате, без возможности изменения или просмотра содержимого. Также может быть ограничение на скачивание файлов большого размера или файлов определенного типа.
Для более точной настройки процесса скачивания, пользователи могут использовать фильтры, которые позволяют исключать определенные типы файлов или ограничивать глубину копирования страниц. Однако следует помнить, что использование фильтров может привести к тому, что некоторые страницы или файлы не будут скопированы.
Также стоит отметить, что программа httrack website copier не всегда может полностью скопировать веб-сайт. Некоторые сайты могут быть защищены от копирования или иметь сложную структуру, которая затрудняет процесс копирования. В таких случаях можно попробовать использовать альтернативные программы, например, WebTransporter или SiteSucker.
В заключение, при использовании программы httrack website copier для создания оффлайн-копий веб-сайтов, необходимо быть этичным и учитывать авторские права. Также следует быть внимательным при выборе настроек скачивания и учитывать возможные ограничения программы.
Как просмотреть то, что мы скачали
После того, как вы скачали нужную вам часть интернета с помощью программы httrack website copier, вы можете просмотреть скачанный контент. Для этого вам понадобится запустить WinHTTrack Website Copier и выбрать опцию “Просмотреть скачанное” в главном меню.
При просмотре скачанного контента вы можете найти список папок и файлов, которые были скачаны с сайта. Каждая папка соответствует определенной части сайта, а файлы внутри папок представляют собой страницы, изображения и другой контент, присутствующий на сайте.
В верхней части окна программы вы можете увидеть адрес сайта, с которого был скачан контент. Вы также можете увидеть размер скачанного контента и версию программы httrack website copier, которая была использована для скачивания.
Для просмотра страниц сайта вы можете выбрать нужную папку и открыть файл с расширением “.html” в браузере. Вы также можете просматривать изображения, открывая файлы с расширением “.jpg” или “.png”.
Если во время скачивания был задан пароль, то для просмотра защищенных страниц вам потребуется ввести пароль. Вы можете ввести пароль в окне логина, которое появится при открытии защищенной страницы.
Обратите внимание, что при просмотре скачанного контента вы можете столкнуться с некоторыми ограничениями. Например, некоторые функции сайта могут быть отключены, так как они требуют подключения к интернету. Также, если сайт содержит динамический контент, то его просмотр может быть ограничен.
Для более подробной информации о скачанном контенте вы можете воспользоваться разделом “Диагностика” в главном меню программы. В этом разделе показано количество скачанных страниц, файлов и папок, а также размер скачанного контента.
В заключение, программа httrack website copier позволяет скачивать и просматривать контент с веб-сайтов. Однако, при использовании программы возможны некоторые ограничения, связанные с структурой и функциональностью сайта, а также с размером и количеством скачиваемого контента.
Настройка программы
Для начала работы с программой httrack website copier нужно запустить WinHTTrack Website Copier. После запуска откроется окно программы, в котором можно настроить параметры для копирования веб-сайтов.
Настройка программы производится в нескольких вкладках. В первой вкладке “Base path” нужно указать путь для сохранения скопированного веб-сайта на вашем компьютере. В строке “Base path” введите путь, где хотите сохранить скопированный сайт.
Во второй вкладке “Mirror options” можно выбрать опции для копирования веб-сайта. Здесь можно указать, какие файлы и папки нужно скопировать, а какие исключить. Также можно настроить фильтры для скачивания только определенных типов файлов или ограничить количество файлов, которые нужно скачать.
В третьей вкладке “Limits” можно установить ограничения для копий веб-сайтов. Здесь можно указать, сколько времени программа будет ждать ответа от сервера, прежде чем перейти к следующей странице. Также можно ограничить количество одновременных соединений с сервером и ограничить количество скачиваемых файлов.
В последней вкладке “Browser ID” можно выбрать, какую информацию будет передавать программа при запросе к веб-сайту. Здесь можно выбрать, какой браузер и операционную систему использовать, а также указать язык и включить или выключить поддержку JavaScript.
После настройки всех параметров можно нажать кнопку “Next” и программа начнет копирование выбранного веб-сайта. Процесс копирования может занять некоторое время, в зависимости от размера сайта и скорости вашего интернет-соединения.
Скачивание сайта целиком
Для запуска программы необходимо открыть окно WinHTTrack Website Copier и ввести URL-адрес сайта, который вы хотите скопировать. Вы также можете настроить различные опции, такие как фильтры, чтобы исключить определенные типы файлов или только загрузить страницы определенного размера.
Когда вы нажимаете кнопку “Скопировать сайт”, программа начинает загрузку всех связанных файлов и страниц сайта. Вы можете просмотреть прогресс загрузки в окне программы и в файле журнала, который можно просмотреть далее.
Программа также позволяет изменять user-agent, который используется при загрузке сайта. Это может быть полезно, если вы хотите имитировать доступ к сайту с определенным браузером или устройством.
Ограничения копий сайтов включают максимальное количество файлов, которое можно загрузить (опция maxfilesn
), максимальное время загрузки (опция maxmmstimen
) и максимальное количество ссылок на странице (опция maxmmstimen
). Вы можете изменить эти значения в настройках программы.
Есть также возможность использовать фильтры, чтобы исключить определенные файлы или страницы из загрузки. Например, вы можете использовать фильтр -mime:application/pdf
для исключения всех файлов в формате PDF.
Примечание: при скачивании сайта целиком программа может загрузить большое количество данных, поэтому убедитесь, что у вас достаточно свободного места на жестком диске.
Загрузка паролей и ограничение доступа
Если сайт требует входа и пароля для доступа к определенным страницам, вы можете ввести эти данные в настройках программы, чтобы получить доступ к защищенным разделам сайта.
Если у сайта есть ограничение на количество одновременных соединений или на частоту запросов, вы можете настроить программу, чтобы она загружала данные с определенной задержкой (опция surfoffline
).
Заключение
WinHTTrack Website Copier – бесплатная программа, которая позволяет скачивать целые сайты для оффлайн-просмотра. Она предоставляет множество опций и настроек, которые позволяют контролировать процесс загрузки и фильтровать ненужные данные.
Таким образом, с помощью этой программы вы можете создать полную копию сайта и просматривать его в оффлайн-режиме, что может быть полезно, например, при отсутствии постоянного интернет-соединения или для анализа веб-страниц.
Выборочное скачивание
Для создания копии веб-сайта целиком, без мусора, можно использовать программу WinHTTrack Website Copier. Однако, иногда требуется скачать только определенные страницы или части сайта. В таком случае можно использовать функцию выборочного скачивания.
Для выборочного скачивания веб-сайта в программе WinHTTrack Website Copier необходимо открыть окно “Options” (Настройки) и перейти на вкладку “Scan Rules” (Правила сканирования). Здесь можно задать фильтры для ограничения скачивания только определенных страниц или типов файлов.
Например, если нужно скачать только страницы, содержащие ключевое слово “программа”, можно добавить фильтр “+*программа*” в строку “Scan rules” (Правила сканирования). Также можно использовать другие фильтры, такие как “+*.html” для скачивания только HTML-страниц или “-*.jpg” для исключения из скачивания файлов с расширением JPG.
Ограничение выборочного скачивания также можно задать в разделе “Limits” (Ограничения) в окне “Options” (Настройки). Здесь можно указать максимальное количество страниц или размер скачиваемых файлов.
При использовании выборочного скачивания важно помнить о безопасности. Некоторые веб-сайты могут содержать вредоносный код или ссылки на небезопасные ресурсы. Поэтому рекомендуется быть внимательным при выборе страниц для скачивания и использовать антивирусное программное обеспечение.
Поэтому приведем некоторые рекомендации по настройкам и общим принципам загрузки сайтов из сети Интернет.
1. В зависимости от типа закачиваемого на компьютер сайта, исключайте из загрузок файлы с ненужными расширениями.
Пример: при загрузке фалов рефератов можно исключить GIF, PNG, и видео-форматы, но при этом явно указать программе загружать ZIP, RAR, TAR, GZ, TGZ и другие архивы, в которых хранятся рефераты.
2. В закладке «Ограничения» максимальную глубину вложений можно выбрать методом экспериментов, достаточно выбрать параметр 10 и следить за типом загружаемых файлов.
3. Внимательно отнеситесь к параметрам Пауза после загрузки, Скорость закачки и Максимальное число соединений — они отвечают за то, как быстро сервер определит что на нем находится не человек а работ и заблокирует ваш IP.
Здесь хорош принцип — тише едешь, дальше будешь, который означает что лучше выставить меньшую скорость и больший тайм-аут между закачками, чем ждать пока сайт разблокирует ваш IP.
4. В разделе «Структура» выбирается вид, в котором сайт будет сохранен на компьютер. Вы сможете просмотреть его в любом случае, просто выберите вид в котором вам будет удобнее ориентироваться.
5. В разделе «Лог, индекс, кэш» установите отметку «Log файлы» и параметр «Обычная» — этого будет достаточно для коррекции настроек загрузки, в зависимости от ошибок, которые будут описаны в лог файле.
6. «Идентификация» — здесь настраивается вид браузера, которым представляется программа для закачиваемого сайта, этот параметр работал раньше, теперь сайты стали умнее и так просто их не обмануть, поэтому смело пропускайте эти настройки.
Содержание
- HTTrack Website Copier
- Как скачивать сайт целиком
- Примечание
- Как просмотреть то, что мы скачали
Наиболее известны такие программы как:
- Offline Explorer ($59.95) и Offline Explorer Pro ($149.95)
- Teleport Pro ($49.95)
- Webcopier ($30)
- И даже такие архаичные как Wget (бесплатна), но необходимо уметь работы с консолью операционной системы.
- Есть даже бесплатный русский сервис Site2Zip.com (я ставил на закачку, но он ничего не скачал).
- HTTrack Website Copier (бесплатна)
А теперь подробнее о последней программе.
HTTrack Website Copier
Выбор небольшой, поэтому наиболее подходящей программой для скачивания сайта будет HTTrack Website Copier. К тому она вполне неплохо справляется с данной задачей.
Есть различные версии программы, которые совместимы с:
- 32-разрядной Windows 2000/XP/Vista/Seven/8
- 64-разрядной Windows Vista/7/8
В настройках можно выбрать русский язык.
Скачать нужную версию мы сможете прямо с официального сайта
Как скачивать сайт целиком
1. Установить программу на свой компьютер.
2. Выберите в настройках русский язык и перезагрузите программу, чтобы интерфейс обновился.
3. Создайте новый проект
- Укажите название проекта.
- В какую папку на ваш компьютер сохранить сайт.
- И нажмите кнопку «Далее».
4. В поле «Веб адреса: (URL)» укажите адрес сайта, который надо скопировать и нажмите на кнопку «Задать параметры».
5. В появившемся окне выставляем параметры скачивания.
Если у вас нет прокси оставляем все как есть и переходим к следующей вкладке «Фильтры».
Внимание: если возникли проблемы со скачиванием — попробуйте снять флажок с опции «Использовать прокси для ftp-закачки».
6. Здесь мы избавляемся от мусора и говорим какие файлы нам скачивать не нужно.
Ставим флажки напротив архивов и видео-файлов. Все расширения добавятся автоматически.
7. Переходим на вкладку «Ограничения».
Я задал максимальную глубину загрузки сайта до трех уровне вложенности. Вы можете указывать другое значение, в зависимости от ваших потребностей.
Максимальную глубину внешних рекомендую устанавливать в нуль, если, конечно, вы не хотите попытаться скачать весь интернет ))
8. Идем на вкладку «Линки».
Можете поставить также все флажки как на этом скриншоте, чтобы скачивание сайта происходило максимально быстро.
9. На вкладке «Структура» выбираем тип локальной структуры зеркала. Я выбрал структуру сайта по умолчанию.
10. Нажимаем кнопку «ОК» и видим такое окно.
Здесь вы можете разорвать соединение после скачивания сайта, если у вас интернет не безлимитный. А также поставить флажок напротив пункта «Shutdown PC when finished», если хотите, чтобы HTTrack сам выключил компьютер, когда сольёт весь сайт.
Можем начать скачивание прямо сейчас или сделать это позже. Нажимаем кнопку «ОК».
11. Начался процесс скачивания сайта.
Примечание
Если вы хотите прервать скачивание, то нажмите кнопку «Отмена». В появившемся окне подтвердите остановку процесса, после чего HTTrack докачает текущие файлы, а новые скачивать не будет.
Сохраниет этот проект у себя на компьютере. Потом, чтобы докачать сайт, снова откроете этот проект и возобновите скачивание.
Вот как это выглядит на диске. Стрелкой отмечена папка, в которой находится скачанный сайт.
Если вы зайдете в нее, то увидите такую структуру.
Как просмотреть то, что мы скачали
Скачанный сайт можно запустить любым способом, например:
- зайти в папку, в которую сохраняли проект, кликнув по файлу
index.html
. После этого откроется страница со списком всех проектов. Нужно выбрать нужный. - или войти в папку с названием проекта, кликнув по файлу
index.html
, чтобы открылся сайт сразу.
Всё. Поздравляю, теперь на вашем компьютере точно такая копия сайта как и в интернете. Пользуйтесь на здоровье!
Напишите, пожалуйста, в комментариях, всё ли понятно написано? Скажите, какими программами вы пользуетесь, когда вам надо бесплатно скачать сайт на компьютер?
Фото: Rawpixel / Shutterstock.com
Автор:
Roger Morrison
Дата создания:
17 Сентябрь 2021
Дата обновления:
19 Ноябрь 2023
Содержание
- Шаг 1
- Шаг 2
- Шаг 3
- Шаг 4
- Шаг 5
- Шаг 6
- Шаг 7
- Шаг 8
- Шаг 9
- Шаг 10
В другой статье, опубликованной на eHow, объясняется, как использовать HTTrack для копирования веб-сайта на ваш компьютер. Что касается сайтов с подпиской или сайтов с аутентификацией, упоминается, что процесс настройки HTTrack выходил за рамки этой статьи. В этой статье будет рассказано, как настроить HTTrack для загрузки сайта, требующего аутентификации.
Шаг 1
Откройте свой браузер (Internet Explorer или Firefox для этого руководства) и перейдите на домашнюю страницу сайта, который вы хотите скопировать. Если вы уже вошли в систему, закройте ее и вернитесь на страницу входа.
Примечание: если веб-сайт, который вы хотите скопировать, не требует аутентификации, вы можете пропустить все это.
Шаг 2
Запустите HTTrack. Нажмите «Далее», введите имя проекта и место, где вы хотите сохранить веб-страницу, и снова нажмите «Далее».
Шаг 3
Нажмите «Добавить URL» в окне HTTrack, где вводится URL. Введите URL-адрес сайта.
Шаг 4
Щелкните «Захватить URL …». Вы заметите, что он предоставит вам несколько параметров прокси для IP-адреса и порта прокси. Теперь вам нужно настроить ваш браузер на временное использование этих параметров прокси.
Шаг 5
В браузере Internet Explorer перейдите в Инструменты> Свойства обозревателя> Подключения> Настройки локальной сети. Установите флажок «Использовать прокси-сервер для вашей локальной сети» и введите настройки прокси-сервера, которые HTTrack предоставил по IP-адресу и порту. Если вы используете Firefox, перейдите в Инструменты> Параметры> Общие> Настройки> Проверка подключения ручных настроек прокси. Нажмите ОК, чтобы сохранить настройки.
Шаг 6
Войдите на сайт, чтобы HTTrack мог зафиксировать логин. Как только вы войдете в браузер, он скажет: «Ссылка захвачена в HTTrack Website Copier, теперь вы можете восстановить свои настройки прокси!». На этом этапе вернитесь к настройкам LAN (или настройкам подключения для Firefox) и отмените настройки прокси-сервера, которые мы сделали на предыдущем шаге. Отключите параметр «Использовать прокси-сервер для локальной сети» для Internet Explorer или установите флажок «Прямое подключение к Интернету» для Firefox.
Шаг 7
Вернитесь к HTTrack, и вы увидите, что захват заменяет ваш URL на путь к постфайлу мошонки на вашем жестком диске. HTTrack захватил информацию об аутентификации, требуемую веб-сайтом, и скопировал ее в этот почтовый файл, так что теперь у вас не должно возникнуть проблем с копированием сайта.
Шаг 8
Установите другие параметры, нажав кнопку «Установить параметры». Вы можете оставить значения по умолчанию и игнорировать параметры. Если вы обнаружите, что HTTrack не загружает изображения, перейдите в параметры программы и выберите вкладку Spider. Установите для раскрывающегося паука значение «без правил robots.txt».
Шаг 9
Нажмите «Далее» и оставьте значения по умолчанию.
Нажмите кнопку «Готово», и начнется копирование. HTTrack начнется с индексной страницы и определит все страницы основного URL для загрузки. Все скачиваются в указанную папку. Вы узнаете, что HTrack готов, когда он издаст звук вздоха.