Hur man klonar en webbplats med HTTrack

Innehållsförteckning

HTTrack är en gratis och gratis programvara med flera plattformar vars syfte är webbsökning, det vill säga hela eller delar av en webbplats laddas ner för att senare kunna navigera den offline. Det finns en version för Linux som heter WebHTTrack, och dess version för Windows heter WinHTTrack. Vi kan ladda ner HTTrack -programvaran från dess officiella webbplats:

För Linux kan vi också installera det från lagringsplatserna med följande kommando.

 sudo apt-get install httrack

Denna programvara det används mycket för att kopiera webbplatser och sedan ladda upp dem till en annan server och använda dem för att omdirigera trafik till kopieringssidan och skicka besökare till en falsk sida. Det används också av dem som vill se koden eller driften av en viss webbplats. Låt oss titta på ett exempel med webbplatsen httrack.com, där applikationen är värd.

 httrack "httrack.com"
Detta kommando laddar ner filerna från webben till en mapp www.httrack.com, som vi kan se lokalt.

HTTrack tar vilken webbplats som helst och gör en kopia i mappen eller enheten där vi är placerade. Detta kan vara användbart när du söker efter data på webbplatsen offline, till exempel e -postadresser, användbar information för SEO eller strukturen på en webbplats. HTTrack finns både i Windows och i en version för Linux, och användningen är densamma som den i Windows har visuellt intergaz.

Vi kan använd Httrack för penetrationstest och säkerhetstestningeftersom det gör det möjligt att analysera hela innehållet och vilka filer som laddas ner för att avgöra att en kritisk fil inte syns av en angripare när man gör en kopia av en webbplats. När vi samlar in data och information kan vi utföra tester, söka och analysera kod eller nyckelord, vi kan också samla in data som kan användas senare.

Även på detta sätt lhackare använder kopiorna för att ladda upp den till en server med en webbliknande domän kopierad för att efterlikna webbplatserna och sedan använda dem via nätfiske för att stjäla data från intet ont anande användare eller för att utföra attacker med social engineering. Httrack har många alternativ och parametrar att använda för att förbättra nedladdningen för detta kommandot används:

 httrack --hjälp

Några viktiga parametrar som vi kan använda med Httrack -verktyget är:

  • -m: anger till exempel den maximala filstorleken i byte att ladda ner -m 20000000 motsvarande 20 mb.
  • -mima: används för att bara ladda ner en viss typ av fil som vi kommer att indikera med dess tillägg, till exempel med kommandot
 httrack www.WEB.com -mime: application / * + mime: application / pdf
Att använda httrack är enkelt, vi måste lägga till domänen för webbplatsen som vi vill kopiera och sedan starta skanningen placerad i en katalog på vår hårddisk där vi ska lagra webbplatsen. Vi måste ta hänsyn till hur många länkar eller innehåll en webbplats kan ha på grund av mängden information att ladda ner. Utforska kopian av webben kan användas för att leta efter brister och sårbarheter som kan riskera att surfa, samt för att avgöra vilka delar det är bekvämt att kryptera eller öka säkerheten.

Om målet med nedladdningen är att hitta information om ett företag eller listor över användare, telefoner eller annan data i synnerhet för social engineering eller att försöka förfalska en webbplats eller en inloggning för att få användardata, är HTTrack ett utmärkt verktyg för båda uppgif.webpterna.

Grafiskt gränssnitt med WebHTTrack
WebHTTrack är ett grafiskt gränssnitt för httrack som används från en webbläsare och tillåter kopior av hela webbplatser för offlineåtkomst och ändrar länkar automatiskt. Verktyg som WebHTTrack kan hjälpa och tillåta uppdatering av kopian utan att behöva komma ihåg parametrarna för att ladda ner eller kopiera en webbplats och dess innehåll. Vi kan installera det med kommandot:

 sudo apt-get install webhttrack
Sedan till kör det vi kommer att skriva samma kommando:
 webhttrack
Till starta det grafiska gränssnittet, kan vi gå direkt genom programmenyn och vi söker applikationen Browse Mirrored Websites.

Ett annat alternativ är helt enkelt, som vi sa tidigare från terminalfönstret, skriv kommandot webhttrack för att starta en lokal webbserver på port 8080, sedan öppnar vi webbläsaren med hänsyn till att den inte är i inkognito- eller privatläge och i webbläsaren skriver vi adressen localhost: 8080.

Detta visar oss den grafiska guiden som hjälper oss att arbeta med httrack, för att börja måste vi konfigurera språket och klicka på Nästa. Därefter konfigurerar vi ett nytt projekt, fördelen med det grafiska gränssnittet är att vi kan spara data från de nedladdade webbplatserna och parametrarna som används i en textfil.

Därefter tilldelar vi webbplatsen som vi ska kopiera:

Sedan i Definiera alternativ konfigurerar vi parametrarna och filtren genom en guide:

Efter att ha konfigurerat filtren, på nästa skärm börjar vi med skanningen.

Nackdelar med att använda HttrackAtt använda Httrack -verktyget för att utföra denna typ av skanning och nedladdning från en webbplats har några nackdelar, till exempel följande:

  • Det fångar inte upp dynamiskt innehåll eller skriptade sidor.
  • Om du laddar ner webbplatser som är för stora eller med stora filer kan servern krascha.
  • Om vi ​​använder httrack i för många samtidiga anslutningar till samma webbplats kan vi bromsa servern eller ta den ur drift.

Handledningen där en kod skapas för att spåra länkar kan vara av intresse för dig:

Spåra webblänkar med Python

Gillade du och hjälpte denna handledning?Du kan belöna författaren genom att trycka på den här knappen för att ge honom en positiv poäng
wave wave wave wave wave