Semalt: Skrapa alla webbsidor med ett enda musklick

WebHarvy är ett av de bästa verktygen för dataskrapning och webbsökning på nätet. Det används för att skrapa bilder, webbadresser, text och e-postmeddelanden från ett stort antal webbplatser. Med WebHarvy kan du spara ditt webbinnehåll i olika format och kan extrahera användbar data med bara några klick.
Skrapa olika platser:

Med WebHarvy kan du enkelt skrapa webbadresser, e-postadresser, bilder, video- och ljudfiler och text från webbsidor. I sitt konfigurationsläge behöver du bara flytta muspekaren över sidan, och data skrapas automatiskt. Du kan också markera informationen du vill skrapa och WebHarvy börjar utföra sin funktion direkt. När data har extraherats markeras de med gul bakgrund och du kan kontrollera deras kvalitet. Otroligt nog fixar WebHarvy alla mindre fel i dina filer och kommer att visa det slutliga resultatet i ett fångst. Om informationen inte är markerad med gul bakgrund, bör du ändra verktygets inställningar och starta om dem omedelbart för att få bra resultat.
Identifiera liknande dataelement:
Med WebHarvy kan du identifiera liknande dataelement och bli av med innehåll av låg kvalitet. Om du till exempel har skrapat en viss sida tidigare och glömt bort den kommer WebHarvy inte att extrahera data från samma sida och sparar tid och energi. Istället kan du komma åt den informationen i WebHarvys databas och ladda ner dem direkt till din hårddisk. På samma sätt kan du fånga fler dataelement från en sida med det här verktyget och kan utföra flera skrapningsuppgifter åt gången.
Skrapa bilder med WebHarvy:
När vi klickar på en PNG- eller JPG-fil under konfigurationen kommer WebHarvy att börja skrapa den direkt. När bilden har extraherats laddas den ner till din hårddisk automatiskt eller lagras i WebHarvys databas för offlineanvändning. Du kan skrapa upp till 100 bildfiler och PDF-dokument åt gången med den här tjänsten. Alternativet 'Fånga bild' kan också användas för att skrapa HTML-dokumenten, och du kan använda vanliga uttryck för att få bildens URL på nolltid.

Skrapa HTML-dokumenten:
Med WebHarvy kan du skrapa HTML-dokumenten med bara några klick. För detta bör du välja alternativet 'Fånga HTML' och klicka på knappen 'Fler alternativ' i fångstfönstret. Här kommer HTML-koden för ditt valda element att visas. Klicka på 'Capture HTML' -knappen och fånga HTML för det valda elementet.
Pek-och-klicka-gränssnitt:
WebHarvy är bäst känt för sitt pek-och-klickgränssnitt. Du behöver inte skriva koder eller skript när du skrapar data. Istället kan du använda WebHarvy för att navigera genom olika webbsidor och skrapa så många sidor du vill med ett enda musklick. WebHarvy identifierar automatiskt datamönstren och ger korrekta och tillförlitliga resultat. Du kan spara informationen i formatet XML, CSV, JSON och TSV. Du kan till och med skrapa dina webbsidor anonymt och förhindra att WebHarvy blockerar din IP-adress.