Stop guessing what′s working and start seeing it for yourself.
Giriş yapın veya kayıt olun
Q&A
Question Center →

Chrome Web Scraper-zelfstudie van Semalt Expert

Als u Google Chrome gebruikt, is er een extensie voor uw browser wat kan helpen om webpagina's te schrapen. Het staat bekend als ''Scrapper'' en kan zonder problemen worden gebruikt. Scrapper helpt u bij het opschaven van de inhoud van een website en het uploaden van de resultaten naar Google-documenten.

Hoe een website scrapen met behulp van Scraper-extensie?

1. Selecteer Chrome Web Store in Google Chrome;

2. Zoek in extensies naar '' Scrapper '';

3. Het eerste zoekresultaat is de extensie die bekend staat als '' Scrapper '';

4. Selecteer de knop weergegeven als '' Toevoegen aan Chrome ";

5. Ga terug naar de UK MPs-lijst;

6. Klik op het volgende  link ;

7. Zoek nu naar een MP en zorg ervoor dat de vermelding gemarkeerd is;

8. Klik met de rechtermuisknop om "Scrape" te kiezen Overeenkomstig ..."optie;

9. De console voor scrapper zal in een ander venster verschijnen;

10. Bekijk de geschraapte inhoud in de schraper console;

11. Om ervoor te zorgen dat de inhoud wordt opgeslagen als een Google-spreadsheet, selecteert u "Opslaan in Google Documenten ..."

Langdurig schrapen

Alvorens aan dit recept te plakken , het is handig om de basisprincipes van HTML te begrijpen, bijvoorbeeld, je kunt een korte inleiding tot HTML lezen via deze  link 

Laten we ons voorstellen dat we geïnteresseerd zijn in alle films met Asia Argento als ster, een beroemde Italiaanse actrice.

1. Er is een zeer gedetailleerd archief van acteurs in IMDB. De Argento-site van Azië is: https://www.imdb.com/name/nm0000782/;

2..Hier kun je alle rollen zien die de actrice speelt. Laten we beginnen met het schrappen van de informatie waarin we geïnteresseerd zijn;

3. Probeer het te schrapen zoals hierboven beschreven;

4. U zult zien dat de lijst een beetje vervormd is. Dit komt door het feit dat de lijst hier anders kan worden gestructureerd;

5. Ga naar de schraperconsole. Linksboven ziet u het kleine vakje met XPath;

6. Xpath is een soort query-taal die werkt voor XML en HTML;

7. XPath kan helpen om de delen van de pagina waarin u geïnteresseerd bent te lokaliseren. Het volgende is om een geschikt element te vinden en de XPath ervoor te schrijven;

8. Laten we nu onze tafel regelen;

9. Je zult zien dat onze bestaande XPath, die alle benodigde gegevens heeft, "// div [3] / div [3] / div [2] / div" is;

10. XPath informeert het systeem om het HTML-document te bekijken en het derde element te kiezen, vervolgens het tweede element en dan alle;

11. Maar we willen graag dat onze gegevens worden gescheiden;

12. Gebruik de kolommen sectie in de console voor scrapper om dit gedaan te krijgen;

13. Laten we eerst onze titel zoeken РІР,“ Inspecteer element gebruiken om de titel te bekijken;

14. Controleer de titel binnen een tag. Voeg de tag toe aan de XPath;

15. De uitdrukking lijkt op de juiste manier te functioneren, dus maak er onze eerste kolom van;

16. Vervang in de sectie "Kolommen" de naam van de eerste kolom door "titel";

17. Voeg de XPath eraan toe;

18. In de kolomsectie zijn de XPaths relatief en betekent dit dat "./b" het element  

19 zal kiezen. In de XPath voor de titelkolom, voeg "./b" toe en selecteer "scrape";

20. Laten we nu een jaar blijven. Jaren kunnen binnen één periode worden gevonden;

21. Maak een nieuwe kolom door de kleine plus te selecteren naast de kolom voor uw titel;

22. Gebruik XPath "./span" om een kolom voor "jaar" aan te maken;

23. Klik op schrapen en bekijk hoe het jaar is toegevoegd;

24. Klaar!

 
View more on these topics

Post a comment

Post Your Comment
© 2013 - %s, Semalt.com. All rights reserved