Back to Question Center
0

Vodič za preglednik Chrome Web Scraper iz stručnjaka Semalt

1 answers:

Ako koristite Google Chrome, postoji proširenje za vaš preglednik

što može pomoći u struganju web stranica. Poznat je kao '' Scrapper '' i može se koristiti bez problema. Scrapper će vam pomoći pri struganju sadržaja web mjesta i prenošenju rezultata u Google dokumente.

Kako ukloniti web stranicu pomoću proširenja za struganje?

1. Odaberite Chrome web-trgovinu u pregledniku Google Chrome;

2. U proširenjima izvršite potragu za "Scrapper";

3. Prvi rezultat pretraživanja je proširenje poznato kao '' Scrapper '';

4. Odaberite gumb naveden kao "Dodaj u Chrome";

5. Vratite se na popis britanskih zastupnika

6. Kliknite sljedeći

8. Desnom tipkom miša kliknite "Scrape"

9. Konzola za scrapper pojavit će se u nekom drugom prozoru;

10. Pogledati izgreban sadržaj u strugalicu

11. Da biste osigurali da se sadržaj pohrani kao Google proračunsku tablicu, odaberite "Spremi u Google dokumente ..."

Prošireni struganje

Prije no što zalijepite ovaj recept , korisno je razumjeti osnove HTML-a. Na primjer, možete pročitati kratak uvod u HTML putem ove veze

Zamislimo da smo zainteresirani za sve filmove koji su označili Aziju Argento,

1. Postoji vrlo detaljna arhiva glumaca u IMDB-u. Azija Argento stranica je: https://www.imdb.com/name/nm0000782/;

2. Ovdje možete vidjeti sve uloge glumice..Počnimo s brisanjem podataka o kojima smo zainteresirani;

3. Pokušajte ga ostrugati onako kako je gore opisano;

4. Vidjet ćete da je popis malo izobličen. To je zbog činjenice da se popis ovdje može strukturirati drugačije;

5. Vodite do konzole za struganje. S vrha lijevo, vidjet ćete mali okvir koji govori XPath;

6. Xpath je vrsta upita jezik koji radi za XML i HTML;

7. XPath može pomoći u pronalaženju dijelova stranice na koju se zanima. Sljedeća stvar je pronaći odgovarajući element i napisati XPath za to;

8. Sada dogovorimo naš stol;

9. Vidjet ćete da je naš postojeći XPath, koji sadrži sve potrebne podatke, "// div [3] / div [3] / div [2] / div";

10. XPath obavještava Sustav da vidi HTML dokument i odabere treći element, zatim drugi element, a zatim sve njih;

11. Međutim, htjeli bismo odvojiti naše podatke;

12. Koristite odjeljak stupaca u konzoli za struganje kako biste to učinili;

13. Prvo pronađimo naš naslov - Koristite Provjeri element da biste vidjeli naslov;

14. Provjerite naslov unutar oznake. Dodajte oznaku u XPath;

15. Izgleda da funkcija funkcionira na odgovarajući način, pa je čini naš prvi stupac;

16. U odjeljku "Stupci" zamijenite ime prvog stupca u "naslov";

17. Dodaj XPath na nju;

18. U sekciji stupca, XPathovi su relativni i znači da će "./b" odabrati element

19. U XPath za naslov stupac, dodajte "./b" i odaberite "scrape";

20. Sada idemo na godinu dana. Godine se mogu naći u jednom rasponu;

21. Izradite novi stupac odabirom malog plusa pored stupca za svoj naslov;

22. Pomoću XPath "./span" stvorite stupac za "godinu";

23. Kliknite struganje i pogledajte kako je dodana godina;

24. Napravljeno!

December 6, 2017
Vodič za preglednik Chrome Web Scraper iz stručnjaka Semalt
Reply