Stop guessing what′s working and start seeing it for yourself.
Giriş yapın veya kayıt olun
Q&A
Question Center →

Semalt Uzmanından Chrome Web Kazıyıcı Eğitimi

Google Chrome'u kullanıyorsanız, tarayıcınız için bir uzantı var Bu web sayfalarını sıyırmak için yardımcı olabilir. "Sıyırıcı" olarak bilinir ve sorunsuz kullanılabilir. Scrapper, bir web sitesi içeriğinin kazımasına ve sonuçların Google belgelerine yüklenmesine yardımcı olacaktır.

Scraper uzantısını kullanarak bir web sitesini nasıl hurdaya çıkarabilirim?

1. Google Chrome'da Chrome Web Mağazası'nı seçin;

2. Uzantılarda, '' Karıştırıcı '' araması yapın;

3. İlk arama sonucu "Çöpçatan" olarak bilinen uzantıdır;

4. "Chrome'a Ekle" olarak listelenen düğmeyi seçin;

5. İngiltere Milletvekili listesine geri dönün;

6. Aşağıdaki  link ;

7. Şimdi bir MP arayın ve girişin işaretlendiğinden emin olun;

8. "Scrape Benzer: "seçeneği;

9. Scrapper konsolu başka bir pencerede açılır;

10. Kazıyıcıdaki kazıyıcıdaki içeriği görüntüleyin

11. İçeriğin bir Google E-tablosu olarak kaydedildiğinden emin olmak için "Google Dokümanlar'a Kaydet ..." seçeneğini seçin.

Uzatılmış kazıma

Bu tarifi yapıştırmadan önce , HTML temellerini anlamakta fayda vardır.Örneğin, bu  linki ile HTML'ye kısa bir giriş okuyabilirsiniz 

Asya Argento'nun başrolünü oynadığı tüm filmlerle ilgilendiğimizi düşünelim, Ünlü bir İtalyan aktrist.

1. IMDB'de aktörlerin çok detaylı bir arşivi var: Asia Argento sitesi: https://www.imdb.com/name/nm0000782/;

2. Burada, oyuncu tarafından oynanan tüm rolleri görebilirsiniz. İlgilendiğimiz bilgileri silmeye başlayalım;

3. Yukarıda anlatıldığı şekilde sıyırmaya çalışın;

4. Listenin biraz bozuk olduğunu görürsünüz. Bunun nedeni, buradaki listenin farklı şekilde yapılandırılabilmesidir;

5. Sıyırıcı konsoluna yönelin. Sol üstte, XPath diyen küçük kutuyu göreceksiniz;

6. Xpath, XML ve HTML için çalışan bir sorgu dili türüdür;

7. XPath, ilgilendiğiniz sayfanın bölümlerini bulmanıza yardımcı olabilir. Sonraki şey, uygun bir öğe bulmak ve bunun için XPath yazmaktır;

8. Şimdi masamızı ayarlayalım;

9. Gerekli tüm verilere sahip olan mevcut XPath'ımız "// div [3] / div [3] / div [2] / div";

10. XPath, Sistemi HTML dokümanını görüntüleyecek ve üçüncü unsuru, daha sonra ikinci unsuru ve hepsini seçecek şekilde bilgilendirir;

11. Ancak, verilerimizi ayrıştırmak istiyoruz;

12. Bu işi halletmek için scrapper'ın konsolundaki sütun bölümünden yararlanın;

13. İlk başlığımızı bulalım RESİMLERİ Başlığı görüntülemek için İnceleme Öğesini Kullan;

14. Bir etiket içindeki başlığı kontrol edin. Etiketi XPath'a ekleyin;

15. İfade uygun şekilde işliyormuş gibi görünür;

16. "Sütunlar" bölümünde, ilk sütunun adını "başlık" olarak değiştirin;

17.Buna XPath ekleyin; 18. Kolon bölümünde, XPath'ler görecelidir ve "./b"  başlık sütununa "./b" ekleyin ve "kazıma" yı seçin;

20. Şimdi bir yıllığına devam edelim. Yıllar bir süre içerisinde bulunabilir;

21. Başlıkınızın sütununun yanındaki küçük artı işaretini seçerek yeni bir sütun oluşturun;

22. XPath'ı kullanarak "./span" "yıl" için bir sütun oluşturun;

23. Kazıma üzerine tıklayın ve yılın nasıl eklendiğini görün;

24. Bitti! 

View more on these topics

Post a comment

Post Your Comment
© 2013 - %s, Semalt.com. All rights reserved