Stop guessing what′s working and start seeing it for yourself.
Login or register
Q&A
Question Center →

Semalt: Google Chrome Uzantısını Kullanarak Bir Web Sayfasını Nasıl Kazıyabilirim?

Bir perde kazıyıcı siteleri okuyan ve yararlı bilgileri web'den çıkaran bir senaryo. Ekran kazıma, web sitelerindeki ve web sayfalarındaki gerçek verileri Microsoft Excel'e almak için en iyi çözümdür. Google Chrome Uzatma Kazıyıcı, hem Windows hem de Mac OS üzerinde çalışan güçlü bir  ekran kazıma aracıdır.

Neden Google Chrome Uzatma Kazıyıcı?

Google Chrome eklentisi kazıyıcı, Chrome Web Mağazasında ücretsiz olarak gidecek güçlü bir ekran kazıma aracıdır. Bu kazıma aleti bir eklenti olarak Chrome tarayıcısına yüklenir. Eklenti blogculara ve pazarlamacılara web sayfalarından bir öğeyi sağ tıklatarak verileri almalarını sağlar. Bir öğeyi sağ tıklarsanız ekranınızda ''Scrape Similar'' açılır.

XPaths'e Giriş

XPath, XML yapılarında önemli bilgileri bulmak için kullanılan bir programlama dilidir. HTML dosyası, bir XML yapısının mükemmel bir örneğidir. XPath genellikle hedeflenen düğümleri seçmek için kullanılır. Bu bağlamda, bir web sayfasında çıkarılacak metni belirlemek için XPathler kullanılacaktır. XPath'ler, İsveç milletvekillerinin parti isimleri ve telefon numaralarını belirlemenize de yardımcı olacaktır.

349 İsveçli milletvekilinin adres ayrıntılarına erişmek için Google Chrome kazıyıcısını kullanma

Chrome's Scraper ile bir web sayfasından bilgi çıkarma işlemi basit ama fantastik değil; sürecin ve tekniğin keyfini çıkaracaksınız.

Web sitesinde tüm İsveççe üyeleri ve adreslerini öğrenebilirsiniz Başlamak için, herhangi bir MP üzerinde sağ tıklayın ve "Scrape Similar" ı seçin. Aşağıdaki ekranın ekranınızda görünmesi gerekir.

Kazıyıcı web sayfasının ekranlanmasıyla ilgili adım adım rehber. 

Bir MP'ye sağ tıklayın ve "Inspect element" i seçerseniz, alfabetik liste ""grid_6 alfa omega arama sonucu konteyner clist "sınıfının altında oluşturulur. Bu web sayfasını sıyırmak için iki adım kullanılacaktır. Birinci adımda, XPath ile MP'lerin verilerini içeren etiketleri seçmek gerekecek. İkinci adım, parti isimleri, isimler ve telefon numarası gibi verilerin belirli bölümlerini seçmeyi ve verileri sütunlarda düzenlemeyi içerir.

Adım 1

HTML yapısını derinleştirin ve öğeleri sağlam tutun. Yapığınızdaki öğelerle eşleşen etiketlerin sayısını belirlemek için etiketleri işaret edin. Hedeflenen veriden oluşan son etiketi belirleyin. "Kazıma" yı tıklayarak yapı üzerinde bir XPath testi çalıştırın.

349 satırdan oluşan bir liste ekranınızda görüntülenecektir. 349 İsveç milletvekillerinin toplam sayısını temsil etmektedir.

Adım 2

Verilen verileri sütunlara bölün. Kullandığınız web sayfasındaki HTML kodunu inceleyin. Bu durumda, çıkarılacak parçalar şu an sarı renkle vurgulanmış durumda. Oluşturulan sütun alanına XPath'leri yerleştirin ve eklentiyi çalıştırmak için "Kazıma" yı tıklayın.

XPaths hakkında temel bilgiye sahipseniz, programlamayı anlamak sizin için heyecan verici bir görev olmayacaktır. Yukarıda vurgulanan adımlar, kazıyıcı web sayfasının nasıl görüntüleneceği konusunda size yol gösterir. Birden çok web sayfasını kazıma üzerinde çalışıyorsanız, programlama becerilerine sahip olmanız gerekir.

Post a comment

Post Your Comment
© 2013 - 2024, Semalt.com. All rights reserved

Skype

semaltcompany

WhatsApp

16468937756

Telegram

Semaltsupport