Stop guessing what′s working and start seeing it for yourself.
Login or register
Q&A
Question Center →

Semalt Expert On Site Data Scraping - Bons e Bad Bots

A raspagem da Web existe há muito tempo e é considerada útil para webmasters, jornalistas, freelancers, programadores, não programadores, pesquisadores de marketing, estudiosos e especialistas em mídia social. Existem dois tipos de bots: bons bots e bots ruins. Os bons bots permitem que os motores de busca indexem o conteúdo da web e recebam alta preferência pelos especialistas do mercado e pelos comerciantes digitais. Os robôs ruins, por outro lado, são inúteis e visam prejudicar o ranking de um motor de busca do site. A legalidade da raspagem na web depende do tipo de bots que você usou.

Por exemplo, se você estiver usando os bots maus que obtêm o conteúdo de diferentes páginas da web com a intenção de usá-lo ilegalmente, a raspagem da Web pode ser prejudicial. Mas se você fizer uso dos bons bots e evitar as atividades nocivas, incluindo ataques de negação de serviço, fraudes on-line, estratégias competitivas de mineração de dados, roubos de dados, sequências de contas, varredura de vulnerabilidade não autorizada, fraudes de anúncios digitais e roubando as propriedades intelectuais, então o procedimento de raspagem na web é bom e útil para aumentar o seu negócio na Internet.

Infelizmente, a maioria dos freelancers e startups adoram os bots ruins porque eles são uma maneira barata, poderosa e abrangente de coletar dados sem necessidade de uma parceria. As grandes empresas, no entanto, usam os raspadores legais da Web por seus ganhos e não querem arruinar sua reputação na internet com raspadores de web ilegais. As opiniões gerais sobre a legalidade da raspagem na Web não parecem importar, porque nos últimos meses ficou claro que os sistemas judiciais federais estão atacando cada vez mais estratégias ilegais de raspagem na web.

A raspagem da Web começou como um processo ilegal em 2000, quando o uso de bots e aranhas para raspar sites foi considerado sem sentido. Muitas práticas não foram adaptadas para impedir que esse procedimento se espalhe pela internet até 2010. O eBay arquivou as injunções preliminares contra a Bidder's Edge, alegando que o uso de bots no site violou as leis de Trespass para Chattels. O tribunal logo concedeu as injunções porque os usuários tiveram que concordar com os termos e condições do site e um Um grande número de bots foram desativados, pois poderiam ser destrutivos para as máquinas de computador do eBay. O processo foi pronto resolvido fora do tribunal, e o eBay impediu todos de usar bots por raspagem na web, não importa se eles são bons ou ruins.

Em 2001, uma agência de viagens processou os concorrentes que rasparam seu conteúdo do site com a ajuda de aranhas e bots ruins. Os juízes novamente tomaram medidas contra o crime e favoreceram as vítimas, dizendo que ambos os webs raspagem e o uso de bots poderia prejudicar vários negócios online.

Atualmente, para agregação de informações acadêmicas, privadas e de informações, muitas pessoas dependem de procedimentos de raspagem de web justas, e um grande número de  ferramentas de raspagem na web  foram desenvolvidas a este respeito. Agora, as autoridades dizem que nem todas essas ferramentas são confiáveis, mas as que vêm em versões premium ou pagas são melhores do que as  raspadeiras web gratuitas.

Em 2016, o Congresso aprovou a primeira legislação para atacar os bots ruins e favorecer os bons bots. Foi formada a Lei Better Online Ticket Sales (BOTS), que proibiu o uso de software ilegal que poderia direcionar os sites, danificando seus motores de busca e destruindo seus negócios. Há questões de justiça. Por exemplo, o LinkedIn gastou muito dinheiro nas ferramentas que bloqueiam ou eliminaram bots ruins e incentivam bons bots. Como os tribunais têm tentado decidir a legalidade da raspagem na web, as empresas estão tendo seus dados roubados.

View more on these topics

Post a comment

Post Your Comment
© 2013 - 2024, Semalt.com. All rights reserved

Skype

semaltcompany

WhatsApp

16468937756

Telegram

Semaltsupport