Stop guessing what′s working and start seeing it for yourself.
Login ou cadastro
Q&A
Question Center →

Semalt Experte erzählt, wie Web Data Scraping mit einem Gerichtsurteil legalisiert wurde

Es ist zwar illegal, Daten ohne ausdrückliche Genehmigung von Websites zu scrappen von den Besitzern der Anlage hat ein Richter kürzlich unter Umständen anders entschieden. hiQ Labs hat kürzlich eine Klage gegen LinkedIn eingereicht, um zu verhindern, dass diese Daten von LinkedIn-Seiten extrahieren.

Es war für die meisten Menschen ein Schock, dass LinkedIn dem Startup freien Zugang zu seinen Webseiten gab. hiQ hat seine Algorithmen verwendet, um festzustellen, wann ein LinkedIn-Benutzer nach einem Job sucht, basierend auf den Änderungen, die der Benutzer an seinem öffentlichen Profil vornimmt.

Die Algorithmen laufen auf Daten, die von den LinkedIn-Webseiten extrahiert wurden. Wie erwartet, hat es LinkedIn nicht gefallen und es wurden Gegenmaßnahmen ergriffen, um hiQ vor weiterer Datenextraktion zu bewahren. Abgesehen von den technischen Barrieren, die eingeführt wurden, wurden auch stark formulierte gesetzliche Warnungen ausgegeben.

Der Start hatte keine andere Wahl, als das Problem rechtlich zu lösen. hiQ musste Rechtsschutz suchen. Das Unternehmen wollte, dass LinkedIn seine technischen Barrieren beseitigt. hiQ wollte außerdem, dass sein Datenextraktionsprozess auf LinkedIn legalisiert wird.

Zum Glück für das Startup, bekam es, was es wollte. Die Entscheidung war zugunsten von hiQ. LinkedIn wurde aufgefordert, alle Gegenmaßnahmen, die hiQ daran hindern, seine (LinkedIn) Webseiten zu löschen, zu entfernen und auch hiQ freie Hand zu geben, da die Handlung völlig legal ist. Der Richter hob seine Entscheidung auf die Tatsache, dass, was hiQ kratzen möchte, Daten sind, die für die Öffentlichkeit angezeigt wurden.

Der Richter ordnete dem Angeklagten nicht nur an, alle gegen HiQ getroffenen Vorbeugemaßnahmen aufzuheben, sondern er ordnete auch an, dass der Beklagte künftig von solchen Handlungen absehen solle.

Förderung offener Web-Daten

Während das Urteil noch eine einstweilige Verfügung ist, ist es herzerwärmend zu hören, dass das Gesetz offene Web-Daten und den freien Zugang zu Informationen im Internet unterstützt, wie dies in der Entscheidung bestätigt wird. Selbst wenn die endgültige Entscheidung den Beklagten begünstigt, ist diese Tatsache bereits festgestellt worden.

Der Richter förderte diese Politik, indem er praktisch alle Argumente von LinkedIn einstellte. Während LinkedIn versuchte festzustellen, dass der Kläger seine Privatsphäre verletzte, stellte der Richter dem entgegen, dass der Beklagte auch die Daten verkauft.

Als das Argument nicht stichhaltig war, stellte der Beklagte auch fest, dass die Handlung von hiQ eine grobe Verletzung des Computerbetrugs- und Missbrauchsgesetzes (CAFA) darstelle, weil das Startup auf ihre Server zugreife, um Daten illegal zu sammeln. Wieder wurde das Argument durchbrochen. Es wurde mit der Begründung abgelehnt, dass hiQ nur Inhalte auf den öffentlichen, nicht geschützten Seiten scrappt.

Der Richter hat den Fall als jemanden abgegrenzt, der während der Geschäftszeiten in einen offenen Laden gegangen ist. Solch eine Person kann nicht als Hausfriedensbruch bezeichnet werden. Also, HiQ war nicht übertretend. Interessanterweise ging der Richter weiter, um zu erklären, warum seine Entscheidung im öffentlichen Interesse liegt.

Kurz gesagt, das Gericht räumt ein, dass es im öffentlichen Interesse liegt, Daten zu durchsuchen, zu extrahieren und zu analysieren. Daher wird es eine schädliche Politik sein, die Schaffung von Barrieren für den freien Informationsfluss zu fördern.

Was Sie aus dem Urteil lernen sollten

Auch wenn Sie möglicherweise keine Gründe haben, Daten direkt von LinkedIn zu extrahieren, sollten Sie aus dem Urteil lernen. Es ist besser, sicher zu spielen, indem Sie die robots.txt-Datei aller Websites lesen und respektieren. Denken Sie daran, das Urteil ist immer noch eine einstweilige Verfügung. Es könnte schließlich zugunsten von LinkedIn gehen.

Während die Entscheidung Sie nicht direkt betreffen kann, ist es erfreulich, dass ein Bundesgericht die Politik der Offenhaltung des Internets für die Öffentlichkeit aufrechterhält. Daher sollten Informationen für diejenigen verfügbar und zugänglich sein, die sie suchen und nutzen können.

Web-Daten sind äußerst nützlich für alle, insbesondere für Medienanalysten, Entwickler, Datenwissenschaftler und einige andere Fachleute. Als solches ist das Urteil eine willkommene Entwicklung.

Post a comment

Post Your Comment

Skype

semaltcompany

WhatsApp

16468937756

Telegram

Semaltsupport