Stop guessing what′s working and start seeing it for yourself.
Giriş yapın veya kayıt olun
Q&A
Question Center →

Semalt Expert explica cómo se legalizó el raspado de datos web con un fallo judicial

Aunque puede ser ilegal robar datos de sitios web sin el permiso explícito de los propietarios del sitio, un juez dictaminó lo contrario en ciertas circunstancias. HiQ Labs presentó recientemente una demanda contra LinkedIn por evitar que extraigan datos de páginas de LinkedIn.

Para la mayoría de las personas, fue un duro golpe que se le dijera a LinkedIn que le diera a la startup acceso libre a sus páginas web. hiQ usó sus algoritmos para detectar cuándo un usuario de LinkedIn está buscando un trabajo en función de los cambios que el usuario hace en su perfil público.

Los algoritmos se ejecutan en datos extraídos de las páginas web de LinkedIn. Como era de esperarse, a LinkedIn no le gustó y se implementaron contramedidas para evitar que hiQ proceda de una mayor extracción de datos. Además de las barreras técnicas que se pusieron en marcha, también se emitieron advertencias legales muy bien redactadas.

La startup no tuvo más remedio que abordar el problema legalmente. hiQ tuvo que buscar reparación legal. La compañía quería que LinkedIn ordenara eliminar sus barreras técnicas. hiQ también quería legalizar su proceso de extracción de datos en LinkedIn.

Afortunadamente para la puesta en marcha, obtuvo lo que quería. La decisión fue a favor de hiQ. Se le ordenó a LinkedIn que eliminara todas las contramedidas que impiden que hiQ revise sus páginas web (de LinkedIn) y también le daría la mano a hiQ, ya que el acto es totalmente legal. El juez se basó en su decisión sobre el hecho de que lo que quiere buscar es datos que han sido mostrados para la vista del público.

El juez no solo ordenó al demandado que eliminara todo el mecanismo preventivo establecido contra hiQ, sino que también ordenó que el acusado desistiera de tales actos en el futuro.

Promoción de datos web abiertos

Si bien la resolución sigue siendo un mandato temporal, es alentador escuchar que la ley respalda la apertura de datos web y el libre acceso a la información en Internet, ya que esta resolución confirma que. Incluso si la decisión final llega a favorecer al acusado, este hecho ya se ha establecido.

El juez promovió esta política cerrando virtualmente todos los argumentos de LinkedIn. Si bien LinkedIn intentó establecer que el demandante estaba violando su privacidad, el juez lo contrarrestó con el hecho de que el demandado también está vendiendo los datos.

Cuando el argumento no se mantuvo, el demandado también declaró que el acto de hiQ era una violación grave de la Ley de Fraude y Abuso Informático (CFAA) porque la startup accedió a sus servidores para recolectar datos ilegalmente. Una vez más, el argumento fue perforado. Fue rechazado sobre la base de que hiQ solo estaba raspando contenido en las páginas públicas no protegidas.

El juez analizó el caso como alguien que entra a una tienda abierta durante el horario comercial. No se puede decir que esa persona está traspasando. Entonces, hiQ no estaba traspasando. Curiosamente, el juez fue más allá para explicar por qué su decisión es de interés público.

En pocas palabras, el tribunal aceptó que es de interés público permitir que los datos sean rastreados, extraídos y analizados. Por lo tanto, será una política perjudicial fomentar la colocación de barreras al libre flujo de información.

Lo que debe aprender de la decisión

Si bien es posible que no tenga razones para extraer datos directamente de LinkedIn, debe aprender de la sentencia. Es mejor jugar de forma segura leyendo y respetando el archivo robots.txt de todos los sitios web. Recuerde, el fallo sigue siendo un mandato temporal. Eventualmente podría ir a favor de LinkedIn.

Si bien es posible que el fallo no le afecte directamente, es alentador que un tribunal federal defienda la política de mantener abierta la web para el público. Por lo tanto, la información debe estar disponible y accesible para aquellos que puedan buscarla y hacer un buen uso de ella.

Los datos web son extremadamente útiles para todos, especialmente analistas de medios, desarrolladores, científicos de datos y algunos otros profesionales. Como tal, el fallo es un desarrollo bienvenido.

Post a comment

Post Your Comment

Skype

semaltcompany

WhatsApp

16468937756

Telegram

Semaltsupport