Back to Question Center
0

Semalt Expert contesta como se rasgaron os datos web cun xulgado

1 answers:

Aínda que pode ser ilegal raspar datos de sitios web sen o permiso explícito dos propietarios do sitio, un xuíz determinou recentemente doutra forma en determinadas circunstancias. hiQ Labs recentemente presentou unha demanda contra LinkedIn para impedilo de extraer datos de páxinas de LinkedIn.

Resultou un choque groseiro para a maioría da xente que LinkedIn díxolle para dar acceso gratuíto ás súas páxinas web - hiperfocal fotografia profesional.hiQ usou os seus algoritmos para detectar cando un usuario de LinkedIn está a buscar un emprego en función das modificacións que o usuario fai no seu perfil público.

Os algoritmos funcionan con datos extraídos das páxinas web de LinkedIn. Como era de esperarse, LinkedIn non lle gustou e as contramedidas foron postas en práctica para evitar que a hiQ obtivese máis extracción de datos. Ademais das barreiras técnicas que se introduciron, tamén se emitiron avisos legais fortes.

O arranque non tivo máis remedio que levar o asunto legalmente. O hiQ tivo que buscar reparación legal. A empresa quería que LinkedIn ordenase eliminar as súas barreiras técnicas. O hiQ tamén quería que o seu proceso de extracción de datos estea legalizado en LinkedIn.

Afortunadamente para o arranque, conseguiu o que quería. O fallo foi a favor de hiQ. LinkedIn encargouse de eliminar todas as contramedidas que dificultan a hiQ de raspar as súas páxinas web (LinkedIn) e tamén darlle mans libres a hiQ porque o acto é totalmente legal. O xuíz entendeu a súa decisión sobre o feito de que o hiQ quere raspar son datos que foron exhibidos para a vista pública.

O xuíz non só ordenou ao acusado que elimine todo o mecanismo preventivo establecido contra o hiQ, pero tamén ordenou que o acusado deba desistir destes actos no futuro.

A promoción de datos web abertos

Aínda que o fallo segue sendo un mandamento temporal, resulta alarmante escoitar que a lei admite datos web abertos e acceso gratuíto á información en internet xa que esta sentenza confirma que. Aínda que a decisión definitiva favoreza ao acusado, este feito xa foi establecido.

O xuíz promoveu esta política pechando prácticamente todos os argumentos de LinkedIn. Mentres LinkedIn intentou establecer que o actor violaba a súa privacidade, o xuíz o contestaba co feito de que o acusado tamén está a vender os datos.

Cando o argumento non mantivo auga, o acusado tamén afirmou que o acto de hiQ estaba en violación grave da Lei de fraude e abuso informático (CFAA) porque o inicio accedeu aos seus servidores para obter información de forma ilegal. Unha vez máis, o argumento foi pinchado. Foi rexeitado no chan que o hiQ só estaba raspando contido nas páxinas públicas e non protexidas.

O xuíz analiza o caso como alguén que entra nunha tenda aberta durante o horario comercial. Non se pode dicir que unha persoa deste tipo sexa invasora. Entón, a hiQ non foi a invasión. Curiosamente, o xuíz foi máis para explicar por que a súa sentenza é de interese público.

En poucas palabras, o tribunal aceptou que é de interese público permitir que os datos sexan rastrexados, extraídos e analizados. Así pois, será unha política perjudicial para fomentar a colocación de barreiras ao libre fluxo de información.

O que debes aprender do fallo

Aínda que poida que non teñas motivos para extraer datos directamente de LinkedIn, debes aprender do fallo. É mellor xogar seguro lendo e respectando os robots. ficheiro txt de todos os sitios web. Lembre, a sentenza aínda é un mandato temporal. Podería finalmente ir a favor de LinkedIn.

Aínda que o fallo non afecte directamente a vostede, está aplaudindo que un tribunal federal defenda a política de manter aberta a web para o público. Así, a información debería estar dispoñible e accesible para aqueles que poden buscar e aproveitar o mellor.

Os datos web son sumamente útiles para todos, especialmente analistas de medios, desenvolvedores, científicos de datos e outros profesionais.Como tal, o fallo é un desenvolvemento benvido.

December 22, 2017