▶Attendez-vous à voir plus de récupération de données en ligne, grâce à une décision de justice mal interprétée

La comparaison
Nouvelles mise à jour
Attendez-vous à voir plus de récupération de données en ligne, grâce à une décision de justice mal comprise

Attendez-vous à voir plus de récupération de données en ligne, grâce à une décision de justice mal comprise

Une cour d'appel américaine, dans une affaire impliquant LinkedIn, a récemment statué que le grattage de données d'informations accessibles au public ne viole pas la loi sur la fraude et les abus informatiques.

Cette décision, la décision ZDNet est ici, a une composante de réalité et une composante de perception. En réalité, la décision est délicieusement étroite et peu susceptible d'avoir beaucoup d'impact juridique. Quant à la partie perception, c'est là que les webmasters d'entreprise et leurs collègues informatiques sont susceptibles d'avoir de gros maux de tête. Il en va de même pour les spécialistes du marketing d'entreprise (mais la plupart d'entre eux le méritent).

Réalité : La décision ne dit pas que le web-scraping concurrent est légal. Il a simplement dit qu'il ne violait pas cette loi spécifique. Il pourrait violer d'autres lois pénales et certainement certaines lois civiles, mais le panel n'a statué que sur ce qui lui a été présenté, comme il se doit.

Mais la perception de la plupart des gens, encouragée par des titres trompeurs selon lesquels le tribunal a donné à tous les grattages un feu vert légal, est que la pratique est désormais légale et que les grattoirs peuvent procéder de manière agressive. Bien que le tribunal n'ait rien dit de tel, il est facile de prédire que cela entraînera une augmentation du grattage.

De combien d'augmentation ? Eh bien, ce ne sera probablement pas une grande augmentation. Parce que? Parce que le genre de personnes qui volent du contenu en grattant ne sont pas vraiment respectueux des lois. Ce n'est pas comme s'il y avait beaucoup de vendeurs qui voulaient gratter mais qui ont sagement attendu jusqu'à ce que les tribunaux se prononcent sur la légalité du grattage.

Cela dit, une mauvaise interprétation de cette décision incitera les scrapers à scraper beaucoup plus.

Que peut et doit faire l'informatique ? Étant donné qu'il s'agit généralement de pages accessibles au public, c'est un problème. Il existe peu de méthodes techniques de blocage des grattoirs qui ne causeront pas de problèmes aux visiteurs du site que l'entreprise souhaite.

Il y a des années, je dirigeais un point de vente qui faisait un bond en avant vers le contenu premium, ce qui signifie désormais que les lecteurs devraient payer pour certaines histoires premium. Nous avons trouvé un problème. Nous ne pouvions pas permettre aux gens de partager librement du contenu premium parce que nous avions besoin que les gens achètent ces abonnements.

Cela signifiait que nous bloquions le copier-coller et empêchions spécifiquement quiconque d'enregistrer la page au format PDF. Mais cela signifiait que ces pages ne pouvaient pas non plus être imprimées. (L'enregistrement au format PDF équivaut en fait à l'impression au format PDF, donc le blocage des téléchargements PDF signifiait le blocage de toutes les imprimantes.) Il ne fallut que quelques heures aux nouveaux abonnés premium pour crier qu'ils avaient payé l'accès et qu'ils devraient pouvoir imprimer des pages et les lire à la maison. ou dans un train. Après que plusieurs abonnés aient menacé d'annuler leurs abonnements payants, nous avons abandonné et rétabli la possibilité d'imprimer. (Et nos craintes ont été confirmées ; les PDF de notre contenu premium ont commencé à apparaître partout.)

Ce dilemme est similaire à la lutte contre les efforts de grattage. Et la plupart des internautes concluront rapidement qu'accepter simplement les scrapers est probablement la meilleure ligne de conduite.

Pour en revenir à l'affaire LinkedIn, je dirais que même citer la loi sur la fraude et les abus informatiques était un argument massivement erroné de LinkedIn. Un meilleur argument, bien que peut-être tout aussi improbable, serait la violation du droit d'auteur.

Les détails de LinkedIn rendent cet argument difficile. Contrairement aux médias (comme "Computerworld"), LinkedIn ne paie pas d'argent pour créer un excellent contenu. La quantité écrasante de contenu obtenu implique ce que les clients de LinkedIn écrivent individuellement gratuitement. LinkedIn peut-il même clamer crûment qu'il détient légitimement toutes les informations de mon CV, que j'ai publiées sur ma page LinkedIn ?

Si LinkedIn me payait pour publier des commentaires et des messages et des détails sur l'historique de travail, cela pourrait peut-être affirmer la propriété. Mais ce n'est pas ce qu'ils font.

Cependant, les utilisateurs s'attendent-ils à ce que le contenu qu'ils publient sur LinkedIn n'apparaissent que sur LinkedIn ? Plus précisément, ces utilisateurs ont-ils des attentes réalistes pour rester en place ? Comme beaucoup de journalistes, je suis souvent allé sur une page LinkedIn pour vérifier les informations biographiques d'une source ou pour vérifier les informations professionnelles de quelqu'un pour une chronique ou un article que j'écris. Est-ce que quelqu'un remet en question mon droit de le faire ?

Et où exactement doit-on tracer la ligne sur ce qui constitue le grattage ? Faire référence à un projet de titre ? Que diriez-vous de quatre titres précédents d'une personne, ou 10? Ou s'agit-il d'informations sur plus de 100 personnes ? C'est un problème, car si LinkedIn décide de ne pas se soucier des petites références de données, cela compromet sa capacité à rechercher des références plus importantes.

C'est là que nous entrons dans l'argument de l'espace public. Si je publie quelque chose de sensible sur moi-même dans un forum public sur un site de discussion majeur, ai-je une raison de m'attendre à la confidentialité ? (En fait, je pourrais parce que personne ne se soucie de ce que je pense, mais je m'égare.) S'il avait voulu que quelque chose reste silencieux, il ne l'aurait pas rendu public.

L'une des utilisations les plus intéressantes de LinkedIn pour les journalistes est d'examiner les détails de l'expérience de quelqu'un. Parce que? Parce que nous savons que de nombreux codeurs et autres talents techniques partageront en masse, détaillant ce qu'ils ont fait sur des projets pour leur employeur, y compris de nombreuses informations très sensibles sur les systèmes sur lesquels ils ont travaillé, les applications achetées par leur employeur , et même ceux qui n'ont pas été annoncés. vulnérabilités de sécurité qu'ils ont corrigées.

La seule action en justice est que leurs entreprises pourraient les licencier pour avoir divulgué des informations privilégiées. Mais le codeur qui l'a posté n'a pas de directives. C'était son choix.

En bref, je pense que nous pouvons tous nous attendre à plus de scraping et de vol de contenu, et le service informatique constatera malheureusement qu'il n'y a vraiment pas grand-chose qu'il puisse faire pour l'arrêter.

Attendez-vous à voir plus de récupération de données en ligne, grâce à une décision de justice mal comprise