Le New York Times fait il est clair que l’industrie de l’IA ne sera pas laissée libre cours piller les journaux contenu pour former des algorithmes. Dans un changement récent conformément à sa politique sur les conditions d’utilisation, le Times a explicitement interdit l’utilisation de ses vastes archives médiatiques à des fins de formation « tout programme logiciel, y compris, mais sans s’y limiter, la formation d’un système d’apprentissage automatique ou d’intelligence artificielle (IA) ».
Le changement de TOS du journal s’est produit à l’origine le 3 août et a d’abord été noté par Adweek. La politique s’applique au contenu textuel, aux photos, aux vidéos et aux métadonnées du Times, et explicitement interdit les robots d’indexation des entreprises d’accéder à ces données pour former des produits propriétaires.
L’un des aspects les plus controversés de l’industrie de l’intelligence artificielle est la question de savoir où les entreprises d’IA peuvent ou doivent obtenir leurs données. La formation des systèmes d’IA prend un immense quantité de données (ainsi que une somme effrayante de puissance de calcul), et des entreprises comme OpenAI, qui ont construit leurs trésors de données en grande partie en grattant l’ouvert (ou pas si ouvert) Internet – ont déjà rencontré des problèmes juridiques à la suite de ces pratiques. Exemple : OpenAI est actuellement face à une multitude de procès de personnes et d’organisations qui disent que l’entreprise a volé leurs données, puis les a reconditionnées et monétisées.
Pourtant, un certain nombre de grands fournisseurs d’IA ont récemment fait savoir qu’ils doublaient le scraping Web. Google, par exemple, annoncé récemment que cela continuerait grattage le Web à moins d’y être contraint. La décision du Times d’interdire l’utilisation gratuite de ses archives médiatiques à de telles fins montre que le journal comprend la valeur de ses données et n’a pas l’intention de les donner gratuitement, ouvrant la voie à d’éventuelles contestations judiciaires.
La tentative continue de l’IA de s’associer aux médias d’information
Le changement de TOS du Times intervient également à un moment intéressant dans l’évolution des relations entre les médias d’information et l’industrie émergente de l’IA.
Dernièrement, les entreprises d’IA ont agressivement courtisé les journaux et les organisations médiatiques, dans une tentative évidente de normaliser l’utilisation des outils d’IA dans la curation des nouvelles et la création de contenu. Cela a du sens, puisque l’un des grands marchés projetés pour l’IA est un média numérique. Les entreprises d’IA font de leur mieux pour s’implanter sur un marché de l’information méfiant, et l’une des façons dont elles le font est d’offrir des services et des partenariats gratuits. Exemple : il n’y a pas si longtemps, Google sinistrement approché un certain nombre d’organisations de presse héritées, dont le Times et le Washington Post, dans le but de leur vendre un nouvel outil d’IA, surnommé « Genesis », qui, selon elle, « aiderait » les journalistes.
Dans le même temps, les entreprises d’IA semblent flairer un autre type d’opportunité lorsqu’il s’agit de s’associer aux médias. Étant donné que le grattage Web aveugle s’est avéré être une pratique controversée, les entreprises d’IA recherchent actuellement de nouvelles méthodes juridiquement plus sûres pour obtenir les données dont elles ont besoin pour faire fonctionner correctement leurs produits. L’une de ces méthodes semble être le partenariat avec les agences de presse et l’offre de services d’automatisation gratuits en échange de l’accès aux vastes archives de textes des journaux. Récemment, l’Associated Press a conclu un accord avec OpenAI cela permettrait à la startup d’intelligence artificielle d’accéder et d’utiliser les archives de texte de l’AP. En échange, OpenAI a offert à l’AP un accès à « l’expertise technologique et produit d’OpenAI ».
En bref : l’industrie de l’IA veut vraiment parvenir à s’intégrer à l’actualité. Compte tenu des dangers inconnus qu’une telle collaboration peut impliquer, cependant, il peut être plus logique pour les médias de continuer à jouer dur pour le moment.



GIPHY App Key not set. Please check settings