Magazine High tech

Même les fans les plus fervents dénoncent la collecte peu transparente des données de formation de l'IA d'Apple

Publié le 06 juillet 2024 par Zaebos @MetatroneFR

Il affirme que la plupart des échantillons de formation appartiennent à Apple, mais qu'en est-il du reste ?

En résumé : Apple a pris le train de l’intelligence artificielle très lentement et avec beaucoup de prudence. L’entreprise a même refusé d’appeler son modèle « IA » lors de la WWDC, préférant introduire Apple Intelligence pour se démarquer. Cependant, quel que soit le nom qu’on lui donne, les développeurs doivent toujours alimenter leurs modèles avec des centaines de millions, voire des milliards d’échantillons de données pour rester compétitifs.

Jusqu'à présent, nous n'avons pas eu l'occasion d'examiner cette fonctionnalité de manière équitable, car Apple Intelligence ne sera dévoilée publiquement que plus tard cette année. Nous n'avons vu que ce qu'Apple nous a montré à la WWDC, ce qui n'est pas une évaluation impartiale. Comme toute autre entreprise, Apple ne présentera que le meilleur de ce qu'elle a à offrir. Elle pourra en détailler les détails plus tard. Cependant, avec la croissance rapide de l'IA commerciale, cela ne suffit pas.

L’entreprise aurait pu facilement publier des informations ou une page FAQ sur la manière dont elle entraîne ses modèles d’IA générative, mais elle est restée jusqu’à présent aussi silencieuse qu’avant d’annoncer officiellement sa technologie d’IA. La seule chose qu’elle a rapportée à ce sujet est qu’elle collecte des données comme tout le monde, en utilisant un outil qu’elle appelle AppleBot, qui est censé être plus respectueux de la vie privée. Cependant, respecter la vie privée et respecter les droits de propriété intellectuelle sont deux choses différentes.

Aujourd'hui, certains des plus fervents partisans d'Apple dénoncent son manque de transparence sur le comment et le quoi de la collecte de données d'Apple Intelligence.

« J'aurais aimé qu'Apple explique au public de manière plus transparente comment ils collectent leurs données d'entraînement », a déclaré Jon Lam, artiste de jeux vidéo et militant des droits des créateurs, à Engadget. « Je pense que leur annonce n'aurait pas pu tomber à un pire moment. »

C'est personnel, puissant et privé, et il est intégré aux applications sur lesquelles vous comptez au quotidien.

Présentation d'Apple Intelligence, notre prochain chapitre de l'IA. https://t.co/uOfIrcTYm7

– Tim Cook (@tim_cook) 10 juin 2024

On pourrait penser qu’avec la lenteur d’Apple dans le domaine de l’IA, l’entreprise aurait compris que le climat autour de la collecte d’informations pour la formation de modèles génératifs était et continue d’être froid. De nombreux artistes ont intenté des poursuites pour violation de propriété intellectuelle contre des développeurs d’IA pour avoir utilisé leur travail sans autorisation ni paiement – ​​plus d’une douzaine selon le décompte d’Engadget. Des poursuites pour violation de propriété intellectuelle contre des fournisseurs d’IA ont été intentées par des acteurs de premier plan du secteur comme le New York Times et Universal, ainsi que par des artistes indépendants de moindre envergure.

« C’est pourquoi je voulais leur accorder un léger bénéfice du doute », a déclaré Lam. « Je pensais qu’ils aborderaient la question de l’éthique différemment. »

C'est une atteinte encore plus grave aux relations publiques si l'on tient compte de la position de Cupertino sur la confidentialité et du fait qu'Apple se positionne depuis longtemps comme le meilleur outil des artistes. L'entreprise facture un supplément pour ses plateformes de production haut de gamme que des millions d'utilisateurs créatifs adorent. Ternir sa réputation avec une collecte de données sans scrupules est la dernière chose dont elle a besoin.

John Giannandrea, vice-président senior de la stratégie d'apprentissage automatique et d'IA d'Apple, a minimisé la collecte d'échantillons de l'entreprise en affirmant qu'Apple avait principalement formé ses modèles à partir de données internes. Cependant, Giannandrea n'a pas donné de détails, comme la quantité de « principalement » et la provenance du reste de ses échantillons d'entraînement.

Selon le site d'information Apple, Apple aurait conclu des accords de licence avec des bases de données d'images de grande envergure comme Shutterstock et Photobucket, mais la société n'a pas confirmé publiquement ces informations. Le statu quo n'a jamais été un pilier de l'activité d'Apple. Bien que la société de Cupertino n'ait pas encore commenté les commentaires négatifs, il serait surprenant qu'elle n'aborde pas le problème avant de lancer Apple Intelligence cet automne.


Retour à La Une de Logo Paperblog

A propos de l’auteur


Zaebos 7622 partages Voir son profil
Voir son blog