“La vie, c’est comme un algorithme : parfois, on croit tout contrôler… jusqu’à ce qu’un bug surgisse pendant la keynote.” Eh oui, chers lecteurs, même les géants de Cupertino, connus pour leur perfection millimétrée, passent parfois à côté de leur message – ou de vos notifications.
Après avoir été accusée d’être aussi réactive qu’un iPhone 3G sur iOS 15 (au secours), Apple tente de regagner le cœur — et les données — de ses utilisateurs. Pas question pour la Pomme de laisser le flop de ses résumés de notifications fraîchement boostés à l’IA souiller sa belle image argentée. Pour cela, Apple se tourne aujourd’hui vers… des données qui n’existent pas ! Oui, oui : place à la “synthetic data”, l’art de faire de fausses vraies données pour tester de vrais algos.
Mais attention, Apple n’est pas du genre à fouiller dans vos messages pour améliorer son IA, même si Siri rêve secrètement de lire vos conversations de groupe. Elle préfère la technique de la confidentialité différentielle. En gros, elle fabrique elle-même des emails fictifs, puis elle les compare à vos vrais messages — pour ceux qui, courageusement (ou par stress d’appuyer trop vite sur “Accepter”), ont opté pour le partage d’analyses de l’appareil.
Quand l’IA s’entraîne sur du faux, c’est pour mieux comprendre le vrai… sans jamais violer votre vie privée !
Pour orchestrer cette supercherie digitale, Apple commence par créer des montagnes de faux messages, sur tous les sujets (on se demande si le spam de “Gagnez un iPhone gratuit” est déjà dans la base de tests…). Ensuite, elle génère ce qu’on appelle des “embeddings”, des petites signatures numériques représentant chaque message, selon sa langue, sa longueur, son sujet, et probablement son nombre de points d’exclamation.
Ces empreintes digitales de mails fictifs sont ensuite envoyées sur quelques appareils qui ont accepté de jouer les cobayes volontaires. Ces appareils comparent les signatures à leurs vrais emails – rassurez-vous, tout cela reste privé – et font remonter à la maison mère les ressemblances frappantes… ou, au contraire, les plantages.
Apple ne compte pas s’arrêter là : la recette de la donnée synthétique va bientôt faire le tour de son écosystème maison. Génération de Genmoji, Image Playground, Image Wand, création de souvenirs et outils de rédaction : tout le monde aura bientôt droit à sa dose de “faux pour du vrai”, un peu comme de la viande végétale pour les vegans de la tech.
En résumé, chez Apple, on essaye de tirer du vrai progrès grâce à du faux contenu. L’avenir nous dira si cette méthode saura vraiment sauver la face à ces IA parfois à côté de la plaque… Mais bon, au moins, les robots ne liront toujours pas vos messages d’amour gênants à 2h du matin (et c’est déjà ça !)
Source : Techcrunch