Accueil l'audio Pourquoi certains projets d'apprentissage automatique pourraient-ils nécessiter un nombre énorme d'acteurs?

Pourquoi certains projets d'apprentissage automatique pourraient-ils nécessiter un nombre énorme d'acteurs?

Anonim

Q:

Pourquoi certains projets d'apprentissage automatique pourraient-ils nécessiter un nombre énorme d'acteurs?

UNE:

Lorsque vous pensez à l'apprentissage automatique, vous avez tendance à penser à des scientifiques des données qualifiés travaillant sur des claviers dans des salles informatiques. L'accent est mis sur l'analyse quantitative et les algorithmes. Il n'y a pas beaucoup de contexte réel immédiat dans beaucoup de ces programmes - du moins, c'est ce que beaucoup penseraient.

Cependant, certains des programmes d'apprentissage automatique les plus révolutionnaires d'aujourd'hui utilisent de véritables armées d'acteurs humains dans la rue, dans les magasins et partout où ils peuvent modéliser les activités humaines de base comme la marche, le travail ou les achats.

Téléchargement gratuit: apprentissage automatique et pourquoi c'est important

Un article Wired de Tom Simonite illustre très bien cela avec le titre approprié "Pour rendre l'IA plus intelligente, les humains effectuent des tâches Oddball à bas prix".

À l'aide de l'exemple de courtes vidéos prises dans une épicerie Whole Foods, Simonite met en évidence les types de travail qui aideront à construire une partie de la prochaine phase de l'apprentissage automatique.

Cela conduit à se demander pourquoi toutes ces personnes sont engagées à se filmer dans des vidéos courtes et simples documentant des actions aussi rudimentaires que de déplacer un bras ou une jambe.

La réponse met en lumière où se trouve le machine learning et où il va.

«Les chercheurs et les entrepreneurs veulent voir l'IA comprendre et agir dans le monde physique», écrit Simonite, expliquant pourquoi lui et d'autres se déplacent avec des caméras. «D'où la nécessité pour les travailleurs de jouer des scènes dans les supermarchés et les maisons. Ils génèrent du matériel pédagogique pour enseigner des algorithmes sur le monde et les gens qui s'y trouvent. »

Comme de nombreux experts le feront remarquer, certaines des plus grandes frontières de l'apprentissage automatique concernent le traitement d'image et le traitement du langage naturel. Ce sont des procédures extrêmement quantitatives - en d'autres termes, il n'y a pas un large éventail d'entrées comme il en existe dans des environnements réels "performants". Au lieu de cela, les programmes d'apprentissage automatique utilisent des données visuelles et audio de manière très spécifique pour créer des modèles. Avec le traitement d'image, il sélectionne des caractéristiques d'un champ de vision (fini). Pour la PNL, il s'agit d'assembler des phonèmes.

Aller au-delà de ces catégories d'entrée spécifiques implique quelque chose que vous pourriez appeler le «fossé entre l'image et la parole» - en allant au-delà de choses comme le traitement d'image et la reconnaissance vocale, vous allez dans des domaines où les ordinateurs doivent être analytiques de différentes manières. Les ensembles de formation seront fondamentalement différents.

Entrez dans l'armée de vidéastes. Dans certains de ces nouveaux projets d'apprentissage automatique, les plus petites idées d'activités humaines sont les ensembles de formation. Au lieu d'être formés pour rechercher des fonctionnalités, des bords et des pixels qui composent les tâches de classification, les ordinateurs utilisent plutôt des vidéos de formation pour évaluer à quoi ressemblent différents types d'action.

L'essentiel est de savoir ce que les ingénieurs peuvent faire avec ces données lorsqu'elles sont agrégées et chargées, et lorsque l'ordinateur y est formé. Vous verrez bientôt les résultats dans divers domaines - par exemple, cela rendra la surveillance extrêmement efficace. Les ordinateurs pourront «voir» dans le champ visuel ce que font les gens et l'appliquer à des domaines comme le marketing et les ventes, ou peut-être, dans certains cas, le travail d'agence gouvernementale ou la justice pénale.

Les ramifications ont également éclairé le débat entre les avantages maximaux et les questions de confidentialité. Une grande partie de l'utilisation de ces vidéos permettra de créer des modèles d'apprentissage automatique qui fonctionnent pour la surveillance - mais qu'en est-il des personnes qui ne veulent pas être surveillées? Lorsque ces nouveaux programmes de machine learning sont déployés dans l'espace public, quels sont les droits de l'individu et où se situe cette ligne?

Dans tous les cas, les entreprises utilisent ces types de ressources humaines et vidéo pour vraiment creuser dans des cycles de progrès d'apprentissage machine de niveau supérieur qui permettront en fait aux ordinateurs de reconnaître ce qui se passe autour d'eux, plutôt que de simplement classer les images ou travailler avec les phonèmes de discours. Il s'agit d'un développement extrêmement intéressant et controversé en intelligence artificielle, et qui mérite sa part d'attention dans les médias technologiques et au-delà.

Pourquoi certains projets d'apprentissage automatique pourraient-ils nécessiter un nombre énorme d'acteurs?