Accueil l'audio Comment de nouvelles capacités d'apprentissage automatique peuvent-elles permettre l'extraction de documents de stock pour des données financières?

Comment de nouvelles capacités d'apprentissage automatique peuvent-elles permettre l'extraction de documents de stock pour des données financières?

Anonim

Q:

Comment de nouvelles capacités d'apprentissage automatique peuvent-elles permettre l'extraction de documents de stock pour des données financières?

UNE:

L'une des nouvelles frontières passionnantes de l'apprentissage automatique et de l'IA est que les scientifiques et les ingénieurs se lancent dans différentes façons d'utiliser des types de ressources complètement nouveaux pour prédire les mouvements de stocks et les résultats d'investissement. Il s'agit d'un formidable changeur de jeu dans le monde financier, et va révolutionner les stratégies d'investissement d'une manière très profonde.

L'une des idées de base pour étendre ce type de recherche boursière est la linguistique informatique, qui implique la modélisation du langage naturel. Les experts étudient comment utiliser les documents texte, des dépôts auprès de la SEC aux lettres des actionnaires en passant par d'autres ressources textuelles périphériques, afin d'augmenter ou d'affiner l'analyse des stocks ou de développer des analyses entièrement nouvelles.

Téléchargement gratuit: apprentissage automatique et pourquoi c'est important

L'avertissement important est que tout cela n'est possible que grâce à de toutes nouvelles avancées dans les réseaux de neurones, l'apprentissage automatique et l'analyse du langage naturel. Avant l'avènement du ML / AI, les technologies informatiques utilisaient principalement la programmation linéaire pour «lire» les entrées. Les documents texte étaient trop peu structurés pour être utiles. Mais avec les progrès réalisés dans l'analyse du langage naturel au cours des dernières années, les scientifiques constatent qu'il est possible de «miner» le langage naturel pour des résultats quantifiables ou, en d'autres termes, des résultats qui peuvent être calculés d'une manière ou d'une autre.

Certaines des meilleures preuves et des exemples les plus utiles proviennent de diverses dissertations et travaux de doctorat disponibles sur le Web. Dans un article intitulé «Applications of Machine Learning and Computational Linguistics in Financial Economics», publié en avril 2016, Lili Gao explique avec compétence les processus pertinents spécifiques à l'extraction de documents SEC d'entreprise, d'appels aux actionnaires et de messages sur les réseaux sociaux.

"Extraire des signaux significatifs à partir de données texte non structurées et de grande dimension n'est pas une tâche facile", écrit Gao. "Cependant, avec le développement de l'apprentissage automatique et des techniques linguistiques de calcul, le traitement et l'analyse statistique des tâches des documents textuels peuvent être accomplis, et de nombreuses applications de l'analyse statistique des textes en sciences sociales se sont avérées efficaces." À partir de la discussion de Gao sur la modélisation et l'étalonnage dans l'abstrait, l'ensemble du document développé montre comment certains de ce type d'analyse fonctionnent en détail.

D'autres sources de projets actifs incluent des pages comme ce résumé de projet GitHub et cette ressource IEEE traitant spécifiquement de l'obtention d'informations financières précieuses à partir de «l'analyse des sentiments Twitter».

L'essentiel est que l'utilisation de ces nouveaux modèles de PNL stimule l'innovation rapide dans l'utilisation de toutes sortes de documents texte, non seulement pour l'analyse financière, mais pour d'autres types de découvertes de pointe, brouillant cette ligne traditionnellement établie entre «langue» et "Les données."

Comment de nouvelles capacités d'apprentissage automatique peuvent-elles permettre l'extraction de documents de stock pour des données financières?