Table des matières:
- Définition - Que signifie l'exploration de données textuelles?
- Techopedia explique l'exploration de données textuelles
Définition - Que signifie l'exploration de données textuelles?
L'exploration de données texte implique de parcourir un document texte ou une ressource pour obtenir des informations structurées précieuses. Cela nécessite des outils analytiques sophistiqués qui traitent le texte afin de glaner des mots clés spécifiques ou des points de données clés à partir de formats considérés comme relativement bruts ou non structurés.
L'exploration de données de texte est également connue sous le nom d'exploration de texte ou d'analyse de texte.
Techopedia explique l'exploration de données textuelles
Dans l'exploration de données texte, les systèmes d'ingénierie utilisent des éléments tels que les taxonomies et l'analyse lexicale pour déterminer quelles parties d'un document texte sont utiles en tant que données extraites. Les modèles statistiques sont généralement utiles et les systèmes peuvent également utiliser des heuristiques ou des conjectures algorithmiques pour essayer de déterminer quelles parties d'un texte sont importantes. D'autres systèmes de contrôle incluent le balisage et l'analyse de mots clés, où les outils recherchent des noms propres spécifiques ou d'autres balises et mots clés pour comprendre ce qui est écrit.
Un autre composant unique de l'exploration de texte est souvent appelé analyse des sentiments. Dans l'analyse des sentiments, qui est généralement beaucoup plus difficile que l'analyse statistique, les outils analytiques tentent de comprendre l'ambiance ou le sentiment derrière le texte écrit et d'autres aspects de ce qu'il aborde à un niveau très subjectif et intuitif. Avec l'émergence d'outils d'intelligence artificielle, de nombreux progrès ont été réalisés dans l'analyse des sentiments, de sorte que l'exploration de données de texte moderne est plus que la simple collecte de références quantitatives et implique d'apporter des modèles conceptuels de haut niveau à l'exploration de texte pour trouver des moyens nouveaux et uniques. pour agréger des données précieuses.
