CABALLERO ROLDÁN, RAFAEL / MARTÍN MARTÍN, ENRIQUE / RIESCO RODRÍGUEZ, ADRIÁN
Cada día generamos una inmensa cantidad de información en formato de texto, como por ejemplo páginas web, documentos en Wikipedia, libros, artículos científicos, noticias en periódicos, etc. Aunque nos limitemos a un tema concreto, resulta prácticamente imposible leer, uno a uno, la enorme cantidad de documentos sobre esta materia que podemos encontrar en la red, por lo que precisamos de herramientas que nos permitan analizar automática y rápidamente gran cantidad de textos, de forma que se pueda extraer un conocimiento valioso de ellos.
¿Se trata de un texto que incluye un mensaje de odio hacia un cierto colectivo?
¿O es un texto cuyo contenido podemos etiquetar como alegre?
¿Cuál es su temática principal?
¿Qué personas o lugares se mencionan?
¿Se trata de un texto reflexivo o principalmente descriptivo?
Este libro te sumergirá en los fundamentos del análisis de texto para contestar a estas preguntas. Aprenderás cómo procesar y manipular cadenas de texto, leer ficheros, limpiar datos, identificar patrones y realizar tareas como tokenización, lematización y etiquetado gramatical. A medida que avances, descubrirás técnicas avanzadas, como el análisis de sentimiento, la extracción de entidades, la identificación de discursos y la detección de temas, que te permitirán comprender y aprovechar al máximo el potencial de la información textual.
Con ejemplos y código detallado, el libro te guiará a través de los pasos necesarios para realizar un análisis de texto completo utilizando Python y sus bibliotecas especializadas, como spaCy y NLTK. No importa si eres estudiante, investigador o profesional en busca de nuevas herramientas, adquirirás los conocimientos y habilidades básicas requeridas para afrontar los desafíos del procesamiento de textos. Prepárate para descubrir el poder del análisis de texto en Python y desbloquea un mundo de oportunidades en la era de la información y los datos.