When you enroll in this course, you'll also be enrolled in this Specialization.
Learn new concepts from industry experts
Gain a foundational understanding of a subject or tool
Develop job-relevant skills with hands-on projects
Earn a shareable career certificate
There are 4 modules in this course
Este curso te brindará los conocimientos necesarios para la extracción, limpieza y preparación de distintas fuentes de datos para ser incluidos en un proceso de NLP.
Para realizar este curso es necesario contar con conocimientos de programación de nivel básico a medio, deseablemente conocimiento básico del lenguaje Python y es recomendable conocer el entorno de Jupyter Notebooks del entorno Anaconda.
Para desarrollar aplicaciones se va a utilizar Python 3.6 o superior. Alternativamente se puede utilizar el entorno de Anaconda con la misma versión de Python.
Como editor de código, los ejemplos van a ser editados en el Notebook de Anaconda, pero el alumno puede utilizar cualquier editor de texto que reconozca notebooks de Anaconda.
Librerías que es necesario tener instaladas para realizar el curso: NLTK, Pandas, Scikit-learn y librerías de extracción de datos.
Este módulo te permitirá obtener los conocimientos necesarios para la construcción de un programa de extracción de datos de páginas Web basadas en HTML.
Problemas que pueden resolverse con Web Scraping•5 minutes
Problemas que pueden resolverse con Web Scraping - Conclusiones•5 minutes
6 readings•Total 76 minutes
Bienvenidos a la Universidad Austral•1 minute
Dinámica del curso•10 minutes
Glosario•20 minutes
Nociones básicas de Web Scraping. 3 técnicas para extracción de distintos formatos de páginas web•15 minutes
Principales etapas del Web Scraping•20 minutes
Material complementario •10 minutes
3 assignments•Total 80 minutes
Evaluación del módulo•40 minutes
Test de la lección•20 minutes
Test de la lección•20 minutes
2 discussion prompts•Total 20 minutes
Analizando las etapas del Web Scrapping•10 minutes
El Web Scarping y NLP•10 minutes
1 plugin•Total 15 minutes
Podcast: Mi experiencia como profesional•15 minutes
HTML Parsing para Procesamiento de Lenguaje Natural
Module 2•3 hours to complete
Module details
En este módulo se describen un conjunto de pasos necesarios para el pre procesar páginas HTML y extraer información de ellas. Además, se detallarán distintos tipos de aproximación al mismo.
Revisión exhaustiva del proceso de Parsing en páginas HTML•15 minutes
Diseño de un parser •15 minutes
Principales formas de hacer parsing en páginas HTML•15 minutes
Material complementario•10 minutes
3 assignments•Total 90 minutes
Evaluación del módulo•40 minutes
Test de la lección•20 minutes
Test de la lección•30 minutes
1 discussion prompt•Total 10 minutes
El Parsing y sus tipos de técnica•10 minutes
Técnicas avanzadas de Scraping
Module 3•3 hours to complete
Module details
En este módulo se presentarán las técnicas avanzadas de scraping para extracción de datos de páginas HTML que utilizan diversas librerías de JavaScript para su construcción
Programación concurrente y programación distribuida•4 minutes
Programación de parsers avanzados•7 minutes
4 readings•Total 55 minutes
Metodologías de parsing avanzado•15 minutes
Apuntes de ingeniería de software para la construcción de parsers•15 minutes
¿Cómo evaluar el lenguaje de programación más apropiado para la construcción del parser?•15 minutes
Material complementario Selección de links parser avanzado.•10 minutes
3 assignments•Total 90 minutes
Evaluación del módulo•40 minutes
Test de la lección•20 minutes
Test de la lección•30 minutes
1 discussion prompt•Total 10 minutes
Analizando el grado de concurrencia que debe poseer el parser•10 minutes
1 plugin•Total 15 minutes
Podcast: mi experiencia profesional•15 minutes
Técnicas de Manipulación de texto
Module 4•3 hours to complete
Module details
Una vez estriado el texto de las paginas HTML que es una fuente habitual de extracción de información, se pueden sumar distintas fuentes de tipos de datos, como ser PDF, DOC, XLS e imágenes. En este módulo se verán diversas técnicas que pueden servir para recolectar la información de ellas y unificarlas en un mismo conjunto de documentos.
La Universidad Austral se propone servir a la sociedad a través de la búsqueda de la verdad, mediante el desarrollo y transmisión del conocimiento, la formación en las virtudes y la atención de cada persona según su destino trascendente, proponiendo un estilo de liderazgo intelectual, profesional, social y público.
When will I have access to the lectures and assignments?
To access the course materials, assignments and to earn a Certificate, you will need to purchase the Certificate experience when you enroll in a course. You can try a Free Trial instead, or apply for Financial Aid. The course may offer 'Full Course, No Certificate' instead. This option lets you see all course materials, submit required assessments, and get a final grade. This also means that you will not be able to purchase a Certificate experience.
What will I get if I subscribe to this Specialization?
When you enroll in the course, you get access to all of the courses in the Specialization, and you earn a certificate when you complete the work. Your electronic Certificate will be added to your Accomplishments page - from there, you can print your Certificate or add it to your LinkedIn profile.
Is financial aid available?
Yes. In select learning programs, you can apply for financial aid or a scholarship if you can’t afford the enrollment fee. If fin aid or scholarship is available for your learning program selection, you’ll find a link to apply on the description page.