Crèdits
5
Tipus
Obligatòria
Requisits
Aquesta assignatura no té requisits
, però té capacitats prèvies
Departament
CS
IHLT proporciona els coneixements bàsics de PLN de cara a cursar posteriorment les assignatures optatives AHLT i HLE. D'una banda, AHLT aprofundeix en les tècniques estadístiques de PLN. D'altra banda, HLE revisa l'estat de l'art sobre les aplicacions reals de la tecnologia de PLN.
Professorat
Responsable
- Jordi Turmo Borrás ( turmo@cs.upc.edu )
Altres
- Salvador Medina Herrera ( salvador.medina.herrera@upc.edu )
Hores setmanals
Teoria
2
Problemes
0
Laboratori
1
Aprenentatge dirigit
0
Aprenentatge autònom
5.93
Competències
Genèriques
Acadèmiques
Professionals
Treball en equip
Ús solvent dels recursos d'informació
Raonament
Objectius
-
Conèixer els conceptes fonamentals del Processament del Llenguatge Natural, les tècniques de processament més rellavants i els recursos existents utilitzats.
Competències relacionades: CEA5, CG1, CG3, CEP6, CT4, CT6, -
Conèixer les aplicacions més importants del processament del llenguatge natural i relacionar-les amb les teories, técniques i recursos més rellevants.
Competències relacionades: CEA5, CG1, CG3, CEP6, CT4, CT6, -
Realitzar programes per resoldre problemes que impliquin l'anàlisis de les tècniques i recursos del Processament del Llenguatge més apropiats, així com la utizació de recusos existents i el desenvolupament de nous. Un d'aquests programes serà de mitjana envergadura i es realitzarà en grups de dos estudiants.
Competències relacionades: CEA5, CG1, CG3, CEP4, CEP6, CEP7, CT3, CT4, CT6, -
Resoldre problemes (de forma individual i en grup) en l'entorn del Processsament del llenguatge Natural en els que s'hagin d'analitzar les técniques i els recursos més apropiats per la seva solució.
Competències relacionades: CEA5, CG1, CG3, CEP7, CT3, CT4, CT6,
Continguts
-
Estructura i idioma de document
Selecció de zones textuals, tokenització, separació d'oracions.
identificadors d'idioma -
Paraules
Morfologia, Automats d'estats finits, Transductors d'estats finits.
Desambiguació morfològica. Models ocults de Markov.
Semàntica lèxica, Recursos semàntics.
Desambiguació de sentits de paraules. -
Seqüències de paraules
Reconocimiento y clasificación de secuencias de parabras que formen un significado.
Models discriminatius BIO. Conditional Random Fields (CRF).
Reconeixement i classificació d'entidades nombrades (NERC).
Reconeixement de frases nominals. -
Oracions
Gramàtiques sintàctiques, tipologia.
Gramàtiques lliures de context.
Gramàtiques probabilístiques lliures de context.
Gramátiques en forma normal de Chomsky.
Analitzadors sintàctics, propietats i estratègies. Analizadores CKY y CKY probabilístico. -
Sequències d'oracions
Resolució de coreferencies. Deteccíó de mencions. Tipus de tècniques de generació de cadenes de mencions de coreferents. Model menció-menció. Model entitat-menció. Models de ranking.
Activitats
Activitat Acte avaluatiu
Reconeixement i classificació de seqüències de paraules que formin un significat.
Models discriminatius BIO. Conditional Random Fields (CRF). Reconeixement i classificació d'entidades nombrades (NERC). Reconeixement de frases nominals.Objectius: 4 3 1
Teoria
2h
Problemes
0h
Laboratori
1h
Aprenentatge dirigit
0h
Aprenentatge autònom
0h
Presentació de projectes
Teoria
4h
Problemes
0h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
40h
Exàmen final
Setmana: 15 (Fora d'horari lectiu)
Teoria
0h
Problemes
0h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
0h
Metodologia docent
Les classes estan organitzades en sessions de teoria/problemes i de laboratori.A cada sessió de teoria/problemes es presentaran els nous conceptes, problemàtiques relacionades i aproximacions per resoldre-les, i es resoldràn exercicis per tal de fixar els conceptes, tècniques i algorismes explicats.
A les sessions de laboratori es desenvoluparan petites pràctiques utilitzant eines i llenguatges adequats al PLN que permetran practicar i reforçar els coneixements apresos a les classes de teoria.
Mètode d'avaluació
L'avaluació consistirà en un examen final, un projecte i un lliurament per cada sessió de laboratori. A l'examen final entrarà el contingut de tot el curs.La nota del projecte i lliuraments de laboratori es calcularà a partir dels informes presentats pels estudiants.
El càlcul de la nota final es farà de la següent manera:
Nota Final = Nota examen final * 0.5 + Nota de laboratori * 0.5
Bibliografia
Bàsic
-
Speech and language processing: an introduction to natural language processing, computational linguistics, and speech recognition
- Jurafsky, D.; Martin, J.H,
Prentice-Hall, Inc.,
2024.
https://web.stanford.edu/~jurafsky/slp3/ -
The Oxford handbook of computational linguistics
- Mitkov, R. (ed.),
Oxford University Press,
2003.
ISBN: 0198238827
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991002689009706711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
Foundations of statistical natural language processing
- Manning, C.D.; Schütze, H,
MIT Press,
1999.
ISBN: 0262133601
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991001994779706711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
Handbook of natural language processing
- Dale, R.; Moisl, H.; Somers, H,
Marcel Dekker,
2000.
ISBN: 0824790006
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991002071619706711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
The Handbook of Computational Linguistics and Natural Language Processing Blackwell Handbooks in Linguistics
- Clark, Alexander ; Fox, Chris; Lappin, Shalom,
Wiley-Blackwell,
2010.
ISBN: 9781444324044
https://onlinelibrary-wiley-com.recursos.biblioteca.upc.edu/doi/book/10.1002/9781444324044
Web links
- Time table of the course depending on the holidays http://www.cs.upc.edu/~turmo/IHLT.html