Ects : 3 Enseignant responsable : PATRICE BERTRAND Volume horaire : 30 Description du contenu de l'enseignement : 1. Rappels et compléments sur l’Analyse Factorielle d’un nuage de points (ACP), l’Analyse des Correspondances (AFC), l’Analyse des Correspondances Multiples (ACM). 2. Généralités sur les techniques de Scoring. Analyse Discriminante (AD) : Analyse factorielle discriminante, Analyse discriminante décisionnelle, Cas de deux groupes, Multicolinéarité, Analyse discriminante sur variables qualitatives (méthode DISQUAL, Analyse discriminante barycentrique), Analyse Discriminante Bayésienne dans le cas gaussien. 3. Méthodes de validation : Validation croisée et courbe ROC. 4. Régression logistique : Modélisation, Estimation des coefficients par le Maximum de Vraisemblance. Tests. Régression pas à pas. 5. Arbres de décision. L'ensemble de ces méthodes enseignéess est illustré par des démonstrations du logiciel R sur des jeux de données réel (principalement ACP, AFC, ACM, AD linéaire et quadratique, Régression logistique).
Compétences à acquérir : Ce cours étudie les méthodes d’analyse des données et ses applications en scoring. L’ensemble de ces méthodes enseignées est illustré par des démonstrations du logiciel R sur des jeux de données réels. Maîtriser la théorie des techniques de scoring. Mode de contrôle des connaissances : Examen Bibliographie-lectures recommandées 1. Bardos, M. (2001), Analyse discriminante. Application au risque financier, 232 pages, Du- nod. 2. Benzecri, J.-P. (1980) Pratique de l’analyse des données. Dunod. Paris. 3. Breiman,L., Friedman, J.H.,Olshen,R., and Stone,C.J., 1984. Classification and Regression Trees, Wadsworth & Brooks/Cole Advanced Books & Software, Pacific California. 4. Celeux, G., Ed. (1990), Analyse discriminante sur variables continues, 194 pages, INRIA. 5. Celeux, G., Nakache, J.P. (1994), Analyse discriminante sur variables qualitatives, 280 pages, Polytechnica. 6. Hastie, T., Tibshirani, R., Friedman, J. (2009) The Elements of Statistical Learning : Data Mining, Inference, and Prediction, Second Edition, Springer Series in Statistics. 7. Hosmer,D.W.,Lemeshow,S. (1989) Applied Logistic Regression, John Wiley Son, Inc, New York. 8. Husson, F., Lê, S., Pagès, J. (2009) Analyse de données avec R. Presses Universitaires de Rennes 9. Lebart, L., Piron, M. , Morineau, A. 2006 (4ème edition, refondue) Statistique Exploratoire Multidimensionnelle, 480 pages, Dunod. 10. Nakache, J.P., Confais, J. (2003), Statistique explicative appliquée : Analyse discriminante, Modèle logistique, Segmentation par arbre, 294 pages, Technip. 11. Quinlan, J.R. (1993) C4.5 Programs for Machine Learning. Morgan Kaufmann, San Mateo, California. 12. Saporta, G. (2006), Probabilités, Analyse des donne ´es et Statistique, 656 pages, Technip.