Groupe de Travail Statistique Génome et Régulation.

IML - MMG






Ce groupe réunit l'équipe "mathématiques pour le génôme" de l'IML et l'équipe "Bioinformatique des réseaux régulateurs du développement"  du LGPD.
L'objectif est de .....

Le groupe se réunit une fois par semaine, en général le Jeudi à 14h à l'IML, troisième étage, salle des séminaires (N° 306).

    Les séances principales seront étiquetées A. Elles ont pour objectif de présenter un ensemble d'articles récents sur les techniques statistiques employées en Bio Informatique : Apprentissage supervisé et non supervisé, Rééchantillonnage, Analyse des séquences.
Les "outils" abordés seront choisis parmi les suivants : CART, Boosting, SVM, Réseaux Bayésiens, Echantillonneur de Gibbs  ....

    Les séances étiquetées B seront orientées "théorie et approfondissement". Il s'agira de comprendre les résultats de convergence des estimateurs utilisés dans CART Boosting et SVM.
 

Programme

_________________________________________________________________________

Jeudi 16/10 14h,A,  Badih GHATTAS
L'apprentissage en statistique, un tour d'horizon ....

Jeudi 23/ 10  14h, A, David Martin, Gonzalo Perera et Badih Ghattas
Gibbs sampling et recherche de motifs communs à des séquences.
Références : G. Thijs et al. (2002) et G.Z. Hertz et al. (1999).

Jeudi 30/10 14h, B, B. Ghattas.
suite de la séance précédente.

Jeudi 6/11 14h, A, Marylin Zago
Les réseaux bayésiens, introduction et état de l'art

!!!  Attention changement d'horaire et de date !!!

Lundi 24/11 14h, B,  Elisabeth Remy
Les réseaux bayésiens modélisation en continu.
Référence :    Perrin et al.

Jeudi 4/12 14h, B, B. Ghattas
Les réseaux bayésiens, approche non paramètrique en continu.
Référence :   Tamada et al.

Mercredi 10/12 14h, B,  Brigitte Mossé
Les réseaux booléens.
Référence :    Tatsuya Aktusu el al. (2000)
 

Jeudi 18/12 15h, A,  David Martin

"String Pattern Regression algorithm".
Référence : Bannai et al. 2002.
 
 

Jeudi 8/1/2004 14h, A,  Elisabeth Remy
 

Référence : Hartemink et al. (2002)

Jeudi 15/1/2004 15h, A,  Brigitte Mossé
 

Référence : Laubenbacher  (2003)

_________________________________________________________________________
 

Séances prévues

Anis Ben Ishak : Les SVM, exemples d'applications en Bio Informatique.
 
 
 
 
 
 

Références :
(Une version électronique est disponible pour certains articles, il suffit de me la demander)

Apprentissage et SVM

L. Devroye, L. Gyorfi, G. Lugosi. A Probabilistic theory of Pattern Recognition. Springer Verlag, 1997.

V. Vapnik . Statistical Learning Theory . John Wiley and Sons Inc., New York, 1998.

N. Cristiannini, John Shawe-Taylor. An Introduction to Support Vector Machines. Cambridge University Press
2000.
 

Analyse de Séquence
 

Lon R. Cardon, Gary D. Stormo. Expectation Maximization Algorithm for Identifying Protein Binding Sites with Variable Lengths from Unaligned DNA Fragments J.Mol Biology (1992) 223, 159-170.

G.Z. Hertz, Gary D. Stormo. Identifying DNA and Protein patterns with statistically significant alignments of multiple sequences. BIOINFORMATICS Vol 15 nos 7/8 1999, pp 563-577.

G. Thijs, K. Marchal, Y. Moreau, B. De Moor. Finding gapped motifs within a Gibbs Sampling Framework. BIOINFORMATICS Vol 1 n°1 2002, pp 1-8.

Charles E. Lawrence, S.F. Altschul, M.S. Boguski, J.S. Liu, A.F. Neuwald, J.C.Wootton. Detecting Subtle Sequence Signals : A Gibbs Sampling Strategy for Multiple Alignment. Science Vol 262. pp208-214.

W.K. Hastings. "Monte Carlo sampling methods using Markov chains and their applications". Biometrika 1970, 57, 1, p.97.

A.P. Dempster, N.M. Laird, D.B. Rubin. "Maximum Likelihood from Incomplete Data via the EM Algorithm". Royal Statistical Society Vol 39, N°1, 1977.
 

Bannai H., SchuneSuke Inenaga,  A. Shinohara. "A String Pattern Regression Algorithm and its application to pattern discovery in Long Introns".  Genome Informatics, 13: 3-11, 2002.

Réseaux bayésiens
 

K. Murphy, S. Mian. Modelling Gene Expression Data using Dynamic Bayesian Networks. (1999)

B.E. Perrin, L. Ralaivola, A. Mazurie, S. Bottani, J. Mallet, F. D'Alché-Buc. Gene Networks inference using dynamic Bayesian networks. BioInformatics Vol. 19 Suppl. 3 2003, pp. ii138-ii148 .

Y. Tamada, S.Y. Kim, H. Bannai, S. Imoto, K. Tashiro, S. Kuhara, S. Miyano. Estimating Gene networks from gene expression data by combining Bayesian Network model with promoter element detection. BioInformatics, Vol 19 Suppl. 3 2003 pp. ii227-ii236.

Tatsuya Akutsu, Satoru Miyano and Satoru Kuhara. "Inferring Qualitative relations in genetic networks and metabolic pathways". BioInformatics Vol 16 N°8, pp.727-734 (2000)
 

Hartemink A., D.K. Gifford; T. Jaakkola, R.A. Young.  "Combining location and expression data for principled discovery of genetic regulatory network models" (2002).
 

R. Laubenbacher and Brandilyn Stigler. " A Computational Algebra Approach to the Reverse Engineering of Gene Regulatory Networks". (2003).
 

Dernière mise à jour 15/12/2003
Questions, commentaires ---> ghattas@iml.univ-mrs.fr