## # Leslie REGAD # Gaëlle LELANDAIS # This content is licensed under CC BY 4.0 ## # Lecture du fichier data = read.table("Mito_Genes.txt", header = T, row.names = 1) ### # Exercice 1 ### # nombre de gènes ? nrow(data) # nombre de points de temps ? ncol(data) # autre solution : dim(data) # avec le nombre de gènes dim(data)[1] # nombre de points de temps dim(data)[2] ### # Exercice 2 ### # moyenne pour tous les gènes vecMean = apply(data, 1, mean) # identification des gènes pour lesquels les valeurs > 10 vecMean > 10 # récupération des noms des gènes associés names(vecMean)[vecMean > 10] # sélection de ce gènes dans le tableau initial dataSelect = data[vecMean > 10,] # autre solution dataSelect = data[names(vecMean)[vecMean > 10],] # écriture des résultats write.table(dataSelect, file = "Mito_Genes_Moy10.txt", quote = F, row.names = TRUE, col.names = TRUE, sep = "\t") ### # Exercice 3 ### # moyenne pour tous les gènes vecMean = apply(data, 1, mean) # valeur du seuil T = 15 # sélection de ce gènes dans le tableau initial dataSelect = data[vecMean > T,] # écriture des résultats write.table(dataSelect, file = paste0("Mito_Genes_Moy", T, ".txt"), quote = F, row.names = TRUE, col.names = TRUE, sep = "\t") ### # Exercice 4 ### # moyenne pour tous les gènes vecMean = apply(data, 1, mean) # boucle for() for(T in 10:15){ # sélection de ce gènes dans le tableau initial dataSelect = data[vecMean > T,] # écriture des résultats write.table(dataSelect, file = paste0("Mito_Genes_Moy", T, ".txt"), quote = F, row.names = TRUE, col.names = TRUE, sep = "\t") } ### # Exercice 5 ### data2 = read.table("Mito_Genes_2.txt", header = T) # identification des gènes dupliqués duplicated(data2[,"GENE_ID"]) # récupération des gènes dupliqués data2[duplicated(data2[,"GENE_ID"]),"GENE_ID"] # identification des gènes manquants !(row.names(data) %in% data2[, "GENE_ID"]) # récupération des gènes manquants row.names(data)[!(row.names(data) %in% data2[, "GENE_ID"])]