Fiche de TD INF 356
Fiche de TD INF 356
Fiche de TD INF 356
b) Consistency
c) Atomicity
d) Availability
6- Lesquelles des bases de données NoSQL suivantes sont les plus simples?
a) Clé-Valeur
b) Document
c) Colonne large
d) Tout ce qui précède
7- MongoDB est système de gestion de bases de données
a - SQL
b - Les deux réponses sont correctes
c - NoSQL
d- Les deux réponses sont incorrectes
EXERCICES RESOLUS SUR DES QCM SUR MAPREDUCE GROUPE 2:
7) YARN signifie :
a) Yahoo’s another resource name
b) Yet another resource negotiator
c) Yahoo’s archived Resource names
d) Yet another resource need.
8) Elasticsearch est …
a) un serveur de bases de données
b) un outil de traitement de données
c) un outil de visualisation de données
d) un serveur de pages Web
9) __________ peut-être décrit comme un modèle de programmation utilisé
pour développer des applications basées sur Hadoop qui peuvent traiter des quantités
massives de données.
a) MapReduce
b) Mahout
c) Oozie
d) Toutes les réponses précédentes
II. HADOOP
1- Apache Hadoop atteint la fiabilité en répliquant les données sur plusieurs hôtes et ne
nécessite donc pas de stockage sur les hôtes.
a. Système de fichiers
b. RAID (Redundant Arry of Independent Disks) en français regroupement
redondant des disques indépendants
c. FS local
d. Système opérateur
a. Oui
b. Non
c. Oui sur NameNode, Non sur DataNode
d. Oui sur DataNode, Non sur NameNode
3- Laquelle des commandes suivantes sont utilisée pour entrer en mode de sécurité?
4- HDFS permet à un client de lire un fichier qui est déjà ouvert pour l'écriture?
a. Faux
b. Vrai
a. Lecture seulement
b. Écriture seule
c. Lire écrire
d. Aucune de ces réponses
a. Lecture seulement
b. Écriture seule
c. Lire écrire
d. Aucune de ces réponses
10- fichiers HDFS dans Hadoop fait laquelle des actions suivantes?
a. Ruche
b. Percer
c. Oozie
d. Buse
12- Hadoop peut être déployé sur des serveurs de base, ce qui permet un traitement à
faible coût ainsi que le stockage d'énormes volumes de données non structurés.
a. Vrai
b. Faux
13- Lequel des éléments suivant sont utilisé pour ingérer des données en streaming dans
des clusters Hadoop?
a. Buse
b. Sqoop
c. Les deux ci-dessus
d. Aucune de ces réponses
a. Java
b. Python
c. C ++
d. Tout ce qui précède
16- Commande Hadoop pour lister tous les blocs correspondant à chaque fichier dans le
hdfs?
18- Tous les fichiers d'un répertoire dans HDFS peuvent être fusionnés en utilisant lequel
des éléments suivants?
a. mettre fusionner
b. obtenir la fusion
c. remerge
d. fusionner tout
19- HDFS permet à un client de lire un fichier qui est déjà ouvert pour l'écriture?
a. Faux
b. Vrai
20- Les fichiers HDFS dans Hadoop fait laquelle des actions suivantes?
III. CASSANDRA
20. Avant de pouvoir utiliser le cqlsh dans un environnement Windows, il est obligatoire
d’installer
a. Java
b. Command prompt
c. Net Framework 4.5
d. Python
IV. HBASE
Chacune des questions suivantes n’a une et une seule bonne réponse.
1-MongoDB est système de gestion de bases de données
a - SQL c - Les deux réponses sont correctes
b - NoSQL d- Les deux réponses sont incorrectes
6- ObjectID est
a - l'identifiant unique d’un document généré par l’utilisateur
b - l'identifiant universel d’un document généré par le serveur mongoDB
c - l'identifiant universel d’une collection généré par le serveur mongoDB
d - l'identifiant unique d’un document généré par le serveur mongoDB
14- Quelle commande utilise t’on pour installer Mongodb sur Linux :
a – sudo apt-get install mongodb -o
b - sudo apt-get install mongodb -y
c - sudo apt-get install -y mongodb-org
d - sudo apt-get install -y mongodb
15- Quelle commande est utilisée pour lancer mongodb sur Linux
a - mongo
b - mongodb
c – mongodb start
d - mongo begen
16- Quelle commande est utilisée pour lister tous les documents d’une collection
etudiant
a - db.etudiant.findOne()
b - db.etudiant.find ()
c - db.etudiant.findAll ()
d - db.etudiant.find (‘All’)
17- Quelle commande est utilisé pour lister supprimer tous les étudiants de nom
‘toto’
a - db.etudiant.remove(toto)
b - db.etudiant.remove (nom=’’toto’’)
c - db.etudiant.remove ({ nom : ‘’ toto ‘’})
d - db.etudiant.delete ({nom=’’toto’’})
19- Quand nous utilisons mongodb, les documents sont stockés dans des
a – Tables c – Bases de données
b – Objets d – Collections
20- Quand nous utilisons mongodb, les Collections sont stockées dans des
a – Tables c - Bases de données
b – Objets d - Collections
VI. NEOJ4
Q. Commande pour mettre à jour les propriétés ou ajouter de nouvelles propriétés aux
relations existantes?
SET est la commande utilisée pour mettre à jour ou ajouter des propriétés aux relations
existantes.
Pour filtrer ou limiter le nombre de lignes renvoyées par une requête, nous utilisons la clause
Neo4j CQL LIMIT.
Q. Quelle est la syntaxe de l'opérateur IN?
Syntaxe de l'opérateur IN: IN []
Q. CREATE UNIQUE est utilisé pour?
CREATE UNIQUE utilisé pour fixer les structures de graphe.
Q. Quel est le plus rapide pour gérer les graphiques, MYSQL ou Neo4j?
Pour gérer les graphiques, Neo4j est le plus rapide par rapport à MYSQL.
Q. Quelle architecture permet un serveur distant?
Architecture REST, qui permet à neo4j pour les serveurs distants
LE LANGAGE CYPHER
1.4 Parmi les problèmes suivants, lesquels se prêtent bien à être traités par la
machine learning ?
1. Déterminer l’horaire optimal pour poster un contenu sur une page web.
2. Déterminer le chemin le plus court entre deux nœuds dans un graphe.
3. Prédire le nombre de vélos à mettre en location à chaque station d’un système de
location de vélos citadins.
4. Évaluer le prix qu’un tableau de maître pourra atteindre lors d’une vente aux
enchères.
5. Débruiter un signal radio.
1.3 Benjamin dispose de 10000 articles de journaux qu’il souhaite classer par leur
thématique. Doit-il utiliser un algorithme supervisé ou non supervisé?
1.4 Les données de Cécile sont décrites par 10 variables. Elle aimerait cependant les
représenter sur un graphique en deux dimensions. Quel type d’algorithme d’apprentissage
doit-elle utiliser?
1.5 David gère un outil qui permet d’organiser les liens HTML qui ont été sauvegardés. Il
souhaite suggérer des catégories auxquelles affecter un nouveau lien, en fonction des
catégories déjà définies par l’ensemble des utilisateurs du service. Quel type d’algorithme
d’apprentissage doit-il utiliser?
1.6 Elsa veut examiner ses spams pour déterminer s’il existe des sous-types de spams. Quel
type d’algorithme d’apprentissage doit-elle utiliser?
1.7 Tom Mitchell définit la machine learning comme suit : « Un programme informatique est
dit apprendre de l’expérience E pour la tâche T et une mesure de performance P si sa
performance sur T, comme mesurée par P, s’améliore avec l’expérience E ». Fred écrit un
programme qui utilise des données bancaires dans le but de détecter la fraude bancaire. Que
sont E, T, et P?
2) Les algorithmes de machine learning sont trop complexes pour être roulés dans le
nuage ? VRAI ou FAUX
3) Tous les exemples suivants sont des applications de machine learning, sauf:a)
Personnaliser les campagnes de marketing en fonction de la démographie des clients et de leur
historique d’achat.
b) Détecter les activités frauduleuses dans des transactions financières.
c) Analyser les IdO (internet des objets) afin de prédire les problèmes d’équipements avant
qu’ils se produisent. Analyser les revenus passés pour déterminer la cause de la chute des
ventes.
d) les revenus passés pour déterminer la cause de la chute des ventes.
6) L’apprentissage non supervisé consiste à utiliser un algorithme qui n’a pas besoin
d’être supervisé par un scientifiquedes données ? VRAI ou FAUX
10) L’apprentissage supervisé nécessite des données historiques pour lesquelles on connait
déjà les étiquettes ? VRAI ou FAUX
Solutions
1.2 1, 3, 4. (2 se résout par des algorithmes de recherche sur graphe, 5 par des algorithmes de
traitement du signal).
1) FAUX
2) FAUX
3) d) les revenus passés pour déterminer la cause de la chute des ventes.
4) FAUX
5) b)Ce sont toutes des techniques de machine learning.
6) FAUX
7) VRAI
8) VRAI
9) VRAI
10) VRAI