Skip to content

SAE201

C'était un projet au cours duquel nous étions chargés de trier les avis que nous avions extraits des différentes plateformes d'applications (Google Play, App Store). Au sein de notre agence, chaque membre de l'équipe a extrait des d'avis en les classant en fonction du nombre d'étoiles laissé. Une fois que tous les avis ont été extraits, mes collègues m'ont transmis les 5 différents fichiers, que j'ai ensuite regroupés en un seul fichier.

En utilisant MATLAB, j'ai importé le fichier afin d'en extraire les mots importants. J'ai ensuite effectué un tri en utilisant des tableaux pour éliminer les mots indésirables et mettre en évidence les mots dont j'avais besoin. Ceci m'a permis de mettre en évidence les mots clés les plus pertinents provenant des avis des utilisateurs.

En analysant les mots les plus fréquents et significatifs, j'ai pu obtenir une vision claire des points forts et des problèmes récurrents liés aux applications.

PDF

Résultat de l'analyse des avisSAE201

Code permettant de trier les avis et de mettre en évidence les mots clés les plus pertinents

matlab
% Prgm de Text Analytics Toolbox (2022)
clear all, close all force, clc

n=4; % Le type: rapports de stage (1) / les avis (2) / les categories (3) / les questions (4)
nbre_mots = 20; % Pour les top_bag
taille_mini = 4; % Taille égale et en dessous de laquelle on supprime les jetons
nbre_sujets = 2; % Le nombre de sujets choisis (LDA et LSA)
mots_associes = {'compétition'; 'consommation'; 'geste'; 'déchets'; 'déchet'; 'adopter'} % les mots selectionnés
mots_retires = ["persona" "personne" "persona" "pense" "prendre" "dorian" "maryse" "germina" "serait" "petit" ""]; % les mots retirés
ngrams_nbmots = [2 3]; % groupes de 2 et 3 mots [2 3], seul 2: [2]
ngrams_fichiers = [1:7]; % fichiers 1 et 7: [1 7], tous: [:] ou [1:10] si 10 fichiers
ngrams_long = 10; % on affiche les 10 premiers ngrams (dans la console)
matrice_utilisee = 'SAE201_dx01.mat';

% On récupère les données dans ran?