Δημιουργία συστήματος εξαγωγής της άποψης (από τα σχόλια στην Αγγλική γλώσσα) των χρηστών με τη χρήση του Rapidminer v5.3.
Το συστημα μας μπορει αν συνδιαστεί με οποιοδήποτε πληροφοριακό σύστημα που μπορούν να εξαχθούν τα σχόλια των χρηστών π.χ φορουμ, blog ή διάφορα API συστημάτων (π.χ youtube, twitter κλπ.) σε μορφή κειμένου.
Το σύστημα μας αποτελείται από δυο μερη. Το πρώτο κανει φιλτράρισμα του καθε σχολίου και αποθήκευση μόνο των ουσιαστικών που έχει γράψει ο χρήστης (αφαιρούνται άρθρα, ρήματα κι επίθετα). Το δεύτερο δημιουργει το μοντελο με εκπαιδευση του με εφαρμογή βάσεων λέξεων θετικών και αρνητικών λέξεων και επειτα το εφαρμοζει στα σχολια που εχουν εξαχθει απο το πρώτο μερος. Τέλος δημιουργείται πίνακας που κατηγοριοποιεί αυτόματα τα σχόλια σε θετικά ή αρνητικά και σε ποιό ποσοστό. Στην παρακάτω εικόνα παρουσιάζεται η παραπάνω μεθοδολογία με γραφικό τρόπο.
Εικόνα 1. Μεθοδολογία
Φιλτράρισμα κειμένου και εμφάνιση μόνο των ουσιαστικών (nouns) 2-25 χαρακτήρων. Η πιο κάτω εικόνα παρουσιάζει την υλοποίηση στο Rapidminer.
Εικόνα 2. Text Filtering
Δημιουργία Τraining Model και Διανύσματος Λέξεων Σχολίων. Εφαρμογή του μοντελου στο διάνυσμα των λεξεων (ανα σχόλιο) κι αυτόματη κατηγοριοποιήση των σχολίων σε θετικά και αρνητικά. Οι πιο κάτω εικόνες παρουσιάζουν την υλοποίηση στο Rapidminer.
Εικόνα 3. Training Model (βασισμένο στο SVM Linear)
Εικόνα 4. Word Vector List