Κατηγοριοποίηση συμβολοσειράς με βάση λέξεις -κλειδιά στο Excel

Anonim

Η κατηγοριοποίηση συμβολοσειράς με βάση ορισμένες λέξεις ήταν ένα από τα βασικά μου καθήκοντα στην ανάλυση δεδομένων. Για παράδειγμα, σε μια έρευνα αν ρωτήσετε τους ανθρώπους τι τους αρέσει σε ένα συγκεκριμένο έξυπνο τηλέφωνο, οι ίδιες απαντήσεις θα έχουν ποικιλία λέξεων. Για την κάμερα, μπορούν να χρησιμοποιούν λέξεις όπως φωτογραφίες, βίντεο, selfies κλπ. Όλες υποδηλώνουν κάμερα. Είναι λοιπόν πολύ σημαντικό να κατηγοριοποιήσουμε τις προτάσεις πριν, για να πάρουμε κάποιες ουσιαστικές πληροφορίες.

Σε αυτό το άρθρο, θα μάθουμε πώς να κατηγοριοποιούμε στο excel χρησιμοποιώντας λέξεις -κλειδιά.

Ας πάρουμε το παράδειγμα της έρευνας για την οποία μιλήσαμε.

Παράδειγμα: Κατηγοριοποίηση δεδομένων που συγκεντρώθηκαν από μια έρευνα στο Excel
Έτσι, έχουμε κάνει μια έρευνα για το νέο μας smartphone xyz. Ρωτήσαμε τους πελάτες μας τι τους αρέσει στο τηλέφωνο xyz και καταγράψαμε την απάντησή τους στο excel. Τώρα πρέπει να γνωρίζουμε σε ποιον άρεσε η οθόνη LED, το ηχείο και η κάμερα.

Για το σκοπό αυτό, έχουμε ετοιμάσει μια λίστα με λέξεις -κλειδιά που μπορεί να παραπέμπουν σε μια κατηγορία, όπως μπορείτε να δείτε στην παρακάτω εικόνα. Για να καταλάβω, το έχω κρατήσει μικρό.

Τα σχόλια είναι στην περιοχή A2: A9, οι λέξεις -κλειδιά είναι στο E2: E10 και η κατηγορία είναι στο F2: F10.

Ο γενικός τύπος για τη δημιουργία κατηγοριών θα είναι:

{= INDEX (Κατηγορία, ΑΓΩΝΑΣ (ΑΛΗΘΙΝΗ, ΑΡΙΘΜΟΣ (ΑΝΑΖΗΤΗΣΗ (λέξεις, πρόταση)), 0))}

Σημειώστε τα σγουρά στηρίγματα, είναι ένας τύπος πίνακα. Πρέπει να εισαχθεί χρησιμοποιώντας CTRL+SHIFT+ENTER.

Κατηγορία: Είναι το εύρος που περιέχει λίστα κατηγοριών. Οι προτάσεις ή οι ανατροφοδοτήσεις θα κατηγοριοποιηθούν με αυτές τις τιμές. Στην περίπτωσή μας είναι F2: F10.
Λόγια: είναι το εύρος που περιέχει λίστα λέξεων -κλειδιών ή φράσεων. Αυτά θα αναζητηθούν στο προτάσεις. Εδώ είναι το E2: E10.
Πρόταση: είναι η πρόταση που θα κατηγοριοποιηθεί. Είναι ένα μόνο σχετικό κύτταρο.

Δεδομένου ότι τώρα γνωρίζουμε κάθε μεταβλητή και συνάρτηση που χρησιμοποιείται για κατηγοριοποίηση στο excel, ας την εφαρμόσουμε στο παράδειγμά μας.
Στο κελί B2 γράψτε αυτόν τον τύπο και πατήστε CTRL+SHIFT+ENTER.

{= INDEX ($ F $ 2: $ F $ 10, MATCH (TRUE, ISNUMBER (SEARCH ($ E $ 2: $ E $ 10, A2)), 0))}

Αντιγράψτε τον τύπο για να δείτε την κατηγορία κάθε ανατροφοδότησης.

Πρέπει να καταγράψουμε τις λέξεις και την κατηγορία καθορισμένες, δεν πρέπει να αλλάζουν καθώς αντιγράφουμε τον τύπο, επομένως έχω δώσει απόλυτη αναφορά λέξεων -κλειδιών και κατηγοριών. Ενώ θέλουμε να αλλάξουν οι προτάσεις καθώς αντιγράφουμε τον τύπο, γι 'αυτό έχω χρησιμοποιήσει τη σχετική αναφορά ως A2. Μπορείτε να διαβάσετε την κατανόηση σχετικά με την αναφορά στο excel εδώ.

Τώρα μπορείτε να προετοιμάσετε μια αναφορά πόσων χρηστών αρέσουν στην οθόνη LED, το ηχείο και την κάμερα.
Πως δουλεύει?
Ο πυρήνας του τύπου είναι ΑΡΙΘΜΟΣ (ΑΝΑΖΗΤΗΣΗ($ E $ 2: $ E $ 10, A2)): Το εξήγησα λεπτομερώς εδώ. Η συνάρτηση SEARCH πραγματοποιεί αναζήτηση σε κάθε τιμή λέξεων -κλειδιών ($ E $ 2: $ E $ 10) στην πρόταση του Α2. Επιστρέφει έναν πίνακα εντοπισμένης θέσης λέξης ή #ΑΞΙΑ (για τη λέξη που δεν βρέθηκε). Τέλος θα έχουμε έναν πίνακα 9 στοιχείων για αυτό το παράδειγμα. {#VALUE!; 5; #VALUE!;#VALUE!;#VALUE!;#VALUE!;#VALUE!;#VALUE!;#VALUE!}. Στη συνέχεια χρησιμοποιούμε τη συνάρτηση ISNUMBER για να μετατρέψουμε αυτόν τον πίνακα σε χρήσιμα δεδομένα. Το μετατρέπει σε πίνακα TRUE και FALSE. {FALSE; TRUE; FALSE; FALSE; FALSE; FALSE; FALSE; FALSE; FALSE}.

Τώρα, όλα είναι απλή αντιστοίχιση ευρετηρίου. MATCH (TRUE, ISNUMBER (SEARCH ($ E $ 2: $ E $ 10, A2)), 0): η συνάρτηση MATCH αναζητά TRUE, στον πίνακα που προέκυψε και επιστρέφει το ευρετήριο του TRUE που βρέθηκε για πρώτη φορά. που είναι 2 για αυτήν την περίπτωση.
ΔΕΙΚΤΗΣ($ F $ 2: $ F $ 10, MATCH (TRUE, ISNUMBER (SEARCH ($ E $ 2: $ E $ 10, A2)), 0)): Στη συνέχεια, η συνάρτηση INDEX εξετάζει τη 2η θέση στην κατηγορία ($ 2 $: $ 10 $ F) που είναι οθόνη LED. Τέλος, αυτός ο τύπος κατηγοριοποιεί αυτό το κείμενο ή ανατροφοδότηση ως οθόνη LED.
Κάνοντας το Case Sensitive:

Για να κάνετε αυτή τη λειτουργία ευαίσθητη σε πεζά, χρησιμοποιήστε τη λειτουργία FIND αντί της λειτουργίας SEARCH. Η συνάρτηση FIND είναι από προεπιλογή κεφαλαία.

{= INDEX (Κατηγορία, ΤΑΙΡΙΑ (ΑΛΗΘΙΝΗ, ΑΡΙΘΜΟΣ (ΒΡΕΙΤΕ (λόγια,πρόταση)),0))}

Τα αδύναμα σημεία:

1. Εάν δύο λέξεις -κλειδιά βρίσκονται στην ίδια πρόταση, η πρόταση θα κατηγοριοποιηθεί σύμφωνα με την πρώτη λέξη -κλειδί στη λίστα.

Αποτύπωση του κειμένου μέσα σε μια άλλη λέξη. Ας υποθέσουμε ότι ψάχνουμε για LAD σε μια περιοχή. Στη συνέχεια, θα μετρηθούν οι λέξεις που περιέχουν LAD. Για παράδειγμα, οι σκάλες θα υπολογίζονται για το LAD αφού περιέχει LAD σε αυτό. Προσοχή λοιπόν σε αυτό. Η βέλτιστη πρακτική είναι να κανονικοποιήσετε τα δεδομένα σας όσο το δυνατόν περισσότερο.

Αυτό λοιπόν ήταν ένα γρήγορο σεμινάριο για τον τρόπο κατηγοριοποίησης των δεδομένων στο excel. Προσπάθησα να το εξηγήσω όσο πιο απλά μπορώ. Ενημερώστε με εάν έχετε αμφιβολίες για αυτό το άρθρο ή για άρθρα που σχετίζονται με το excel.

Λήψη αρχείου:

Κατηγοριοποίηση συμβολοσειράς με βάση λέξεις -κλειδιά

Πώς να ελέγξετε εάν το κελί περιέχει συγκεκριμένο κείμενο στο Excel

Πώς να ελέγξετε μια λίστα κειμένων σε συμβολοσειρά στο Excel

Αποκτήστε το COUNTIFS Αντιστοίχιση δύο κριτηρίων στο Excel

Αποκτήστε τα COUNTIFS With OR Για πολλαπλά κριτήρια στο Excel

Δημοφιλή άρθρα:

50 Συντόμευση Excel για να αυξήσετε την παραγωγικότητά σας : Προχωρήστε γρηγορότερα στην εργασία σας. Αυτές οι 50 συντομεύσεις θα σας κάνουν να εργάζεστε ακόμη πιο γρήγορα στο Excel.

Πώς να χρησιμοποιήσετε το tσυνάρτηση VLOOKUP στο Excel : Αυτή είναι μια από τις πιο χρησιμοποιούμενες και δημοφιλείς λειτουργίες του excel που χρησιμοποιείται για την αναζήτηση τιμών από διαφορετικά εύρη και φύλλα.

Πώς να χρησιμοποιήσετε τη συνάρτηση COUNTIF στο Excel : Μετρήστε τιμές με συνθήκες χρησιμοποιώντας αυτήν την εκπληκτική συνάρτηση. Δεν χρειάζεται να φιλτράρετε τα δεδομένα σας για να μετρήσετε συγκεκριμένες τιμές. Η λειτουργία Countif είναι απαραίτητη για την προετοιμασία του ταμπλό σας.

Πώς να χρησιμοποιήσετε τη συνάρτηση SUMIF στο Excel : Αυτή είναι μια άλλη βασική λειτουργία του πίνακα ελέγχου. Αυτό σας βοηθά να συνοψίσετε τιμές υπό συγκεκριμένες συνθήκες.