bj
    >> Φυσικές Επιστήμες >  >> βιολογία

Η ανάλυση των δισεκατομμυρίων λέξεων Twitter αποκαλύπτει πώς αναπτύσσεται η αμερικανική αγγλική γλώσσα

Τίτλος: Η ανάλυση των δισεκατομμυρίων λέξεων Twitter αποκαλύπτει πώς αναπτύσσεται η αμερικανική αγγλική γλώσσα

Περίληψη:

Η μελέτη αυτή παρέχει μια ανάλυση μεγάλης κλίμακας της αμερικανικής αγγλικής ανάπτυξης, χρησιμοποιώντας δεδομένα από δισεκατομμύρια λέξεις που δημοσιεύονται στο Twitter μεταξύ 2008 και 2020. Εξετάζουμε πώς αλλάζουν η συχνότητα και τα πρότυπα χρήσης των λέξεων με την πάροδο του χρόνου, συμπεριλαμβανομένης της εμφάνισης νέων λέξεων, της παρακμής των παλαιών και των μετατοπίζονται στην έννοια των λέξεων. Τα ευρήματά μας ρίχνουν φως στη δυναμική φύση της γλώσσας και παρέχουν πληροφορίες για τους πολιτιστικούς, κοινωνικούς και τεχνολογικούς παράγοντες που διαμορφώνουν την εξέλιξη των αμερικανικών αγγλικών.

Λέξεις -κλειδιά: Αμερικανικά Αγγλικά, Δεδομένα Twitter, Αλλαγή Γλώσσας, Συχνότητα λέξεων, Σημασιολογική Μετατόπιση

Εισαγωγή:

Η γλώσσα είναι ένα δυναμικό φαινόμενο που αλλάζει συνεχώς με την πάροδο του χρόνου. Εισάγονται νέες λέξεις, οι παλιές λέξεις δεν μπορούν να χρησιμοποιηθούν και οι υπάρχουσες λέξεις μπορούν να αλλάξουν στο νόημα. Αυτές οι αλλαγές επηρεάζονται από διάφορους παράγοντες, συμπεριλαμβανομένων των πολιτιστικών, κοινωνικών, τεχνολογικών και περιβαλλοντικών αλλαγών.

Τα τελευταία χρόνια, η διαθεσιμότητα δεδομένων ψηφιακού κειμένου μεγάλης κλίμακας επέτρεψε στους ερευνητές να μελετήσουν τη γλώσσα της γλώσσας σε πρωτοφανείς λεπτομέρειες. Το Twitter, ειδικότερα, παρέχει μια πλούσια πηγή δεδομένων για την ανάλυση της χρήσης γλώσσας σε πραγματικό χρόνο. Με εκατομμύρια χρήστες να δημοσιεύουν ενεργά στην πλατφόρμα, το Twitter προσφέρει μια ματιά στην τρέχουσα κατάσταση των αμερικανικών αγγλικών και πώς εξελίσσεται.

μεθοδολογία :

Για να αναλύσουμε την ανάπτυξη των αμερικανικών αγγλικών στο Twitter, συλλέξαμε ένα σύνολο δεδομένων δισεκατομμυρίων λέξεων που δημοσιεύθηκαν μεταξύ του 2008 και του 2020. Πρώτα προεπεξεργαστήκαμε τα δεδομένα με την απομάκρυνση των μη αγγλικών λέξεων, της στίξης και των διευθύνσεων URL. Στη συνέχεια, κοίταξαμε το κείμενο σε λέξεις και μετρήσαμε τη συχνότητα κάθε λέξης σε κάθε χρόνο.

Για να παρακολουθείτε τη μεταβολή της συχνότητας λέξεων με την πάροδο του χρόνου, υπολογίσαμε τον ρυθμό αύξησης της συχνότητας λέξεων, που ορίζεται ως το ποσοστό της μεταβολής της μεταβολής της συχνότητας λέξεων από το ένα έτος στο άλλο.

Επιπλέον, χρησιμοποιήσαμε τεχνικές ενσωμάτωσης λέξεων για να συλλάβουμε τη σημασιολογική ομοιότητα μεταξύ των λέξεων. Χρησιμοποιώντας ένα προ-εκπαιδευμένο μοντέλο ενσωμάτωσης λέξεων, υπολογίσαμε την ομοιότητα συνημιτονίας μεταξύ των φορέων λέξεων και συγκρίναμε τη σημασιολογική συγγένεια των λέξεων με την πάροδο του χρόνου.

ευρήματα:

1. εμφάνιση νέων λέξεων:

Διαπιστώσαμε ότι χιλιάδες νέες λέξεις εμφανίστηκαν στο Twitter κατά τη διάρκεια της περιόδου μελέτης. Πολλές από αυτές τις λέξεις σχετίζονταν με νέες τεχνολογίες, κοινωνικά μέσα και λαϊκή κουλτούρα, αντανακλώντας τον ταχέως ρυθμό της τεχνολογικής προόδου και της πολιτιστικής αλλαγής.

2. μείωση των παλαιών λέξεων:

Ορισμένες λέξεις εμφάνισαν μείωση της συχνότητας με την πάροδο του χρόνου, υποδεικνύοντας μια μετατόπιση της χρήσης ή της συνάφειας τους. Ορισμένες μειωμένες λέξεις σχετίζονταν με ξεπερασμένες τεχνολογίες, τάσεις μόδας ή πολιτικές προσωπικότητες.

3. Σημασιολογική μετατόπιση:

Η ανάλυσή μας αποκάλυψε επίσης σημασιολογική μετατόπιση στην έννοια ορισμένων λέξεων με την πάροδο του χρόνου. Για παράδειγμα, η λέξη "κυριολεκτικά" σήμαινε αρχικά "με κυριολεκτική έννοια", αλλά η χρήση του στο Twitter συχνά μεταφέρει έμφαση ή υπερβολή.

4. Επίδραση κοινωνικών και πολιτιστικών γεγονότων:

Μεγάλες κοινωνικές και πολιτιστικές εκδηλώσεις είχαν σημαντικό αντίκτυπο στη χρήση της γλώσσας. Για παράδειγμα, η λέξη "selfie" είδε μια δραματική αύξηση της συχνότητας μετά την άνοδο της φωτογραφίας κινητής τηλεφωνίας και τη χρήση πλατφορμών κοινωνικών μέσων όπως το Instagram.

Συμπέρασμα:

Η ανάλυση των δισεκατομμυρίων λέξεων του Twitter παρέχει πληροφορίες για τη δυναμική φύση της αμερικανικής αγγλικής γλώσσας και πώς εξελίσσεται με την πάροδο του χρόνου. Εμφανίζονται νέα λόγια, τα παλιά λόγια μειώνονται και η έννοια των λέξεων μπορεί να μετατοπιστεί λόγω πολιτιστικών, κοινωνικών και τεχνολογικών αλλαγών. Τα δεδομένα του Twitter χρησιμεύουν ως πολύτιμος πόρος για τη μελέτη της αλλαγής γλώσσας σε πραγματικό χρόνο, επιτρέποντας στους ερευνητές να παρακολουθούν την εξέλιξη της γλώσσας σε πρωτοφανείς λεπτομέρειες.

Συνέπειες:

Τα ευρήματα αυτής της μελέτης έχουν επιπτώσεις σε διάφορους τομείς, συμπεριλαμβανομένης της ιστορικής γλωσσολογίας, της κοινωνιολογίας και των πολιτιστικών σπουδών. Η κατανόηση της εξέλιξης των αμερικανικών αγγλικών μπορεί να παρέχει πολύτιμες πληροφορίες σχετικά με τις κοινωνικές αλλαγές, τις πολιτιστικές τάσεις και τις εξελισσόμενες ανάγκες των χρηστών της γλώσσας.

Διαφορά μεταξύ Νεάντερταλ και ανθρώπων

Διαφορά μεταξύ Νεάντερταλ και ανθρώπων

Κύρια διαφορά – Νεάντερταλ εναντίον ανθρώπων Οι Νεάντερταλ και οι άνθρωποι είναι δύο στάδια της ανθρώπινης εξέλιξης. Και τα δύο είδη φορούσαν ρούχα. Οι Νεάντερταλ ζούσαν σε ένα ψυχρό περιβάλλον στην Ευρώπη και τη Νοτιοδυτική έως την κεντρική Ασία. Οι άνθρωποι ζουν σε όλο τον κόσμο. Η διαφοροποίηση τ

Διαφορά μεταξύ του μικροκόκκου και του σταφυλόκοκκου

Διαφορά μεταξύ του μικροκόκκου και του σταφυλόκοκκου

Η κύρια διαφορά μεταξύ του Micrococcus και Σταφυλόκοκκος είναι αυτός ο Μικρόκοκκος σπάνια προκαλεί λοιμώξεις ενώ ο Σταφυλόκοκκος συχνά εμπλέκεται σε κλινικές λοιμώξεις. Επιπλέον, Micrococcus είναι ένα αερόβιο βακτήριο που αναπτύσσεται μόνο παρουσία οξυγόνου ενώ ο Σταφυλόκοκκος είναι ένα προαιρετικό

Ποια είναι η διαφορά μεταξύ του Omentum και του Mesentery

Ποια είναι η διαφορά μεταξύ του Omentum και του Mesentery

Η κύρια διαφορά ανάμεσα στο omentum και το μεσεντέριο είναι αυτό omentum Το είναι μια λιπαρή κουβέρτα που κρέμεται μπροστά από όλα τα έντερα, ενώ το μεσεντέριο είναι ο υποστηρικτικός ιστός τόσο για το λεπτό όσο και για το παχύ έντερο. Επιπλέον, το ωμό προέρχεται από το σπλαχνικό περιτόναιο ενώ το