एक्सेल में सेंटीमेंट एनालिसिस! माइक्रोसॉफ्ट लैब्स से एक मुफ्त ऐड-इन है जो आपको एक्सेल में भावना विश्लेषण करने देगा। क्या होगा अगर आपको सैकड़ों सर्वेक्षण टिप्पणियों के माध्यम से उकसाना है कि लोग आपकी कंपनी के बारे में क्या सोचते हैं? एक्सेल संभावना दिखा सकता है कि प्रत्येक टिप्पणी कितनी सकारात्मक या नकारात्मक है।
वीडियो देखेंा
- बहुविकल्पीय होने पर सर्वेक्षण डेटा को निर्धारित करना आसान है
- आप एक धुरी तालिका का उपयोग यह पता लगाने के लिए कर सकते हैं कि प्रत्येक उत्तर में कितना प्रतिशत है
- लेकिन फ्री-फॉर्म टेक्स्ट उत्तरों के बारे में क्या? यदि आपके पास सैकड़ों या हजारों हैं, तो ये प्रक्रिया करना कठिन है।
- यदि कोई उत्तर सकारात्मक या नकारात्मक है तो पूर्वानुमान के लिए सेंटीमेंट एनालिसिस मशीन आधारित पद्धति है।
- Microsoft एक उपकरण प्रदान करता है जो Excel - Azure Machine Learning में Sentiment Analysis करता है।
- पारंपरिक भावना विश्लेषण के लिए मानव को 5% कथनों का विश्लेषण और वर्गीकरण करना होता है।
- पारंपरिक भावना विश्लेषण लचीला नहीं है - आप प्रत्येक उद्योग के लिए शब्दकोश का पुनर्निर्माण करेंगे।
- Excel MPQA सब्जेक्टिविटी लेक्सिकन (http: // bit। Ly / 1SRNevt के बारे में पढ़ता है) का उपयोग करता है
- इस सामान्य शब्दकोश में 5,097 नकारात्मक और 2,533 सकारात्मक शब्द शामिल हैं
- प्रत्येक शब्द को एक मजबूत या कमजोर ध्रुवीयता दी गई है
- यह छोटे वाक्यों के लिए बहुत अच्छा काम करता है, जैसे कि ट्वीट्स या फेसबुक पोस्ट
- यह दोहरे-नकारात्मक से मूर्ख बन सकता है
- स्थापित करने के लिए, सम्मिलित करें, एक्सेल स्टोर पर जाएं, एज़्योर मशीन लर्निंग के लिए खोजें
- आउटपुट रेंज के लिए एक इनपुट रेंज और दो रिक्त कॉलम निर्दिष्ट करें।
- इनपुट श्रेणी के लिए शीर्षक को स्कीमा से मेल करना होता है: tweet_text
- साथी लेख यहां: http://sfmagazine.com/post-entry/may-2016-excel-sentiment-analysis/
वीडियो ट्रांसक्रिप्ट
पॉडकास्ट से एक्सेल सीखें, एपिसोड 2062: एक्सेल में सेंटीमेंट विश्लेषण
ओह हे, यह एक धन्यवाद की रात थी और हम कद्दू पाई के आसपास बैठे थे और हमारे दोस्त, जेस ने ट्विटर डेटा पर भावना विश्लेषण करने के बारे में बात करना शुरू कर दिया था। और मैंने कहा, "अरे, आप जानते हैं कि एक्सेल के पास भावना विश्लेषण करने का एक तरीका है।" और मुझे एहसास हुआ कि मेरे पास इस पर या किसी भी वीडियो पर एक अच्छा वीडियो नहीं था, इसलिए यह वीडियो एक्सेल में भावना विश्लेषण करने के बारे में है।
अब पहला सवाल यह है कि हेक भावना का विश्लेषण क्या है? और अगर आप अपने ग्राहकों का एक सर्वेक्षण करते हैं और उनके पास एक बहु विकल्प चयन है, जहां वे 1 से 5 तक का चयन कर सकते हैं, तो ठीक है, यह वास्तव में, वास्तव में विश्लेषण करना आसान है। आप बस एक छोटी सी पिवट टेबल बना सकते हैं: पिवट टेबल डालें, मौजूदा वर्कशीट यहीं, ओके पर क्लिक करें। हम वहां प्रश्न जानना चाहते हैं या प्रश्न का उत्तर देना चाहते हैं, और फिर प्रत्येक के लिए कितने उत्तर थे, और यह हमें पूर्ण संख्या प्रदान करता है। आप यहां तक आ सकते हैं और फ़ील्ड सेटिंग से मानों को दिखाने के लिए इसे बदल सकते हैं, जैसे कुल कॉलम का%।
ठीक है, इसलिए आप प्रत्येक उत्तर के लिए देख सकते हैं कि कितने प्रतिशत लोगों को उत्तर मिलता है। ठीक है, लेकिन भावना का विश्लेषण तब होता है जब आपके पास वास्तव में एक लंबा जवाब होता है जहां आप कहते हैं, "अरे, ठीक है, अच्छी तरह से आप जानते हैं, हमें बताएं कि आपने हमें वह जवाब क्यों दिया?" और वे, आप जानते हैं, वाक्यों या पैराग्राफों का उपयोग करते हैं। ठीक है, अगर आपके पास सैकड़ों या हजारों हैं, तो किसी के लिए इसके माध्यम से जाना और उन सभी को पढ़ना और यह पता लगाना बहुत मुश्किल है कि क्या ठीक है?
तो भावुक विश्लेषण के दो अलग-अलग प्रकार हैं। आमतौर पर अतीत में आप मानव पर्यवेक्षित शिक्षण एल्गोरिथ्म का उपयोग करेंगे। इसलिए यदि आपके पास 5,000 उत्तर थे, तो आप जानते हैं, उनमें से 200 जानते हैं और सकारात्मक और नकारात्मक शब्दों और वाक्यांशों का चयन करते हैं। आप अनिवार्य रूप से सकारात्मक और नकारात्मक शब्दों के शब्दकोश का निर्माण कर रहे हैं; लेकिन, आप जानते हैं, यह बहुत सीमित था। यदि आपने ऐसा कार की मरम्मत करने वाले स्थान के लिए किया था और फिर एक अलग ग्राहक था, तो आप जानते हैं, जिसने कारपेट की सफाई की, उन दोनों शब्दकोशों में पूरी तरह से अलग हैं। आपको बार-बार मशीन लर्निंग या मानव पर्यवेक्षित शिक्षण करना होगा। इसलिए, Excel MPQA विषय लेक्सिकन नामक इस चीज़ का उपयोग करता है और आप Google पर जा सकते हैं। इसके बारे में जानकारी है - 5,097 नकारात्मक शब्द, 2533 सकारात्मक शब्द। इसलिए,यह छोटे वाक्यों या ट्वीट्स या फेसबुक पोस्ट के लिए बहुत अच्छा काम करता है। लेकिन एक बात मैंने गौर की है कि अगर कोई दोहरा नकारात्मक में लिख रहा है, तो मैं यह नहीं कह सकता कि मुझे इस सुविधा से नफरत नहीं है, ठीक है, मशीन सीखने में विफल हो जाएगा। और बिल्ली, मैं असफल। मैं नहीं बता सकता कि वे खुश हैं या नहीं।
ठीक है, तो यहाँ हम क्या करते हैं। Excel 2013 या Excel 2016 में, सम्मिलित करें टैब पर जाएं, स्टोर पर जाएं, जब खोज बॉक्स में Azure मशीन की खोज होती है और आपको वहीं Azure मशीन लर्निंग मिलती है। हम Add पर क्लिक करते हैं। ठीक है, और यहां से दो अलग-अलग उपकरण हैं: टाइटैनिक सर्वाइवर प्रिडिक्टर, जो मजेदार है; और, टेक्स्ट सेंटीमेंट विश्लेषण एक्सेल ऐड-इन। चलो उस एक का उपयोग करें। ठीक है, यहाँ कुछ चीजें हैं जो आपको यात्रा करेंगे। आपका शीर्षक: अपना उत्तर समझाने के लिए एक पैराग्राफ लें। यह स्कीमा से मेल खाता है और स्कीमा कहती है कि शीर्षक को ट्वीट_टेक्स्ट कहना है। तो, यहाँ ऊपर: tweet_text, ज़ाहिर है, मामला संवेदनशील मामलों, ठीक है। और फिर स्कीमा बंद करें, और फिर भविष्यवाणी करें, इनपुट: A1 से 100, मेरे डेटा में हेडर हैं, आउटपुट: डेटाबी 1, हेडर शामिल करें। वे हमें 2 कॉलम देने जा रहे हैं।सुनिश्चित करें कि आपके पास वहां 2 खाली कॉलम हैं; अन्यथा, यह डेटा को ओवरराइड करने जा रहा है। आपके पास 2 विकल्प हैं: एक समय में या एक बैच के रूप में कुछ पंक्तियाँ। यह सिर्फ एक सौ है, इसलिए यह वास्तव में मायने नहीं रखता। मैं प्रिडिक्ट और BAM चुनूंगा! बस इतना ही उपवास।
अब ठीक है, हमें 2 कॉलम मिलते हैं: हमें एक सेंटिमेंट और एक स्कोर मिलता है, ठीक है। तो, चलो दशमलव स्थानों के एक समूह के साथ प्रतिशत के रूप में यहां के स्कोर का प्रतिनिधित्व करते हैं। ठीक है, इसलिए 47.496, यह 0 से 100% हो जाता है। 100 के करीब बेहद सकारात्मक है, 0 के करीब बेहद नकारात्मक है, ठीक है? तो यहाँ, हम एक है जहाँ एक छोटी सी समस्या है, मुझे पागल कर देता है। समाधान नहीं मिल रहा है, तो आप देख सकते हैं कि क्यों इसे बेहद नकारात्मक माना जा रहा है। आइए एक को देखें जो बेहद सकारात्मक है। ठीक है, तो आप जानते हैं, इसलिए हमारे पास यहां कुछ खुश शब्द हैं: कृपया और धन्यवाद, विस्मयादिबोधक बिंदु और इसी तरह। यह उच्च स्कोर में योगदान दे सकता है। ठीक है, तो क्या यह सही है? नहीं, लेकिन यह आपको बताने के लिए एक त्वरित, त्वरित तरीका देगा, आप जानते हैं, कि कितने लोग उन उत्तरों के बारे में बहुत खुश या बेहद नकारात्मक हैं।
और निश्चित रूप से, फिर से, यहां हम एक पिवट टेबल के साथ ऐसा कर सकते हैं: डालें, पिवट टेबल, यहीं एक मौजूदा वर्कशीट पर जाएं, ठीक क्लिक करें, और हम सेंटीमेंट में रुचि रखते हैं, और फिर शायद औसत स्कोर के लिए है उनमें से प्रत्येक। तो हम इसे फ़ील्ड सेटिंग्स के तहत एक औसत होने के लिए बदल देंगे, ठीक पर क्लिक करें। और इसलिए, या शायद एक गिनती भी। मुझे लगता है कि हम कितने लोगों की गिनती जानना चाहते हैं। तो हम कुछ अन्य क्षेत्र लेंगे, और इसलिए, हम जानते हैं कि कितने लोग नकारात्मक थे। ऊह, कितने लोग तटस्थ थे, कितने लोग सकारात्मक थे और उनमें से प्रत्येक का औसत स्कोर क्या था।
ठीक है, इसलिए यदि आपके पास सर्वेक्षण डेटा है और यह एक बहुविकल्पी है, तो एक धुरी तालिका का उपयोग करना आसान है ताकि यह पता लगाया जा सके कि प्रत्येक उत्तर में कितना प्रतिशत है। लेकिन फ्री-फॉर्म टेक्स्ट उत्तरों के लिए, प्रक्रिया करना कठिन है। यदि आपके पास सैकड़ों या हजारों हैं, तो भावना का विश्लेषण एक मशीन आधारित है जो भविष्यवाणी करने के लिए एक विधि है अगर कोई उत्तर सकारात्मक या नकारात्मक है। Microsoft इसके लिए एक निःशुल्क टूल प्रदान करता है। Excel 2013 या Excel 2016 में कार्य करता है, जिसे Azure Machine Learning कहा जाता है। आमतौर पर हाथों से 5% कथनों को गुजरना पड़ता है। यह लचीला नहीं है, आपको प्रत्येक नए डेटा सेट के लिए फिर से वर्गीकृत करना होगा, लेकिन एक्सेल इस एमपीक्यूए सब्जेक्टिविटी लेक्सिकॉन का उपयोग कर रहा है। यह एक सामान्य शब्दकोष है। यह छोटे वाक्यों, ट्वीट्स, फेसबुक पोस्ट के लिए काम करने वाला है। मैं नकारात्मकता से मूर्ख हो सकता हूं। तो बस एक्सेल स्टोर पर जाएं,Azure मशीन लर्निंग के लिए खोज। आउटपुट श्रेणी के लिए एक इनपुट और दो कॉलम निर्दिष्ट करें। इस विशेष मामले में स्कीमा, tweet_text से मिलान करने के लिए शीर्षक बदलना न भूलें।
ठीक है, तो तुम वहाँ जाओ। अगली बार जब आपके पास विश्लेषण करने के लिए बड़ी मात्रा में डेटा हो, तो एज़्योर मशीन लर्निंग का उपयोग करके देखें, एक्सेल 2013 के लिए मुफ्त ऐड-इन। इसके द्वारा रोकने के लिए धन्यवाद, हम आपको अगली बार एक और नेटकास्ट से देखेंगे।
फ़ाइल डाउनलोड करें
यहाँ नमूना फ़ाइल डाउनलोड करें: Podcast2062.xlsm