पायथन स्ट्रिंग एनकोड ()

स्ट्रिंग एन्कोड () विधि दिए गए स्ट्रिंग के एन्कोडेड संस्करण देता है।

पायथन 3.0 के बाद से, स्ट्रिंग को यूनिकोड के रूप में संग्रहीत किया जाता है, अर्थात स्ट्रिंग में प्रत्येक वर्ण को एक कोड बिंदु द्वारा दर्शाया जाता है। इसलिए, प्रत्येक स्ट्रिंग यूनिकोड कोड बिंदुओं का एक अनुक्रम है।

इन तारों के कुशल भंडारण के लिए, कोड बिंदुओं के अनुक्रम को बाइट्स के एक सेट में परिवर्तित किया जाता है। इस प्रक्रिया को एन्कोडिंग के रूप में जाना जाता है ।

विभिन्न एन्कोडिंग मौजूद हैं जो एक स्ट्रिंग को अलग तरह से व्यवहार करते हैं। लोकप्रिय एनकोडिंग utf-8 , ascii , आदि।

स्ट्रिंग की encode()विधि का उपयोग करते हुए , आप पायथन द्वारा समर्थित किसी भी एन्कोडिंग में यूनिकोड के तारों को परिवर्तित कर सकते हैं। डिफ़ॉल्ट रूप से, पायथन utf-8 एन्कोडिंग का उपयोग करता है ।

encode()विधि का सिंटैक्स है:

 string.encode (एन्कोडिंग = 'UTF-8', त्रुटियाँ = 'सख्त')

स्ट्रिंग एनकोड () पैरामीटर

डिफ़ॉल्ट रूप से, encode()विधि को किसी भी पैरामीटर की आवश्यकता नहीं होती है।

यह स्ट्रिंग का utf-8 एन्कोडेड संस्करण लौटाता है। विफलता के मामले में, यह एक UnicodeDecodeErrorअपवाद को जन्म देता है।

हालाँकि, यह दो पैरामीटर लेता है:

  • एन्कोडिंग - एन्कोडिंग प्रकार एक स्ट्रिंग को एन्कोड किया जाना है
  • त्रुटियों - प्रतिक्रिया जब एन्कोडिंग विफल रहता है। त्रुटि प्रतिक्रिया के छह प्रकार हैं
    • सख्त - डिफ़ॉल्ट प्रतिक्रिया जो विफलता पर एक यूनिकोडबाउंडरियर अपवाद को उठाती है
    • उपेक्षा - परिणाम से असम्बद्ध यूनिकोड की उपेक्षा
    • प्रतिस्थापित करें - unencodable यूनिकोड की जगह एक प्रश्न चिह्न ?
    • xmlcharrefreplace - unencodable यूनिकोड के बजाय XML वर्ण संदर्भ सम्मिलित करता है
    • backslashreplace - unencodable यूनिकोड के बजाय एक uNNNN एस्केप अनुक्रम सम्मिलित करता है
    • namereplace - unencodable यूनिकोड के बजाय a N (…) एस्केप क्रम सम्मिलित करता है

उदाहरण 1: डिफ़ॉल्ट Utf-8 एनकोडिंग के लिए एनकोड

 # unicode string string = 'pythön!' # print string print('The string is:', string) # default encoding to utf-8 string_utf = string.encode() # print result print('The encoded version is:', string_utf) 

आउटपुट

स्ट्रिंग है: अजगर! एन्कोडेड संस्करण है: b'pyth xc3 xb6n! '

उदाहरण 2: त्रुटि पैरामीटर के साथ एन्कोडिंग

 # unicode string string = 'pythön!' # print string print('The string is:', string) # ignore error print('The encoded version (with ignore) is:', string.encode("ascii", "ignore")) # replace error print('The encoded version (with replace) is:', string.encode("ascii", "replace")) 

आउटपुट

स्ट्रिंग है: अजगर! एन्कोडेड संस्करण (उपेक्षा के साथ) है: b'pythn! ' एन्कोडेड संस्करण (बदलें के साथ) है: b'pyth? N! '

नोट: विभिन्न एन्कोडिंग और त्रुटि मापदंडों को भी आज़माएं।

दिलचस्प लेख...