C++ में कैरेक्टर सेट
C++ में, कैरेक्टर सेट का उपयोग टेक्स्ट को रिप्रेजेंट करने के लिए किया जाता है। यह एक चरित्रों का समूह होता है जो प्रोग्राम में इस्तेमाल किया जा सकता है। C++ में दो मुख्य कैरेक्टर सेट हैं:
1. ASCII (American Standard Code for Information Interchange)
- ASCII एक 7-बिट कैरेक्टर सेट है जो 128 कैरेक्टर को रिप्रेजेंट करता है।
- इसमें अंग्रेजी अक्षर, संख्या, विशेष चरित्र और नियंत्रण चरित्र शामिल हैं।
- C++ में ASCII कैरेक्टर सेट को डिफ़ॉल्ट कैरेक्टर सेट के रूप में उपयोग किया जाता है।
2. Unicode
- Unicode एक 16-बिट या 32-बिट कैरेक्टर सेट है जो विभिन्न भाषाओं के हजारों चरित्रों को रिप्रेजेंट करता है।
- यह विभिन्न लिपियों (जैसे, हिंदी, चीनी, जापानी, अरबी) के लिए समर्थन प्रदान करता है।
- C++ में Unicode का उपयोग
wchar_t
डेटा टाइप के माध्यम से किया जा सकता है।
C++ में कैरेक्टर सेट का उपयोग कैसे करें
ASCII कैरेक्टर सेट का उपयोग
#include
int main() {
// ASCII कैरेक्टर को प्रिंट करें
std::cout << "A" << std::endl;
std::cout << "1" << std::endl;
std::cout << "@" << std::endl;
return 0;
}
Unicode कैरेक्टर सेट का उपयोग
#include
#include
int main() {
// Unicode कैरेक्टर को प्रिंट करें
std::locale::global(std::locale("en_US.UTF-8"));
std::wcout << L"नमस्ते" << std::endl;
return 0;
}
नोट
wchar_t
डेटा टाइप Unicode कैरेक्टर को स्टोर करने के लिए उपयोग किया जाता है।std::wcout
का उपयोग Unicode कैरेक्टर को कंसोल पर प्रिंट करने के लिए किया जाता है।std::locale::global()
का उपयोग Unicode कैरेक्टर सेट को सेट करने के लिए किया जाता है।
निष्कर्ष
C++ में, ASCII और Unicode दो मुख्य कैरेक्टर सेट हैं। ASCII अंग्रेजी भाषा के लिए एक मानक कैरेक्टर सेट है जबकि Unicode विभिन्न भाषाओं के लिए समर्थन प्रदान करता है। प्रोग्राम के लिए सही कैरेक्टर सेट चुनना महत्वपूर्ण है ताकि यह सुनिश्चित हो सके कि सभी चरित्रों को सही ढंग से प्रस्तुत किया जाए।