Hindi, asked by hardikbhai8911, 1 year ago

Which of the following is not a preprocessing method used for unstructured data classification?

Answers

Answered by mchatterjee
0

प्रीप्रोसेसिंग विधियां महत्वपूर्ण कदम हैं जो पाठ खनन में महत्वपूर्ण हैं, एनएलपी या प्राकृतिक भाषा प्रसंस्करण में, और आईआर या सूचना पुनर्प्राप्ति में महत्वपूर्ण हैं।

टेक्स्ट इकट्ठा करना एक ऐसा कदम है जिसमें सभी कच्चे डेटा एकत्र किए जाते हैं। ये सभी डेटा असंगठित है। प्रीप्रोकैसिंग चरण इन कच्चे असंगठित डेटा के अधिक परिभाषित तरीके से विभाजन और प्रतिनिधित्व की अनुमति देते हैं।

टोकननाइजेशन असंगठित डेटा के प्रीप्रोसेसिंग में एक कदम है जिसमें कच्चे डेटा को उन शब्दों में विभाजित किया जाता है जिन्हें फीचर पीढ़ी कहा जाता है। स्टेमिंग एल्गोरिदम लागू किया गया है ताकि सभी शर्तों को एक स्टेमड फॉर्म में दर्शाया जा सके और स्टॉप शब्द भी हटा दिए जाएं।

Similar questions