Which of the following is not a preprocessing method used for unstructured data classification?
Answers
Answered by
0
प्रीप्रोसेसिंग विधियां महत्वपूर्ण कदम हैं जो पाठ खनन में महत्वपूर्ण हैं, एनएलपी या प्राकृतिक भाषा प्रसंस्करण में, और आईआर या सूचना पुनर्प्राप्ति में महत्वपूर्ण हैं।
टेक्स्ट इकट्ठा करना एक ऐसा कदम है जिसमें सभी कच्चे डेटा एकत्र किए जाते हैं। ये सभी डेटा असंगठित है। प्रीप्रोकैसिंग चरण इन कच्चे असंगठित डेटा के अधिक परिभाषित तरीके से विभाजन और प्रतिनिधित्व की अनुमति देते हैं।
टोकननाइजेशन असंगठित डेटा के प्रीप्रोसेसिंग में एक कदम है जिसमें कच्चे डेटा को उन शब्दों में विभाजित किया जाता है जिन्हें फीचर पीढ़ी कहा जाता है। स्टेमिंग एल्गोरिदम लागू किया गया है ताकि सभी शर्तों को एक स्टेमड फॉर्म में दर्शाया जा सके और स्टॉप शब्द भी हटा दिए जाएं।
Similar questions
Computer Science,
8 months ago
Environmental Sciences,
8 months ago
English,
8 months ago
Hindi,
1 year ago
Hindi,
1 year ago