माइनक्राफ्ट1.18डाउनलोड

मंचों

छोटा रोड़ा - मदद की सराहना की

क्रम से लगाना:

मैं एक लीग में (स्क्रैप्ड) मैच चुनौतियों से जानकारी (टीम के नाम, खेल के प्रकार, समय नियंत्रण इत्यादि) निकालने के लिए पाइथन में लिखी गई दिनचर्या का उपयोग कर रहा हूं और यह बहुत उपयोगी परिणाम दे रहा है।

लेकिन मैंने अभी एक छोटी सी समस्या का सामना किया है क्योंकि एक मैच में एक टीम का नाम जिसे चुनौती दी जा रही है, चुनौती में "वन वर्ल्ड लीग प्लेयर्स लाउंज" के रूप में दिखाई देता है लेकिन टीमों की मेरी इनपुट फाइल में सादा अंग्रेजी है "वन वर्ल्ड लीग प्लेयर्स लाउंज" (ये एक डिक्शनरी में लोड हैं)। और जब भी मैं टीम का नाम देखता हूं, तो वह मुझे 'कीरर' दे रहा है।

ऐसा लगता है कि एक एन्कोडिंग दूसरे से मेल नहीं खा रही है और अभी के लिए मैंने सभी "#039;" को बदलकर समस्या को ठीक कर दिया है। "'" के साथ सबस्ट्रिंग लेकिन क्या इसे करने का एक आसान तरीका है?

कुछ क्लब नामों में काफी आकर्षक चरित्र शामिल हैं और यदि संभव हो तो मैं एक सामान्य समाधान खोजना चाहता हूं।

क्या आप BS4 का उपयोग कर रहे हैं?

में [1]:आयातएचटीएमएल
में [2]:नाम ="वन वर्ल्ड लीग प्लेयर्स लाउंज"
में [3]:html.unescape (नाम)
बाहर[3]:"वन वर्ल्ड लीग प्लेयर्स लाउंज"


acity609 ने लिखा:

क्या आप BS4 का उपयोग कर रहे हैं?

नहीं, मैं HTML दस्तावेज़ का अपना विश्लेषण कर रहा हूं। लेकिन जब मेरे पास कुछ खाली समय होगा तो मैं उस पर गौर करूंगा।

बेंसलाइस ने लिखा:

में [1]:आयातएचटीएमएल
में [2]:नाम ="वन वर्ल्ड लीग प्लेयर्स लाउंज"
में [3]:html.unescape (नाम)
बाहर[3]:"वन वर्ल्ड लीग प्लेयर्स लाउंज"

धन्यवाद, यह वास्तव में मददगार है और मेरी समस्या का समाधान करता है 😊

>>> html.unescape("एक विश्व लीग खिलाड़ी' लाउंज")
"वन वर्ल्ड लीग प्लेयर्स लाउंज"

समय, अनुरोध और जेसन जैसे मॉड्यूल के अलावा, मुझे पाइथन लाइब्रेरी में बहुत गहराई से जाने की आवश्यकता नहीं है, लेकिन शायद मेरे लिए कुछ पृष्ठभूमि पढ़ने का समय है।