Friday, May 13, 2016

Backtesting के लिए मूल्य डेटा साफ़ करने के लिए कैसे







+

Backtesting के लिए मूल्य डेटा साफ़ करने के लिए कैसे Backtesting के लिए डेटा सफाई सार्थक परिणाम प्राप्त करने के लिए आसान है, लेकिन इसकी बहुत जरूरी नहीं है। रणनीति महज एक बुरा अंतराल के अच्छे पक्ष को पकड़ने के लिए होता है जब कीमत डेटा तिरछा और वे सोच में अचेत backtester गुमराह कर सकते हैं गलत समायोजित मूल्य विभाजन होली ग्रेल पाया। यहाँ कदम गंदा डेटा बाहर स्क्रीन और एक स्वच्छ डाटासेट उत्पादन करने के लिए: 1. कम से कम 3 उम्मीदवार डेटा विक्रेताओं उठाओ। 2. तुलना के लिए डेटा स्वरूप। 3. एक स्मार्ट तुलना करते हैं और 3 उम्मीदवार डेटा सेट पर इसे चलाने के लिए एक कार्यक्रम लिखें। 4. त्रुटि में है जो सेट देखना गलत तुलना का विश्लेषण करें। 2 से 3 के सेट सहमत हैं, सही मान thats के मान और ग़ैर गलत है। वे त्रुटियों को ठीक कर सकते हैं तो 5. डेटा विक्रेताओं के लिए प्रतिक्रिया भेजें। 6. backtesting के लिए उपयोग करते हैं और backtesting दौरान परिवर्तन को रोकने के लिए इसे नीचे बंद करने के लिए ऐतिहासिक मूल्य आंकड़ों के सेट का चयन करें। 7. backtesting इंजन के लिए सुनहरा कीमत डेटा फीड। इस प्रक्रिया में मुझे काम के कई हफ्तों लिया, लेकिन यह सटीक परिणाम प्राप्त करने के लिए लायक था। अंतर्निहित डेटा त्रुटियों से भरा है, तो backtesting के काम के लिए जाने की कुछ बात Theres। तुम सिर्फ तैयारियों गंभीर backtesting में जाने क्या देखना चाहते हैं, तो अपने दम पर इस प्रयास या करने जा रहे हैं जानकारी के लिए पर पढ़ें। लाइव ट्रेडिंग और व्यक्तिगत रूप से चार्ट को देख, इसकी काफी आसान गंदे डेटा हाजिर करने के लिए। एक मूल्य चार्ट पर बड़े अंतराल आंख को पकड़ने रहे हैं और आप हाल ही में एक चार्ट पर खबर की जांच कर सकते हैं। जाहिर है कुछ कीमत अंतराल असली हैं, लेकिन कुछ ही आमतौर पर ठीक से समायोजित नहीं एक विभाजन या विशेष लाभांश त्रुटियाँ हैं। एक चेतावनी है और मरीज को मानव के मामले ने मामले कि सुलझा सकते हैं। कम्प्यूटरीकृत backtesting एक दशक से अधिक कवर के साथ, गंदा डेटा बहुत अधिक प्रचलित कठिन पता लगाने के लिए, और ठीक करने के लिए कठिन है। चरण 1: उम्मीदवार डेटा विक्रेताओं उठाओ। backtesting इंजन के साथ आता है कि डेटा एक प्राकृतिक पहली पसंद है और हाँ यह साफ करने की जरूरत है! मैं TradeStation और Worden Telechart (उर्फ ब्लॉक, Backscanner, StockFinder) का उपयोग किया है। मैं ऐतिहासिक मूल्य डेटा 8220 के एक अध्ययन किया था, ताकि डेटा के दो सेट, लेकिन thats मैं एक स्वतंत्र स्रोत चाहता था, भोजन chain8221 ;. संक्षेप करने के लिए, सभी डेटा के आदान-प्रदान से निकलती है और एक्सचेंजों द्वारा रिपोर्ट के रूप में डेटा कंपनियों डेटा पर कब्जा। कब्जा कर लिया डेटा पुनर्विक्रय के लिए (एक्सचेंजों के साथ समझौते से) की पेशकश की है। वे जैसे याहू, एमएसएन, गूगल के रूप में बड़ी वेबसाइटों के लिए डेटा की आपूर्ति क्योंकि सीएसआई डेटा मुझे प्रभावित किया है और मैं आंकड़ों पर आँखों के लाखों लोगों की जड़ बाहर त्रुटियों में मदद मिलेगी कि विश्वास करते हैं। इसके अलावा, सीएसआई डेटा backtesting के लिए एक अधिक सटीक दृश्य देता है जो डीलिस्ट डेटा, की पेशकश की। (सीएसआई डेटा के बाद से ज्यादातर निजी व्यक्तियों की पहुंच से बाहर delisted डेटा की कीमत है, वे इसके लिए भुगतान करना होगा कितना संस्थानों एहसास हुआ कि एक बार। मैं एक मात्र चार आंकड़े के लिए delisted डेटा के 14 साल मिल गया है करने के लिए बहुत भाग्यशाली महसूस करते हैं।) चरण 2: डेटा बाहर डाल दो। तुलना के लिए ऐतिहासिक मूल्य डेटा तैयार करने के लिए, आप सॉफ्टवेयर उपकरणों से बाहर डंप करने की जरूरत है। Telechart डाटाबैंक मेनू मद के अंतर्गत क्षमता पाठ करने के लिए निर्यात के साथ यह सबसे आसान बनाता है। सीएसआई डेटा भी डेटा लिखने के बारे में अत्यंत लचीला है। TradeStation डेटा बाहर लिखने के लिए कोई सुविधा है। मैं प्रत्येक प्रतीक के लिए एक पाठ फ़ाइल के लिए प्रत्येक दिन के लिए बंद, हाई, लो, ओपन, और वॉल्यूम लिखते हैं कि एक साधारण आसान भाषा स्क्रिप्ट बनाने के लिए किया था। टिकर प्रतीक पाठ फ़ाइल का नाम है और फ़ाइलों के अंदर सूचीबद्ध नहीं है। डेटा के सभी तीन सेटों में प्रारूप के मैच के लिए ध्यान रखना। मैं इस क्रम में मेरा लिखा है: दिनांक, सी, एच, एल, ओ, वी इसके बहुत महत्वपूर्ण हमेशा विभाजन से समायोजित डेटा का उपयोग करने के लिए। बुद्धिमान के लिए एक और शब्द: प्रत्येक विक्रेता आप तदनुसार समायोजित करने की आवश्यकता मात्रा के लिए उपाय करने का एक अलग इकाइयों का उपयोग करता है। चरण 3: डेटा की तुलना करने के लिए एक कार्यक्रम लिखें। वेब पर मुफ्त में उपलब्ध tkdiff जैसे कार्यक्रमों के साथ, मैं इस कदम आसान होगा, लेकिन मैं गलत था! लगभग 7500 टिकर के साथ, सब से पहले, यह मैन्युअल tkdiff में फ़ाइलों को लोड करने के लिए रास्ता बहुत लंबा समय लगता है। मैं तुलना को स्वचालित करने की जरूरत है। मैं स्वचालित जाने के बाद, मैं एक पैसा या दो से मामूली अंतर लगभग साप्ताहिक होता है कि पाया। (एक विक्रेता पिछले निष्पादित कीमत के रूप में बंद लेता है और एक और विक्रेता बोली के बीच पिछले प्रसार के बीच का उपयोग करता है और बंद के रूप में कीमत पूछना अगर यह, उदाहरण के लिए, हो सकता है।) मैं बहुत जल्दी मैं के बारे में पता करने के लिए नहीं चाहता था कि फैसला किया तीन विक्रेताओं के बीच डाटा में छोटे मतभेदों। Thats backtesting परिणामों पर एक सामग्री प्रभाव है नहीं जा रहा। बात क्या करता है, हालांकि, समय-समय पर फसली कि भारी अंतराल है। उन लोगों की पहचान करने के लिए, मैं एक फजी रचनाकार कार्यक्रम में लिखा था। यह दो विक्रेताओं और झंडे से डेटा तुलना गलत तुलना, प्रमुख त्रुटियों (अधिक से अधिक $ 0.04 बंद कर रहे हैं कि मान), मामूली त्रुटियों (कम से कम $ 0.04) और कोई त्रुटि में छँटाई। मैं दो बार फजी रचनाकार भाग गया: एक बार सीएसआई और Worden डेटा सेट की तुलना फिर सीएसआई और TradeStation की तुलना, और। चरण 4: विश्लेषण गलत तुलना। पिछले चरण विक्रेताओं के बीच तुलना नहीं था कि मूल्य डेटा बिंदुओं की एक सूची सामने आए। मैं परिश्रम दो मूल्य चार्ट को देख और त्रुटि के समय के आसपास टिकर पर खबर शोध प्रमुख त्रुटियों के प्रत्येक छानबीन की। ज्यादातर मामलों में, यह दोषपूर्ण डेटा सेट किया गया था जिसमें स्पष्ट किया गया था। चरण 5: डेटा विक्रेताओं के लिए प्रतिक्रिया। मैं एक अच्छा नागरिक हो सकता है और मैंने पाया था डेटा त्रुटियों के सबसे रिपोर्ट करने के लिए फैसला किया। सीएसआई डेटा तुरंत मेरी प्रतिक्रिया का जवाब दिया और आम तौर पर अपने डेटा की शुद्धता का बचाव किया, fewest त्रुटियों था। TradeStation जल्दी से सत्यापित और मैं सूचना सभी त्रुटियों को ठीक है कि एक समर्पित स्टाफ है। मैं उन्हें बाहर की ओर इशारा किया जब Worden सब पर सबसे त्रुटियों और फ्लॉप का जवाब था। कहने की जरूरत नहीं है कि मैं अब Worden डेटा का उपयोग कर के बहुत चिंतित हूँ, कहने के लिए। चरण 6: अंतिम ऐतिहासिक मूल्य डेटा का चयन करें। अंत में, मैं स्टॉक टिकर की अंतिम सूची के साथ आया था। कुछ टिकर स्पष्ट था गलत तुलना करता है और कोई स्पष्ट अपराधी तो मैं अपनी सूची से उन्हें नष्ट कर दिया। मैं अपने स्वर्णिम ऐतिहासिक कीमत डेटा सेट के रूप में सीएसआई डेटा (प्लस संयुक्त राष्ट्र की जाँच की delisted डेटा) की साफ सेट नामित। मैं अनजाने में परिवर्तन से बचने के लिए एक अलग निर्देशिका में नीचे बंद कर दिया है कि रखने के लिए। (विक्रेताओं कम से कम दैनिक डेटा को अद्यतन करने और त्रुटियों को ठीक कर सकता है। Backtesting प्रत्येक रणनीति रणनीतियों के बीच तुलना करने के लिए वास्तव में एक ही डेटा पर प्रदर्शन करने की जरूरत शुरू होता है एक बार भी एक तय अनिष्ट है।) चरण 7: backtesting इंजन के लिए सुनहरा कीमत डेटा फीड। TradeStation, मेरी पसंद के backtesting इंजन, डिफ़ॉल्ट रूप से अपने स्वयं के डेटा पर चलता है। कैसे इसे पढ़ने के लिए TradeStation बताने के लिए डेटा और भी स्थापना की विशेषता और डेटा आदेश पैरामीटर फाइल को इंगित करने के लिए 3 पार्टी टैब, एक बाहरी डाटासेट का उपयोग करने के लिए, आप प्रतीक Lookup - और जी.टी. उपयोग किया है। पूर्ण निर्देशों के लिए 3 पार्टी डेटा के तहत TradeStation मदद फ़ाइलें देखें। यह कठिन प्रक्रिया आप backtesting से सटीक, उच्च गुणवत्ता वाले परिणाम प्राप्त मदद करता है। 8220 के लिए 2 जवाब; Backtesting8221 के लिए मूल्य डेटा साफ़ करने के लिए; पैट कांटा | 4/02/10 मैं विदेशी मुद्रा के लिए नए एक प्रोग्रामर हूँ और एक संकेतक के रूप एमएसीडी के अपने मूल्यांकन में सबसे अधिक दिलचस्पी थी, मैं वेब पर इस सूचक के बारे में बहुत कुछ पढ़ा है। मैं मैं तेजी से स्टोकेस्टिक साथ एमएसीडी गठबंधन, यह मेरे अब तक के परिणाम, अभी भी विश्लेषण करने अद्भुत है पाया है अभी तक गोली काट लिया havent। मैं इस आने वाले सोमवार से शुरू करने जा रहा हूँ। अपने backtesting डेटा समय सीमा के अनुसार उच्च, बंद और कम ओपन, विरोध के रूप में यह होता है समय पर वास्तविक टिक या मूल्य है? मैंने पढ़ा है वाट से मैं यह विश्वास है। डेटा खनन के बारे में थोड़ा जानता है कि एक प्रोग्रामर होने के नाते मैं समय और प्रयास आप खर्च किया है की राशि की सराहना कर सकते हैं। मैं अपने तप को बधाई देता हूं। ऊपर वर्णित के रूप में मेरे startegy काम करता है, तो मैं तुम्हें उस के लिए धन्यवाद दिया है। backtester | 4/02/10 अपने शालीन टिप्पणी के लिए धन्यवाद। मैं अपने व्यापार के साथ अच्छी तरह से आप चाहते हैं, जो भी रणनीति आप चुनते हैं। मेरे backtesting डेटा के दिन सभी के अंत, बंद सिर्फ ओपन, हाई, लो, है। यह वैसे मोटे है इसलिए ज्यादातर मेरे backtests रोकने के नुकसान को छोड़कर ओपन पर बाजार में प्रवेश कर रहे हैं। Ive truthaboutmacd पर (आईटी शेयरों पर लागू होता है) के रूप में अभी तक विदेशी मुद्रा के लिए एमएसीडी आवेदन नहीं किया है एमएसीडी के बारे में अधिक जानकारी मिल गया। आप backtesting और नकदी के जोखिम से पहले अच्छी तरह से स्थिति का आकलन कर रहे सुनकर खुशी हुई।



No comments:

Post a Comment