जनसांख्यिकीय तरीके प्रिंसटन यूनिवर्सिटी कैप्लन-मायर जीवन रक्षा स्टैटा में निरंतर समय में अस्तित्व विश्लेषण के लिए शानदार सुविधाएं हैं, जिसमें कैप्लन-मीयर का अनुमानक भी शामिल है। मैं कक्षा में चर्चा किए गए गेहूँ डेटा का उपयोग करके अनुमानक को समझाऊंगा ये कैंसर के मरीजों को एक नियंत्रण और एक इलाज समूह (क्रमशः 1 और 2 क्रमशः) में आने से पहले सप्ताह हैं। पहली बात जो आप स्ताट में करते हैं वह डाटा जो निर्दिष्ट करता है कि वेरिएबल जो टाइम और वेरिएबल का प्रतिनिधित्व करता है जो सेंसर वाले मामलों से विफलता को अलग करता है: हम असफलताओं की संख्या और जोखिम पर कुल समय के बारे में एक उपयोगी विवरण प्राप्त करते हैं। ग्रुप द्वारा हम कैटलान-मीयर अनुमान की गणना और साजिश करने के लिए एसटीएस ग्राफ़ का इस्तेमाल करते हैं आप ग्रीनवुड मानक त्रुटियों के आधार पर बिंदु विकल्प का प्रयोग करके गवर्नू विकल्प का उपयोग कर सकते हैं। जब इसके साथ-साथ साइड प्लॉट्स में यह परिणाम समूहबद्ध किया जाता है पूर्ण महिमा में अनुमान देखने के लिए एसएस सूची का उपयोग करें। आप इन सभी परिणामों को हाथ से पुन: पेश करने में सक्षम होना चाहिए, जैसा कि हमने कक्षा में किया था। प्रिंसटन यूनिवर्सिटी नोटिफिकेशन 2017 जर्मटाकटन रॉड्रीक्यूटेग्यूज़, प्रिंसटन यूनिवर्सिटी नोटिस: आईडीआरई सांख्यिकीय परामर्श समूह फरवरी में वेबसाइट को वर्डप्रेस सीएमएस में माइग्रेट कर देगा ताकि नई सामग्री के रखरखाव और निर्माण की सुविधा मिल सके। हमारे कुछ पुराने पृष्ठों को हटा दिया जाएगा या संग्रहीत किया जाएगा ताकि उन्हें अब बनाए रखा नहीं जाएगा हम रीडायरेक्ट बनाए रखने का प्रयास करेंगे ताकि पुरानी यूआरएल हम जितनी अच्छी तरह काम कर सकें उतना काम जारी रहेगा। डिजिटल रिसर्च एंड एजुकेशन फॉर डिजिटल रिसर्च एंड एजुकेशन में आपका स्वागत है स्टेट परामर्श समूह की मदद से उपहार देने के लिए सांख्यिकीय कम्प्यूटिंग सेमिनार सर्विलीवल एनालिसिस स्टेटा स्टेटा प्रोग्राम जिस पर सेमिनार आधारित है। संगोष्ठी के लिए UISsmall डेटा फ़ाइल इस संगोष्ठी का लक्ष्य अस्तित्व विश्लेषण के विषय में संक्षिप्त परिचय देना है। हम Hosmer और Lemeshow द्वारा बुक एप्लाइड जीवन रक्षा विश्लेषण से यूआईएस डेटा सेट के एक छोटे और थोड़ा संशोधित संस्करण का उपयोग करेंगे। हम उन सभी को प्रोत्साहित करते हैं जो इस पाठ को पढ़ने के लिए उत्तरजीविता विश्लेषण सीखने में दिलचस्पी रखते हैं क्योंकि यह विषय का एक बहुत अच्छा और पूर्ण परिचय है। अस्तित्व का विश्लेषण सिर्फ घटना विश्लेषण के लिए समय का एक और नाम है। शब्द जीवित विश्लेषण का प्रयोग मुख्यतः बायोमेडिकल विज्ञान में किया जाता है, जहां ब्याज रोगियों या प्रयोगशाला जानवरों की मृत्यु के समय में देखे जा रहे हैं। ईवेंट विश्लेषण का समय भी सामाजिक विज्ञान में व्यापक रूप से उपयोग किया गया है जहां ब्याज घटनाओं के लिए समय के विश्लेषण जैसे कि नौकरी में परिवर्तन, शादी, बच्चों का जन्म और इतनी आगे है। इंजीनियरिंग विज्ञान ने अस्तित्व के विश्लेषण के विकास में भी योगदान दिया है, जिसे इस क्षेत्र में विश्वसनीयता विश्लेषण या विफलता के समय विश्लेषण कहा जाता है, क्योंकि मुख्य फोकस मशीन या इलेक्ट्रानिक घटकों के लिए टूटने के समय के मॉडलिंग में है। इन विविध क्षेत्रों के विकास के लिए अधिकांश भाग अस्तित्व विश्लेषण के क्षेत्र में समेकित किए गए हैं। अधिक पृष्ठभूमि के लिए कृपया पॉल एलिसन द्वारा इवेंट इतिहास विश्लेषण के अध्याय 1 में उत्कृष्ट चर्चा देखें। अस्तित्व के विश्लेषण डेटा के कुछ पहलू हैं, जैसे सेंसरिंग और गैर-सामान्यता, जो कि कई रैखिक प्रतिगमन जैसे पारंपरिक सांख्यिकीय मॉडल का उपयोग करके डेटा का विश्लेषण करने की कोशिश करते समय बड़ी मुश्किलें पैदा करते हैं। डेटा के गैर-नैतिकता का पहलू सामान्यतः इस्तेमाल किए जाने वाले सांख्यिकीय मॉडल जैसे सामान्यकरण या एनोवा, आदि की सामान्यता धारणा का उल्लंघन करता है। एक सेंसरयुक्त अवलोकन को अधूरे जानकारी के साथ एक अवलोकन के रूप में परिभाषित किया गया है। संभवतः चार अलग-अलग प्रकार की सेंसरिंग हो रही है: सही कटौती, बायां ट्रांस्केशन, सही सेंसरिंग और बायां सेंसरिंग हम विशेष रूप से कई कारणों से सही सेंसरिंग पर ध्यान केंद्रित करेंगे। विश्लेषण में उपयोग किए जाने वाले अधिकांश डेटा में केवल सही सेंसरिंग है इसके अलावा, सही सेंसरिंग को सभी चार प्रकार के सेंसरिंग को आसानी से समझ लिया गया है और यदि कोई शोधकर्ता सही सेंसर करने की अवधारणा को समझ सकता है तो यह अन्य तीन प्रकारों को समझने में बहुत आसान हो जाता है। जब एक अवलोकन सही सेंसर होता है तो इसका मतलब है कि जानकारी अधूरी है क्योंकि इस विषय के दौरान उस समय कोई घटना नहीं थी जब विषय अध्ययन का हिस्सा था। उत्तरजीविता विश्लेषण की बात यह है कि समय के साथ विषयों का पालन करें और उस समय पर ध्यान दें कि वे ब्याज की स्थिति का अनुभव करते हैं। यह अक्सर ऐसा होता है कि अध्ययन में अध्ययन के सभी विषयों के लिए घटना का पालन करने के लिए पर्याप्त समय नहीं होता है। यह कई कारणों के कारण हो सकता है शायद अध्ययन अध्ययन से संबंधित कारणों से अध्ययन से बाहर निकलते हैं (यानी, किसी दूसरे क्षेत्र में जा रहे मरीज़ और कोई अग्रेषण पता नहीं छोड़ते)। इन सभी उदाहरणों की आम विशेषता यह है कि यदि विषय अध्ययन में बने रहने के लिए सक्षम हो गया होता तो अंततः इस घटना के समय का पालन करना संभव होगा। अध्ययन में कैलेंडर के समय और समय में अंतर को समझना महत्वपूर्ण है। अध्ययन के पूरे लम्बे समय तक अध्ययन में प्रवेश करने वाले विषयों के लिए यह बहुत आम है। यह स्थिति पहले आलेख में परिलक्षित होती है जहां हम चार विषयों के कंपित प्रवेश देख सकते हैं। लाल बिंदियाँ अंतराल को दर्शाती हैं जिसमें घटना हुई, जबकि लाल डॉट्स के बिना अंतराल सेंसर को दर्शाती है। ऐसा प्रतीत होता है कि विषय 4 को केवल थोड़े समय (एक बस, बहुत दुखद द्वारा मारा) के बाद छोड़ दिया गया और उस विषय 3 ने अध्ययन समाप्त होने तक एक घटना का अनुभव नहीं किया, लेकिन अगर अध्ययन लंबे समय तक चला गया था (अधिक धनराशि) हम उस समय को जानते होंगे जब इस विषय पर एक घटना का अनुभव होता। उत्तरजीविता विश्लेषण में अन्य महत्वपूर्ण अवधारणा खतरे की दर है असतत समय (बड़े अंतराल जैसे महीने, वर्ष या दशकों में मापा गया समय) के साथ डेटा को देखने से हम खतरे की दर का सहज ज्ञान प्राप्त कर सकते हैं असतत समय के लिए खतरे की दर संभावना है कि किसी व्यक्ति को समय पर एक घटना का अनुभव होगा, जबकि उस व्यक्ति को एक घटना के लिए जोखिम है। इस प्रकार, खतरा दर वास्तव में केवल अप्रभावित दर है जिस पर घटनाएं होती हैं। यदि खतरे की दर समय के साथ स्थिर होती है और उदाहरण के लिए 1.5 के बराबर होती है तो इसका मतलब यह होगा कि एक 1.5 अंतराल की घटनाओं को एक इकाई के लंबे समय तक होने की उम्मीद करता है। इसके अलावा, अगर किसी व्यक्ति को समय के समय 1.2 पर जोखिम दर होती है और एक दूसरे व्यक्ति को समय पर 2.4 की जोखिम दर होती है तो यह कहना सही होगा कि किसी घटना के दूसरे व्यक्ति जोखिम समय पर दो गुना अधिक होगा। । यह समझना महत्वपूर्ण है कि खतरे की दर एक अनजान चर है, फिर भी यह घटनाओं और घटनाओं का समय दोनों को नियंत्रित करता है। यह अस्तित्व विश्लेषण में मूल निर्भर चर है। खतरे का एक अन्य महत्वपूर्ण पहलू यह है कि यह समझना चाहिए कि खतरे के काम का आकार हित के अन्य चर जैसे कि जीवित फ़ंक्शन को प्रभावित करेगा। नीचे दिए गए पहले ग्राफ़ में एक बाथटब आकार के साथ एक खतरा कार्य दिखाया गया है। यह आलेख अंग प्रत्यारोपण के रोगियों के अस्तित्व के लिए खतरे के कार्य को दर्शाता है। शून्य के बराबर समय पर प्रत्यारोपण हो रहे हैं और चूंकि यह एक बहुत ही खतरनाक ऑपरेशन है, इसलिए उन्हें बहुत अधिक खतरा है (मरने का एक बड़ा मौका)। ऑपरेशन के पहले 10 दिन बाद भी रोगी की मौत के उच्च मौके पर खतरनाक होते हैं, लेकिन वास्तविक ऑपरेशन के दौरान खतरे कम होता है और इसलिए इस अवधि के दौरान खतरे में कमी आती है। यदि मरीज पिछले 10 दिनों में बच गए तो वे बहुत अच्छे आकार में हैं और निम्न 6 महीनों में मरने का एक बहुत ही कम मौका है। 6 महीनों के बाद मरीज़ों में गिरावट का अनुभव शुरू हो जाता है और मृत्यु में वृद्धि की संभावना फिर से बढ़ती है और इसलिए खतरे का कार्य बढ़ाना शुरू हो जाता है। एक वर्ष के बाद लगभग सभी मरीज़ मर चुके हैं और इसलिए बहुत अधिक खतरे का कार्य है जो कि वृद्धि जारी रखेगा। खतरे का कार्य मॉडल के लिए एक रोमांचक चर की तरह प्रतीत नहीं हो सकता है लेकिन ब्याज की अन्य संकेतक, जैसे अस्तित्व फ़ंक्शन, खतरे की दर से प्राप्त होते हैं एक बार जब हम खतरे की दर को मॉडल करते हैं तो हम आसानी से ब्याज के इन अन्य कार्यों को प्राप्त कर सकते हैं। संक्षेप में, जोखिम समारोह की अवधारणा को समझना और जोखिम कार्य के आकार को समझना महत्वपूर्ण है। दिल प्रत्यारोपण रोगियों के लिए एक खतरा कार्य का एक उदाहरण। आम तौर पर हम आम तौर पर संचयी खतरा वक्र को देखते हुए खतरा फ़ंक्शन उत्पन्न करने में असमर्थ होते हैं। यूआईएस डेटा का लक्ष्य मॉडल के समय तक है जब तक कि दो अलग-अलग आवासीय उपचार कार्यक्रमों में लगी हुई दवाओं के लिए नशीले पदार्थों के उपयोग पर लौटने तक का समय होता है (जो कि 0 का छोटा कार्यक्रम है और इसका इलाज 1 लंबा कार्यक्रम है)। रोगियों को बेतरतीब ढंग से दो अलग-अलग साइटों (साइट 0 साइट ए और साइट 1 साइट बी) को सौंप दिया गया है। चर युग नामांकन में आयु इंगित करता है, हेर्को पिछले तीन महीनों में हैरोइन या कोकीन का उपयोग इंगित करता है (हेर्को 1 हेरोइन और कोकीन का उपयोग इंगित करता है, हेक्को 2 हेरोइन या कोकेन का उपयोग करने का संकेत देता है और हेक्को 3 इंगित करता है कि हेरोइन और न ही कोकीन का इस्तेमाल न करें) और ndrugtx इंगित करता है पिछले दवा उपचार की संख्या वेरिएबल्स के समय में नशीली दवाओं के इस्तेमाल पर लौटने तक का समय होता है और सेंसर वैरिएबल यह इंगित करता है कि क्या विषय नशीली दवाओं के उपयोग में लाया गया है (सेंसर 1 दवा के उपयोग पर लौटने का संकेत देता है और अन्यथा 0 सेंसर करता है)। यूआईएस डेटा सेट के पहले 10 अवलोकनों पर गौर करें। ध्यान दें कि विषय 5 को सेंसर किया गया है और अध्ययन में जबकि किसी घटना का अनुभव नहीं हुआ। यह भी ध्यान रखें कि सेंसर के लिए कोडिंग का मुकाबला काउंटर-सहज है क्योंकि मान 1 एक इवेंट इंगित करता है और 0 सेन्सरिंग इंगित करता है। यह शायद इस चर quoteventquot कॉल करने के लिए अधिक उपयुक्त होगा। किसी भी डेटा विश्लेषण में यह हमेशा अधिक जटिल मॉडलों की ओर बढ़ने से पहले कुछ असाधारण विश्लेषण करने के लिए एक महान विचार है। अस्तित्व के विश्लेषण में यह सभी विशिष्ट पूर्वानुमानियों के लिए कैप्लन-मीयर घटता को देखने के लिए अत्यधिक अनुशंसित है। यह प्रत्येक समूह के लिए अस्तित्व समारोह के आकार में अंतर्दृष्टि प्रदान करेगा और यह विचार प्रदान करेगा कि समूह आनुपातिक (यानी उत्तरजीविता कार्य लगभग समानांतर) हैं या नहीं। हम अंतिम मॉडल में भविष्यवक्ता को शामिल करने या नहीं, यह पता लगाने के लिए सभी स्तरों में समानता के परीक्षणों पर विचार भी करते हैं। स्पष्ट वैरिएबल के लिए हम समान स्तर के समानता के लॉग-रैंक टेस्ट का उपयोग करेंगे जो एक गैर-पैरामीट्रिक टेस्ट है। निरंतर चर के लिए हम एक अशिक्षित कॉक्स आनुपातिक खतरा प्रतिगमन का उपयोग करेंगे जो एक अर्ध-पैरामीट्रिक मॉडल है। अगर भविष्य में परीक्षण 0.2-0.25 या उससे कम का पी-मान होता है, तो हम भविष्यवक्ता सहित विचार करेंगे। हम इस उन्मूलन योजना का उपयोग कर रहे हैं क्योंकि डेटा सेट में सभी भविष्यवाणियों वेरिएबल हैं जो मॉडल के लिए प्रासंगिक हो सकते हैं। अगर भविष्यवक्ता के पास एक univariate विश्लेषण में 0.25 से अधिक पी मूल्य है तो यह बहुत कम संभावना नहीं है कि यह एक मॉडल में कुछ योगदान देगा जिसमें अन्य अनुमान लगाया गया है। भविष्यवाणियों के इलाज के लिए समस्तता में लॉग-रैंक टेस्ट 0.0091 का पी-वेल है, इस प्रकार इलाज के लिए अंतिम मॉडल के लिए एक संभावित उम्मीदवार शामिल किया जाएगा। ग्राफ से हम देखते हैं कि इलाज के प्रत्येक समूह के लिए अस्तित्व का कार्य बिल्कुल समानांतर नहीं है, लेकिन बहुत ही शुरुआत और बहुत अंत तक अलग है बहुत अंत में ओवरलैप को बहुत चिंता का कारण नहीं होना चाहिए क्योंकि यह 628 विषयों के साथ केवल एक बहुत ही कम संख्या वाले सेंसर वाले विषयों द्वारा निर्धारित किया जाता है। सामान्य तौर पर, लॉग-रैंक परीक्षा में क्यूवर्स में अंतरों पर अधिक जोर दिया जाता है जो कि बड़े समय मानों पर होता है। यही कारण है कि हमें ऐसे छोटे-से-पी-मूल्य मिलते हैं, हालांकि दो जीवित रहने के घटता 100 दिनों से कम समय के लिए एक साथ बहुत करीब दिखते हैं। भविष्यवक्ता साइट के लिए सभी स्तरों के बराबर समानता का लॉग-रैंक परीक्षण 0.1240 का पी-मान है, इस प्रकार साइट को अंतिम मॉडल के लिए एक संभावित उम्मीदवार के रूप में शामिल किया जाएगा क्योंकि यह पी-मान अभी भी हमारे 0.2 के कट ऑफ़ की तुलना में कम है। ग्राफ से हम देखते हैं कि जीवित रहने के घटता सभी समानांतर नहीं हैं और ये दो अवधि (0, 100 और 200, 300) हैं, जहां वक्र बहुत करीब हैं। यह लॉग-रैंक परीक्षा के बजाय उच्च पी-मूल्य की व्याख्या करेगा। भविष्यवक्ता हेरोको के लिए समस्तता में लॉग-रैंक परीक्षा में 0.1473 का पी-मान है, इस प्रकार हेलको को अंतिम मॉडल के लिए संभावित उम्मीदवार के रूप में शामिल किया जाएगा। ग्राफ से हम देखते हैं कि तीन समूह समानांतर नहीं हैं और विशेष रूप से समूहों के हेक्को 1 और हेक्को 3 अधिकांश ग्राफ के लिए ओवरलैप करते हैं। समानता की कमी इस समस्या को उत्पन्न कर सकती है जब हम कॉक्स आनुपातिक खतरे के मॉडल में इस भविष्यवाणक को शामिल करते हैं क्योंकि एक अनुमान के अनुसार भविष्यवाणियों की आनुपातिकता है। निरंतर भविष्यवक्ताओं के लिए कैप्लन-मीयर वक्र की गणना करने के लिए यह संभव नहीं है क्योंकि भविष्य के प्रत्येक स्तर के लिए एक वक्र होगा और एक सतत भविष्यवक्ता के पास बहुत अधिक विभिन्न स्तर हैं। इसके बजाय हम कॉक्स आनुपातिक खतरे के मॉडल को एक निरंतर भविष्यवक्ता के साथ देखते हैं। दुर्भाग्य से यह संभव नहीं है कि स्टैक्स कमांड का उपयोग करते समय एक साजिश का निर्माण किया जा सके। इसके बजाय हम ndrugtx के लिए ची स्क्वाड परीक्षण पर विचार करते हैं जिसमें 0.0003 का पी-मान है, इसलिए ndrugtx अंतिम मॉडल के लिए एक संभावित उम्मीदवार है क्योंकि p-value 0.2 के हमारे कट-ऑफ मूल्य से कम है। हम यह इंगित करने के लिए विकल्प नहर निर्दिष्ट करते हैं कि हम जोखिम अनुपात देखना नहीं चाहते हैं बल्कि हम गुणांक को देखना चाहते हैं। इस मॉडल में उम्र के ची-स्क्वेर्ड परीक्षा में 0.2 से भी कम का पी-मान होता है और इसलिए यह अंतिम मॉडल के लिए एक संभावित उम्मीदवार है। हमारे मॉडल की इमारत के लिए, हम पहले मॉडल पर विचार करेंगे जिसमें सभी भविष्यवाणियों को शामिल किया गया था, जिनके पास बेहिसाब विश्लेषण में 0.2 से 0.25 से कम का पी-मान था, जो इस विशेष विश्लेषण में इसका मतलब है कि हम अपने मॉडल में हर भविष्यवक्ता को शामिल करेंगे। स्पष्ट प्रक्रमक हेक्को के तीन स्तर हैं और इसलिए हम इस अनुक्रमक को डमी वैरिएबल का उपयोग करके संदर्भ समूह के रूप में समूह हेरो 1 के साथ शामिल करेंगे। हम स्टैक्स के साथ एक्सआई कमांड का उपयोग करके मक्खी पर इन डमी वैरिएबल बना सकते हैं। भविष्यवक्ता हेको स्पष्ट रूप से महत्वपूर्ण नहीं है और हम इसे अंतिम मॉडल से छोड़ देंगे। भविष्यवक्ता साइट भी महत्वपूर्ण नहीं है लेकिन पूर्व शोध से हम जानते हैं कि यह अंतिम मॉडल में होने वाला एक बहुत महत्वपूर्ण चर है और इसलिए हम मॉडल से साइट को खत्म नहीं करेंगे। इसलिए, मुख्य प्रभावों के अंतिम मॉडल में शामिल हैं: उम्र ndrugtx इलाज और साइट अगला हम बातचीत पर विचार करने की आवश्यकता है। हमारे पास विशिष्ट बातचीत का कोई पूर्व ज्ञान नहीं है जिसमें हमें शामिल करना होगा ताकि हम सभी संभव बातचीतओं पर विचार करें। चूंकि हमारा मॉडल छोटा नहीं है, इसलिए यह प्रबंधनीय है, लेकिन आदर्श स्थिति तब होती है जब सभी मॉडल का निर्माण, जिसमें इंटरैक्शन शामिल हैं, सिद्धांत संचालित हैं। Ndrugtx के साथ उम्र का अंतराल अवधि महत्वपूर्ण नहीं है और मॉडल में शामिल नहीं किया जाएगा। बातचीत की उम्र और उपचार महत्वपूर्ण नहीं है और मॉडल में शामिल नहीं किया जाएगा। बातचीत की उम्र anf साइट महत्वपूर्ण है और मॉडल में शामिल किया जाएगा। इंटरैक्शन दवा एएनएफ का इलाज महत्वपूर्ण नहीं है और मॉडल में शामिल नहीं किया जाएगा। बातचीत दवा और साइट महत्वपूर्ण नहीं है और मॉडल में शामिल नहीं किया जाएगा। बातचीत का इलाज और साइट महत्वपूर्ण नहीं है और मॉडल में शामिल नहीं किया जाएगा। अंतःक्रिया सहित अंतिम मॉडल अब हम देख सकते हैं कि हमारे मॉडल में साइट को शामिल करना महत्वपूर्ण क्यों था क्योंकि पूर्व अनुसंधान ने सुझाव दिया था क्योंकि यह पता चला है कि साइट मॉडल में केवल महत्वपूर्ण बातचीत में शामिल है। हम मॉडल की तुलना मॉडल के साथ तुलना कर सकते हैं क्योंकि मॉडल नेस्टेड के बाद से lrtest कमांड का उपयोग करते हुए इंटरैक्शन किए बिना। महत्वपूर्ण लर्टेस्ट यह इंगित करता है कि हम नल की अवधारणा को अस्वीकार करते हैं कि दो मॉडल आंकड़ों को समान रूप से फिट करते हैं और यह निष्कर्ष निकालते हैं कि बातचीत के साथ बड़ा मॉडल छोटे मॉडल की तुलना में बेहतर डेटा फिट करता है जिसमें इंटरैक्शन शामिल नहीं था। खतरा अनुपात का अंतिम मॉडल और व्याख्या। जोखिम अनुपात को देखकर (जिसे सापेक्ष जोखिम भी कहा जाता है) मॉडल बताता है कि एक इकाई द्वारा पिछले दवा उपचार (ndrugtx) की संख्या बढ़ जाती है, और अन्य सभी चर स्थिर रहते हैं, पुनरावृत्ति की दर 3.7 से बढ़ जाती है। यदि उपचार की लंबाई को संक्षेप से लंबे समय तक बदल दिया जाता है, जबकि अन्य सभी चर निरंतर रखा जाता है, पुनरुत्थान की दर (100 - 76.5) 23.5 से घट जाती है। जैसा कि इलाज साइट ए से साइट बी में ले जाया जाता है और उम्र शून्य के बराबर होती है, और अन्य सभी चर निरंतर बनाए जाते हैं, (100-28.8) 71.2 के द्वारा पुनरुत्थान की दर घट जाती है। ये परिणाम सभी जोखिम अनुपात का उपयोग करते हुए आउटपुट पर आधारित होते हैं। इंटरैक्शन टर्म में शामिल चर के बारे में चर्चा करने के लिए, जैसे कि हमारे मॉडल में उम्र और साइट, हमें कच्चे गुणांक का उपयोग करने की आवश्यकता है और यहां ये सुविधा के लिए नीचे सूचीबद्ध हैं। साइट ए (साइट 0) के भीतर 2 विषयों की तुलना, 5 वर्ष की आयु में वृद्धि, जबकि अन्य सभी चर स्थिर बनाए गए हैं, एक्सपी (-0.0336 9 5) के बराबर खतरा अनुपात .84497351। इस प्रकार, पुनरुत्थान की दर (100 - 84.5) 15.5 आयु में 5 वर्ष की वृद्धि के साथ कम हो गई है। साइट बी में 2 विषयों की तुलना करते हुए, 5 वर्षों की उम्र में वृद्धि, अन्य सभी चर निरंतर रखने के साथ, एक्सपी (-0.033695 0.033775) 1.0004 के बराबर खतरा अनुपात पैदा करता है। इस प्रकार, दुर्घटना की दर साइट बी पर विषयों के लिए 1.0004 के बराबर फ्लैट रहता है, यदि 1 के करीब है। कॉक्स आनुपातिक जोखिम मॉडल की मुख्य धारणाओं में से एक समानता है। यह सत्यापित करने के लिए कई तरीके हैं कि एक मॉडल आनुपातिकता की धारणा को संतुष्ट करता है और इस विषय पर अधिक जानकारी के लिए कृपया एसएएस, स्टाटा, एसपीयूएसयूएस और आर में आनुपातिकता के हमारे सामान्य प्रश्नों का परीक्षण करें। समय-समय पर निर्भर कॉरपोरेट मॉडल का उपयोग करके टीवीक और टेक्सप विकल्प stkx आदेश में। समय पर निर्भर कॉरपोरेट्स भविष्यवाणियों और समय की बातचीत है इस विश्लेषण में हम लॉग (समय) के साथ बातचीत का उपयोग करना चुनते हैं क्योंकि समय-समय पर निर्भर करता है, लेकिन समय के किसी भी कार्य का उपयोग किया जा सकता है। यदि समय-आधारित कॉरपोरेट महत्त्वपूर्ण है, तो यह उस विशिष्ट प्रक्षेपक के लिए आनुपातिक धारणा के उल्लंघन का संकेत देता है। निष्कर्ष यह है कि सभी समय पर निर्भर चर या तो सामूहिक रूप से या व्यक्तिगत रूप से महत्वपूर्ण नहीं हैं, इस प्रकार आनुपातिक खतरे की धारणा का समर्थन करते हैं। आनुपातिकता धारणा का परीक्षण करने का एक अन्य तरीका है Schoenfeld और स्केल किए गए स्नोफेल्ड अवशिष्टों का उपयोग करके जिसे पहले stxx आदेश के माध्यम से बचाया जाना चाहिए। Stphtest कमांड में हम एक पूरे के रूप में मॉडल की आनुपातिकता का परीक्षण करते हैं और विस्तार विकल्प का उपयोग करके हम प्रत्येक प्रणोदक के लिए आनुपातिकता का एक परीक्षण प्राप्त करते हैं। साजिश के विकल्प का उपयोग करके हम स्केलेबल स्नोफेल्ड धारणा का एक ग्राफ़ प्राप्त कर सकते हैं। यदि तालिका में परीक्षण महत्व नहीं हैं (0.05 से अधिक पी-मान) तो हम आनुपातिकता को अस्वीकार नहीं कर सकते और हम मानते हैं कि हमारे पास आनुपातिक धारणा का उल्लंघन नहीं है। ग्राफ में एक क्षैतिज रेखा आगे संकेत है कि आनुपातिकता धारणा का कोई उल्लंघन नहीं है। एसपीप्लोट कमांड आनुपातिकता का परीक्षण करने के लिए लॉग-लॉग भूखंडों का उपयोग करता है और यदि इन भूखंडों की रेखाएँ समानांतर होती हैं, तो हमारे पास यह भी संकेत मिलता है कि भविष्यवक्ता आनुपातिकता धारणा का उल्लंघन नहीं करते हैं। भविष्यवक्ता का इलाज कुछ करीब से जांच कर सकता है क्योंकि इसमें एक महत्वपूर्ण परीक्षण होता है और ग्राफ में वक्र पूरी तरह क्षैतिज नहीं है। Stphplot कमांड के ग्राफ में पूरी तरह से समानांतर घटता नहीं है हालांकि, हम पूर्व शोध के आधार पर मॉडल को अनलिखित मॉडल में छोड़ने का विकल्प चुनना पसंद करते हैं। अगर भविष्यवक्ताओं में से कोई एक आनुपातिक नहीं था, तो विचार करने के लिए कई समाधान हैं। एक समाधान के लिए गैर-आनुपातिक predictors के लिए समय पर निर्भर चर शामिल है एक अन्य समाधान गैर-आनुपातिक भविष्यवक्ता पर स्तरीय होना है। निम्नलिखित प्रेरक के इलाज पर स्तरीकरण का एक उदाहरण है। ध्यान दें कि व्यवहार अब मॉडल विवरण में शामिल नहीं है, इसके बजाय यह स्ट्रेट स्टेटमेंट में निर्दिष्ट किया गया है। पैरामीटर का अनुमान लगभग प्रत्येक स्तर के इलाज के लिए समान है, जो आगे इंगित करता है कि वास्तव में उपचार आनुपातिक है। यदि व्यवहार वास्तव में आनुपातिकता की धारणा का उल्लंघन कर रहा था तो हम अनुमानों को अलग करने की अपेक्षा करेंगे। अनुमान भी एक अनुमानक के रूप में व्यवहार सहित मॉडल से प्राप्त अनुमान के समान हैं। प्रत्येक गोपनीय स्वरूप में एक अलग अस्तित्व समारोह होगा। डिफ़ॉल्ट अस्तित्व का काम, प्रोवेरेटर पैटर्न के लिए होता है, जहां प्रत्येक भविष्यवक्ता शून्य के बराबर सेट होता है। हालांकि, कई भविष्यवाणियों के लिए यह मान सार्थक नहीं है क्योंकि यह मान डेटा के बाहर आती है जैसे कि 0 वर्ष। सटीक गोपनीय स्वरूप को निर्दिष्ट करने और उस विशिष्ट गोपनीय पैटर्न के साथ विषयों के लिए एक अस्तित्व का काम उत्पन्न करने के लिए यह अधिक उपयोगी होगा। निम्नलिखित उदाहरण में हम 30 वर्ष की आयु (30 वर्ष) वाले एक विषय के लिए जीवित समारोह का ग्राफ करना चाहते हैं, में 5 पूर्व दवा उपचार (ndrugtx 5) हैं, और वर्तमान में साइट ए (एक में 1) का इलाज कर रहा है साइट 0 और उम्र के 300 0)। हम सबसे पहले मूलभूत उत्तरदायित्व समारोह को प्रोवैयेट पैटर्न के लिए आउटपुट करते हैं जहां सभी भविष्यवाणियों को शून्य पर सेट किया जाता है। फिर हम गुणांक के रेखीय संयोजन और ब्याज की गलियारे के पैटर्न में संन्यासियों के मूल्यों के लिए घातीय के लिए बेसलाइन अस्तित्व समारोह को बढ़ाते हैं। इस प्रकार, इस विशेष उदाहरण में रैखिक संयोजन होगा: -0.0336943300.03645375 - 0.26741131 - 1.2459280 - .03377280 एक कोवेरेट पैटर्न के लिए अस्तित्व समारोह को देखते हुए कभी-कभी पर्याप्त नहीं होता है यह अक्सर एक ग्राफ के लिए बहुत उपयोगी होता है जहां हम विभिन्न समूहों के अस्तित्व के कार्यों की तुलना कर सकते हैं। निम्नलिखित उदाहरण में हम दो उपचार समूहों के लिए जीवित कार्यों के साथ एक ग्राफ तैयार करते हैं, जहां सभी विषयों 30 साल की उम्र (30 साल), 5 पूर्व दवा उपचार (ndrugtx 5) होते हैं और वर्तमान में साइट ए (साइट) पर इलाज किया जा रहा है 0 और यूनिअली 3000)। इस प्रकार, दो गोपनीय पद्धतियों के उपचार के लिए उनके मूल्यों में केवल भिन्नता है। हम कॉक्स-स्नेल के अवशेषों का उपयोग करके मॉडल के फिट का मूल्यांकन कर सकते हैं। अगर मॉडल डेटा को अच्छी तरह से फिट बैठता है, तो सच्चे संचयी खतरे को संचरित वेक्टर पर सशर्त रूप से एक के खतरे की दर के साथ घातीय वितरण होता है। यह स्टैक्स कमांड का इस्तेमाल करते हुए मॉडल को फिटिंग में तब्दील करता है और एमगेल विकल्प को निर्दिष्ट करता है जो कि शतरंज अवशिष्ट पैदा करेगा। इसके बाद हम मॉडल के लिए कॉक्स-स्नेल रेजीडियल उत्पन्न करने के लिए csnell विकल्प के साथ भविष्यवाणी कमांड का उपयोग करते हैं। हम वैट सीएस निर्दिष्ट करते हुए stset कमांड का उपयोग करके डेटा को रीसेट करते हैं। वेक्सिएबल जो कॉक्स-स्नेल के अवशिष्ट वाले समय के रूप में होता है। हम उसके बाद नेल्सन-आलिन संचयी जोखिम बनाने के लिए एसटीएस कमांड का उपयोग करते हैं। अंत में, हम नेल्सन-एलेन संचयी खतरा फ़ंक्शन और सीएस वैरिएबल को ग्राफ़ करते हैं ताकि हम खतरे की फ़ंक्शन को विकर्ण रेखा से तुलना कर सकें। यदि खतरे का काम 45 डिग्री लाइन के बाद होता है तो हम जानते हैं कि यह लगभग एक के खतरे की दर के साथ एक घातीय वितरण है और यह मॉडल डेटा को अच्छी तरह फिट बैठता है। हम देखते हैं कि खतरे का कार्य 45 डिग्री लाइन के बहुत ही निकट समय के बहुत ही बड़े मूल्यों को छोड़कर चलता है। सेंसर किए गए आंकड़ों के साथ मॉडल के लिए बहुत ही आम है, समय के बड़े मूल्यों पर कुछ झंझट करना और ऐसा कुछ नहीं है जिसके लिए बहुत चिंता का कारण होना चाहिए। कुल मिलाकर हम यह निष्कर्ष निकाल लेंगे कि अंतिम मॉडल डेटा को अच्छी तरह से फिट बैठता है। इस वेब साइट की सामग्री को कैलिफोर्निया विश्वविद्यालय द्वारा किसी विशेष वेब साइट, किताब या सॉफ़्टवेयर उत्पाद के समर्थन के रूप में नहीं समझा जाना चाहिए।
No comments:
Post a Comment