تبليغاتX
انجمن علمی آمار دانشگاه گرگان

انجمن علمی آمار دانشگاه گرگان

خبرنامه شماره ۴۷ انجمن آمار ایران

خبرنامه شماره ۴۷ انجمن آمار ایران منتشر شد.برای دریافت فایل آن در اینجا کلیلک کنید٠

+ نوشته شده در  چهارشنبه بیست و هشتم دی 1384ساعت 10:33  توسط انجمن علمی   | 

هشتمین کنفرانس آمار ایران

+ نوشته شده در  چهارشنبه بیست و هشتم دی 1384ساعت 10:31  توسط انجمن علمی   | 

دريافت خبرنامه انجمن آمار شماره 46 (كليك كنيد)
+ نوشته شده در  دوشنبه سی ام آبان 1384ساعت 15:49  توسط انجمن علمی   | 

كاربرد روش پاسخ تصادفي در به دست آوردن داده هاي كمي

كاربرد روش پاسخ تصادفي در به دست آوردن داده هاي كمي

مترجم: محمد رضا ربیعی[1]

چکیده:

روش تصادفي از كاهش پاسخ غلط در به دست آوردن جواب هاي سئوال هاي حساس در موقعيتي كه پاسخ ها كاملا سريع و كمي هستند گسترش يافته است. نتايج روي كاربردي از شيوه بر آورد ميانگين تعدادي از سقط جنين در زنان در يك جامعه شهري و همچنين ميانگين در آمد خانوارها گزارش شده است.اثر بر آورد كننده روي روشي از اهميت روش تصادفي پايه گذاري در مطالعه شده است و نتايج مورد نظر گزارش وبحث شده اند.

مقدمه :

 امتناع ورزيدن از پاسخ و دادن اطلاعات غلط از روي عمد به عنوان دو منبع اصلي خطاي بدون نمونه گيري، مشخص هستند كه مي تواند نمونه مضر را در بررسي هاي شامل جامعه بشري بر آورد كند.ارائه چنين پاسخهاي طفره آميز هنگاميكه پاسخ دهندگان در باره موضوعات گيج كننده يا حساس پرسش مي شوند بسيار متداول تر است.

وارنر ] 9[ يك روش مصاحبه اي براي كاهش يا حذف اين زيان طراحي نمود. او اين روش را پاسخ تصادفي ناميد، زيرا شركت كننده در تحقيق ، به سئوالي كه به طور تصادفي از يك يا چند سئوال انتخاب مي كند، پاسخ مي دهد و اين عمل را به طريقي انجام مي دهد كه مصاحبه كننده نمي داند كه به كدام سئوال پاسخ داده است .وارنر موردي را در نظر گرفت كه در آن يك نسبت p از جامعه ( فرض كنيد گروهA) چند خصوصيت حساس داشتند، در حاليكه بقيه اي نسبت از جامعه آن خصوصيت حساس را نداشتند هدف بر آورد p بود. با كمك يك ابزار تصادفي، پاسخ دهنده ها به طور تصادفي يكي از عبارات زير را انتخاب مي كند.

(من عضوي از گروه A هستم)

( من عضوي از گروه A نيستم)

وپاسخ بله يا خير به هر كدام از دو عبارتي كه انتخاب مي شود، مي دهد.مصاحبه كننده ها نمي داند كه پاسخ، به كدام سئوال اشاره مي كند، در حقيقت، براي حفظ حريم شخصي پاسخ دهنده، او نبايد تمايل به دانستن داشته باشد.

مزيتي كه بر روش پاسخ تصادفي حاكم است، اين است كه از آنجايي كه پاسخ دهنده مي تواند بدون آشكار ساختن موقعيت شخصي خود به سئوال پاسخ دهد، اضطراب و بد نامي بالقوه حذف شده است: و در اين فرايند، يك دليل براي امتناع ورزيدن از پاسخ يا يك پاسخ غلط از بين رفته است. اگر پاسخ دهندگان كاملا مطمئن باشند كه اصلاً نيازي به پنهان كردن واقعيت وجود ندارد. اين امر به همكاري پاسخ دهنده و اعتبار پاسخ هاي او بهبود خواهد بخشيد.

آبول- الا[2][3[ مدل وارنر را به مورد سه حالتي طراحتي شده بسط داد تا نسبت هايي از سه رابطه و گروه هاي منحصراً دو طرفه را بر آورد كنند كه يك يا دو از آن ها داراي يك خصوصيت حساس بودند.اين مدل براي بر آورد هر نسبت j (j>3) ، زماني كه تمام خصوصيت هاي گروه
 
j منحصرا دو طرفه بوده و حداقل يك و حداكثر j-1 تا از آنها حساس هستند، بيشتر گسترش يافت.دليل اين بسط فراهم كردن نظريه اي براي موقعيت چند گانه اي است كه اغلب يافت مي شود و شايد كمي واقع گرايانه تر از دو حالتي بودن باشد.

توسعه اخير ديگر در روش پاسخ تصادفي ، مدل سئوال نامرتبط است. روش وارنر دو سئوال يا عبارت را در نظر مي گيرد كه هر دو به خصوصيت حساسي مرتبط مي باشند.روش نامرتبط حالتي بود كه اطمينان از پاسخ ها با توجه به مجهول بودن روش، در صورتي كه دو سئوال نامرتبط استفاده مي شد، افزايش پيدا مي كرد، كه يكي از سئوالها مربوط به خصوصيت حساس و ديگري مربوط به خصوصيت  غير حساس بود.

آبول الا اين مدل را در ] 2[ توصيف كرد، هورويتز ] 7[ بيشتر روي آن كاركرد و نتايج دو تحقيقي را كه از دو سئوال نامرتبط استفاده كردند، ارائه داد.گرين برگ ] 4[ در مورد جنبه هاي نظري روش سئوال نامرتبط تحقيق كرد و آن را با مدل اصلي وارنر مقايسه كرد.آنها نتيجه گرفتند كه روش سئوال نا مرتبط نسبت به مدل اصلي كارآمدتر بود و آن را براي استفاده عمومي معرفي كردند.انشعابات ديگر روش پاسخ تصادفي رايج توسط محققان و ديگران آورده شده است مانند دو امتحان در هر پاسخ ]6[ و داشتن سئوال غير حساس كه با ابزار تصادفي كننده ساخته مي شود[5[ .

يكي از ابزارها مانند وسيله زير، يك توپ قرمز را از جعبه اي كه حاوي توپ هاي قرمز، سفيد، و آبي است انتخاب مي شود ، با امتحان P1 كه اين سئوال حساس نياز دارد كه پاسخ داده شود انتخاب مي كنيم.انتخاب يك توپ سفيد يا آبي كه به ترتيب با احتمالات P2 وP3 انتخاب مي شوند، به دستور العملي براي پاسخ دادن با بله يا خير اشاره دارند.بنابر اين، سئوالي كه نامرتبط ناميده مي شود. هم اكنون مقدار مورد انتظار معلومي دارد ، كه pY نام دارد و برابر است با ( P3+ P2)/ P2

تا كنون عملا همه تحقيقات درباره پاسخ تصادفي با تصحيح روش مورد استفاده با سئوالاتي در زمينه كيفي كه فقط به پاسخ بله يا خير نياز دارند فعاليت كرده اند.نيازي نيست اين روش فقط به داه هاي مقياس اسمي محدود شوند اين روش كاربرد وسيعي در زمينه پاسخ كمي داردو تحقيق به سمت استفاده اين روش هدايت مي شود.

هدف اين مقاله ارائه نتايج از قبيل تلاش در به دست آوردن داده هاي كمي روي يك موضوع بسيار حساس ( شكست) و روش موضوعاتي كه بايد به طور متوسط حساس تلقي مي شود( در آمدهاي رئيس خانواده) مي باشد تاكيد روي مشتق روش هاي بر آورد مربوط به ميانگين و واريانس توزيع مي باشد. داده هاي كه در تحقيق شكست كاروليناي شمالي گرد آوري شد، در [1] توصيف شده و به طور خلاصه در اين جا مرور شده است.

جمع آوري داده ها

مطالعه سقط جنين در كاروليناي شمالي به منظور بر آورد سرعتهاي شكست اجباري در يك منطقه شهري ، روش پاسخ تصادفي را به صورت وسايل جمع آوري اطلاعات روي موضوعات حساس ، تنظيم و ارزيابي مي كند. چهار نمونه احتمال از زنان بزرگسال از پنج منطقه مر كزي از كاروليناي شمالي انتخاب شدند. جمعيت اين شهرها از 000/100 تا 000/250 نفر متفاوت بود.

هر نمونه براي يك هدف ويژه اي انتخاب شدند. هر دو نمونه سن و تعداد پاسخ دهندگان ميان نمونه ها بر اساس اين هدف كه براي كدام نمونه انتخاب شده بودند فرق مي‌كرد. دو تا از چهار نمونه براي به دست آوردن داده هاي كمي روي سقط و در آمد استفاده مي شد. ابزار پاسخ تصادفي، يك جعبه مهره دار  روشن پلاستيكي  بود كه تقريباً چهار اينچ طول، سه اينچ عرض و يك اينچ عمق داشت.

ابزاري كه در امتحان سقط جنين استفاده مي شود دو سئوال داست كه روي سرپوش جعبه چاپ شده بود :

 1)شما در طول دوران زندگي خود متحمل چند سقط شديد؟

2) اگر زني مجبور باشد تمام مدت براي امرار معاش كار كند، شما فكر مي كنيد او بايد چند فرزند داشته باشد؟

 اولين سوال توپ قرمز كوچكي داشت و سئوال دوم توپ آبي داشت كه در مكاني كه به وسيله شماره ها (1)و (2) در سئوالاتي كه فهرست شدند درگير شده بود متصل شدند.

از پاسخ دهنده خواسته شد تا جعبه را با حركت آزادانه توپ در سراسر آن تكان دهد و جعبه را كج كند بطوريكه يكي از توپها بالا رود و در روزنه اي كه براي پاسخ دهنده قابل رؤيت بود ظاهر شود. رنگ توپي كه در پنجره ظاهر مي شد مشخص مي كرد كه پاسخ دهنده به كدام يك از دو سئوال پاسخ مي دهد. اگر توپ قرمز ظاهر شود، او به سئوالي كه در جلوي آن توپ قرمز قرار داشت (شكست) جواب مي داد، اگر توپ آبي ظاهر مي شد، او به سئوالي كه توپ آبي در جلوي آن  قرارمي گرفت( تعداد فرزندان) پاسخ مي داد. مصاحبه كننده در فاصله دور تري از پاسخ دهنده بود و البته نمي دانست كه كدام سئوال توسط ابزار تصادفي انتخاب شده است.

جواب پاسخ دهنده فقط يك عدد بود، بدون تعيين اينكه پاسخ، به كدام سئوال اشاره مي كند. براي جلوگيري از مشخص شدن سئوال، جعبه دوباره قبل از باز گرداندن آن به مصاحبه كننده ها تكان داده مي شد دو نمونه مستقل رده بندي شده از زنان 31 ساله يا بزرگتر از جامعه طراحي شدند. اندازه كلي نمونه به طور مطلوب به دو نمونه اي كه در] 4  [بحث شد، براي توليد بر آورد كمترين واريانس پارامترها نسبت به آنهايي كه كه در اينجا مد نظر قرار گرفته اند، اختصاص داده شد. اندازه هاي دو نمونه n1 وn2 ، به ترتيب 623و 287 بودند روش استفاده شده در امتحان براي در آمد به دست آمده براي آنچه كه براي مطالعه سقط جنين توصيف شد، يكسان بود.

پاسخ دهندگان، همان گروه زناني كه به مجموعه سئوالات سقط پاسخ مي دادند، نبودند آنان يك نمونه مستقل از 1628 زن 18 ساله يا بيشتر از مناطق مر كزي شهري ، با اندازه نمونه n1 وn2 كه به ترتيب برابر با 1040 و 588 بودند، معرفي كردند سئوالات در آمد به ترتيب زير بود:

1)      رئيس خانواده سال گذشته در حدود چند دلار پول به دست آورد؟

2)   شما فكر مي كنيد رئيس خانواده به طور متوسط در يك سال در حدود چند دلار پول به دست مي آورد؟ (پاسخ به اين سئوالات مجموع پول بود.)

مدل پاسخ تصادفي كمي

در مدل كمي كه از دو سئوال استفاده مي كنند، توزيع كلي پاسخها از جوابهاي عددي به هر دو سئوال تشكيل مي شود كه پاسخها براي سئوالات متفاوت هستند.

بنابر اين، اين توزيع، مخلوطي از دو توزيع خالص مي باشد كه بايد از نظر آماري به فراهم كردن بر آوردهاي معنا دار از پارامترهاي مطلوب بدست آوردن ميانگين جامعه از هر دو توضيح حساس و غير حساس به ترتيب و واريانس هاي تقسيم شود.

فرض مي كنيم دو نمونه مستقل با اندازه نمونه n1 و n2 در اختيار داريم خواهيم داشت:

Pi = احتمال اينكه سئوال حساس به وسيله پاسخ دهنده در نمونه P1¹P2. ،) 2و1 =i )  i انتخاب شود.

Pi 1- = احتمال اينكه سئوال غير حساس به وسيله پاسخ دهنده در نمونه 2) و 1 =i )  i انتخاب شود.

Zij = پاسخ از فرد j ام در نمونه i     ( ni ……و 2و1 = j و 2و1 = i  )

( z ) f = احتمال عملي كه با سئوال غير حساس انجام شود

g (Z)  = احتمال عملي كه به سوال غير حساس انجام مي شود و شبيه (z ) f با توجه به دامنه پاسخ مي باشند

   بر آورد ميانگين نمونه توزيع حساس

 بر آورد ميانگين نمونه توزيع غير حساس

احتمال عمل هر فرد در يك نمونه به ترتيب زير است.

نمونه1:           ، (Z1 )g(p1 -1) +( Z1)P1f =(z1 ) Y1

            ( 1-3 )            نمونه2:   . ) Z2) g (P2 1 ) + (Z2 ) f P2 = (Z2 ) Y2

پس

(2-3 )                                

در حاليكه                                                                                        

 

            با جايگزيني  ،  ميانگين هاي نمونه اي محاسبه شده دو نمونه به جاي  ، بر آوردهاي نا اريبي از  به دست مي آيد.

(3-3 )

 

با داشتن واريانس

(4-3)
در حاليكه                                                                     

مي دهد:

(3-5)

بر آورد كننده هاي (3-3) ارزش ساده شدن براي ساده شدن براي محاسبات داده‌هاي نمونه نااريب  و توزيع آزاد را دارد كه آنها ميانگينهاي نمونه را كه مهم نيست طبيعت به خصوصf (z) و g(z) چه باشد، را به كار مي گيرند. واريانس بر آورد كننده ها مي توانند به راحتي با استفاده از واريانس نمونه Si2 در ( 4-3) بر آورد شوند.                                                

براي اندازه هاي بزرگتر نمونه، فرد مي تواند به وسيله به كار بردن اعتدال متناسب (3-3) فاصله هاي اطمينان تقريبي را براي  به دست آورد.

همان طور كه به وسيله وارنر در [10] پيشنهاد شد، اين مدل مي تواند به صورت رگر‌سيوني رفتار كند و بر آورد كمترين مربعات را بكار گيرد. با در نظر گرفتن (1-3) و
 (2-3) ما مدل
   را خواهيم داشت كه

وقتي E(U) بر دار صفر و ماتريس واريانس V از U ماتريس خط مورب باشد كه
 
V( Z1) را براي اولين عنصر n1 در طول خط مورب و (2 Z)V را براي عناصر بعدي 2n در طول خط مورب دارد. بنابر اين كمترين مربعات بر آورد كننده  بصورت زير خواهد بود.

كه دقيقا بوسيله (3-3) ارائه شده است.

بتابر اين براي (2p و1p) ثابت، (3-3) مجموعه اي از بر آورد كننده هاي خطي نا‌اريب با كمترين واريانس از  مي باشد. انتظار نمي رود كه بر آورد كننده ها تاثير بالايي متناسب با كمترين واريانس در طبقه عمومي از بر آورد كننده هاي نااريب داشته باشند، اما در موقعيت هاي متداولي كه اندازه هاي نمونه بسيار بزرگ است اين موضوع زياد جدي نيست. اولين انتخاب واضح براي بر آورد كننده، ماكسيسم احتمال بر آورد كننده(MLE) است ، اما در حال حاضر راه حل معاملات MLE كار بسيار پيچيده اي است از
 (1-3) در مي يابيم كه احتمال
L عبارت است از

(3-6 )                                                                   

اگر ما MLE دو ميانگين را تنها بر اساس يك نمونه ساده جستجو كنيم، حل معادلات MLE  باز هم مشكل است ما اين نكته را هم به ذهن مي سپاريم  كه ويژگي كمترين واريانس MLE يك ويژگي متناسب است و مربوط به واريانس در توزيع طبيعي ، محدود كنندهMLE مي باشد.       و به طور كلي به توالي واريانس براي اندازه هاي بزرگتر نمونه ارتباطي ندارد. بعضي از محققان تاثير (3.3) را به كمترين حد كرامر- رائو روي واريانس يك برآورد كننده نااريب mA نسب داده اند. در مورد اين مطالب در ضميمه بحث شده است.

طرح تحقيقاتي

 طرح اوليه بررسي پاسخ تصادفي از سؤالات كمّي استفاده مي كند كه نياز به انتخاب مناسب از P2,P1 انتخاب درست از يك سوال غير حساس Y و تقسيم مناسي اندازه  نمونه كلي به n2,n1 دارد.

1-4) انتخاب معيار P2,P1

            معيار انتخاب مناسب از احتمالاتي كه با توزيع توپها بطور تصادفي وجود دارد، و در جمع آوري داده هاي كمّي انتخاب مي شود به آن دسته اطلاعاتي كه به وسيله گرين برگ (4) در مطالعه سوالاتي كه يك پاسخ غلط را استنباط مي كنند بسيار شبيه مي باشد.

            آزمايش برآوردها براي  در معادلات (3-3) نشان مي دهد كه اگر مخرج كسرها بسيار نزديك به صفر باشد، مقادير بالاي بي معنايي به دست مي آيد. همان طور كه در (4) اشاره شد، يك قانون خوب براي فرار از اين مشكل انتخاب P1+P2=1  مي باشد بعد از انتخاب P1 بسيار كمتر از 5/0 همانطوري كه عملي است و بدون ايجاد اين گمان در پاسخ دهنده كه روش ابزار تصادفي كننده در مدل سوال، به خصوصي بسيار فرق كرده است.

            تجربه نشان داده است كه نتايج رضايت بخشي مي توانند با انتخاب P1 بين 70/0 و 80/0 يا متمم آنها به دست آيد. اگر مدت min كردن مقدار   در معادله (4-3) بعد از ثابت كردن  P1 باشد نتيجه اي مشابه در حدود انتخاب P2 به دست مي آيد. عبارت   شبيه عبارت دو جمله اي است.

            نمودار واريانس كه در مقابل P2 رسم شده است در مقايسه P1. اغراق آميز است به ازاي P1 ثابت، همانطور كه P2 به P1 مي رسد واريانس افزايش و با افزايش ½P2-P1½ واريانس كاهش مي يابد. بنابراين، اگر عملا  P1 نزديك به صفر يا يك انتخاب كنيم P2=1-P1 انتخاب مي شود با انتخاب P2=1-P1 مقدار   به كمترين مقدار خود نمي رسد. براي نمونه اگر P1>0.5 باشد  min محاسبه در P2=0  اتفاق مي افتد و بر اين امر دلالت دارد كه نمونه دوم بايد فقط براي برآورد my استفاده شود، اگر چنين روشي منجر به توليد نتايج ناسازگار در بر آورد mA نشود  روش انتخاب واضح است. اگر مدركي وجود داشته باشد كه نمونه دوم مي تواند با P2=0 استفاده شود. نويسندگان معتقدند كه يك روش محافظه كارانه با داشتن P1+P2=1 هنوز هم ارزش دارد. در آن روش ابزار تصادفي تمايل دارد تا هر دو نمونه را به روش يكساني تحت تاثير قرار دهد زيرا نسبت توپهاي قرمز به آبي در ابزار دوم شبيه نسبت آبي به قرمز در ابزار اول است. تاثير انتخاب P2,P1 در ضميمه قابل مشاهده است.

2-4) انتخاب ويژگيهاي غير حساس

            مبناي اساسي اين است كه سوالات غير حساس همانند سوال حساس در واحدهاي يكساني از اندازه نوشته شوند به طور مثال، پوند، اينچ يا تعداد دفعاتي كه يك اتفاق روي داده است از يك نقطه نظر، فرد ممكن است اين طور فكر كند كه ميزان احتمال عملكرد پاسخ به دو سوال بايد شامل هيچ كليتي نباشد و پارامترهاي موقعيتي آنها بايد دور از هم باشد.

            براي مثال، اگر سوال حساس در اعدادي با ميانگين حدود 50 سنت قابل پاسخ دادن بودند و پرس و جوي غير حساس پاسخهايي با ميانگين حدود 500 دلار داشت، فرد ممكن است اين طور تصور كند كه اين امر مطلوب و ايده آل است زيرا پاسخ فرد حتي نياز به فرمولهاي برآورد هم نخواهد داشت اين امر، خود فرد را گول مي زند زيرا هنگامي كه پاسخ به طور خودكار طبقه بندي يا مشخص شود پاسخ دهنده تمايلي به همكاري ندارد.

            به علاوه، طبقه بندي بر مبناي يك پاسخ شخصي معين، انجام نشده بلكه بر مبناي گروهايي كه از روش هايي برآورد كه در معادلات (3-3) نشان داده شد انجام مي شود. نهايتا، همان طور كه (4-3) و (5-3) نشان مي دهند، براي هر مقدار ثابتي  از واريانسهاي برآورد كننده ها همان طور كه  زياد مي‌شود، افزايش مي يابد.

 هر بار كه P2,P1 طبق معيار پيش بيني گروه فرعي، انتخاب مي‌شوند، ساير پارامترها ، هستند. انتخابي كه شامل  باشد وجود ندارد زيرا اينها به وسيله طبيعت خصوصيت حساس، ثابت هستند براي هر مقدار ثابت (n1,n2) واريانس برآورد كننده ها با كاهش  کم مي شود. بنابراين راهنماي مهم در انتخاب سوال غير حساس اين نيست كه سوال غير حساس از سوال حساس در معنا چقد متفاوت است، بلكه اين است كه چقدر يكنواخت است يا پاسخها چقدر مي توانند يكسان باشند. بديهي است، يك انتخاب صحيح مي تواند انتخاب يك سوال غير حساس مانند my نزديك به mA با كمترين واريانس است. با اين وجود اگر  به طور قابل ملاحظه اي كمتر از  باشد، در همكاري روي بخشي از پاسخ دهندگان، نقصان به وجود مي آيد پاسخ دهندگان در هر پايانه اي از توزيع A تمايل خواهند داشت، پاسخ دهندگان A باشند واين امر براي پاسخ دهندگاني كه داراي آگاهي بيشتري مي باشند، بيشتر بارز و مشهود است. آنان احتمالا پاسخي غلط يا غير واقعي مي دهند تا پاسخي دقيق و درست، تا سوال آنهايي را كه پاسخ دادند مشخص سازد  به همين دليل يا پيشنهاد كرديم كه  حد باشد همان طور كه  حد است و يك ضريب اطمينان هم بر اساس n2,n1 براي كاهش واريانس قرار داده شود.

3-4) تقسيم n2,n1

            تقسيم فرعي بهينه اندازه نمونه كلي به دو گروه مي تواند بر اساس اصل
كاهش
 باشد اين امر به صورت زير انجام مي شود.

 

 

 


كه  و حدسهاي مقدماتي از مقادير آنها براي
محاسبه
 استفاده مي شود. ما اين امر را مرهون قانوني براي درك اين مطلب مي باشيم كه در بسياري از موقعيتها تقريب درست و قابل قبول براي (1-4) به صورت زير است:

¢(1-4)                                             

            اين امر از اين واقعيت تبعيت مي كند كه هنگامي كه انتخاب P1+P2=1 , P2,P1 را بر آورد مي كند.  همان طور كه در بخش (1-4) و ¢(1-4) پيشنهاد شده مي توان به صورت زير دوباره نويسي كرد.

            كه نشان مي دهد هنگامي كه ، فرمول ¢(1-4) دقيق است و به
 ازاي
 متفاوت، مقدار تقريبي است اما هنگامي كه انتخاب سوال حساس 2 مناسب باشد يك تقريب منطقي براي آن وجود خواهد داشت.

            از آنجايي كه براي تعيين n1/n2 به وسيله عبارت دقيق (1-4) ما بايد مقدار پارامترهاي جامعه f2,f1 را حدس بزنيم، منطقي است فرض كنيم كه كل فرمول ¢(1-4) مي تواند بهترين مقدار تقريبي را ارائه دهد. (1-4)

4-4) وقتي كه (my,sy) معلوم هستند.

            هنگامي كه پاسخهاي دو جمله اي را مطالعه مي كنيم اين مطلب درست است وقتي كه مقدار (my ,sy) براي سوال طبيعي به طور گسترده معلوم است تحقيقات مي تواند به طور موثرتري ظاهر شود. در به كار بردن اين اصل براي پاسخهاي كمّي، سوال دوم، ممكن است تعداد افرادي باشد كه در يك خانه زندگي مي كنند. در حالي كه متوسط اندازه خانواده از طريق بعضي سرشماري يا ساير منابع معلوم است، هنگامي كه مقدار (my ,sy) معلوم است، نيازي به دو نمونه نيست.mA و واريانس آن هنگامي كه (my ,sy) معلوم هستند، به صورت زير ارائه مي شود.

            در اين دو نوع جمله اي، كاهش بسيار چشمگيري در واريانس پارامترهاي mA هنگامي كه (my ,sy)شناخته شده هستند وجود دارد.

5. مثال هاي عددي

1-5) سقط جنين و تعداد فرزندان

            داده هايي از بررسي سقط جنين در كاروليناي شمالي براي تشريح روشهاي برآورد استفاده مي شود. اين بررسي طراحي شده بود، تا ميانگين تعداد سقط ها ((mA در زندگي يك فرد و ميانگين تعداد فرزنداني ((my كه يك زن اگر مجبور باشد تمام مدت براي امرار‌معاش كار كند فكر مي كند بايد داشته باشد را برآورد مي كند كه بوسيله رقابت طبقه بندي مي‌شوند.

            واريانسهاي برآورد شده از همه چهار بر آورد نيز طراحي شده بودند. در اين تحقيق احتمال P سؤال حساس كه بوسيله پاسخ دهنده انتخاب شده بود (سقط جنين) نسبت توپهاي قرمز به كل توپها در جعبه پلاستيكي در نمونه اول 7/0 و در نمونه دوم 3/0 بود. توزيعهاي پاسخها براي هر نمونه، بوسيله رنگ، در جدول 10 نشان داده شده است كه به وسيله برآوردهاي پارامترها در جدول (1- ب) دنبال مي شود.

            مطالعه واريانسهايي كه نشان داده شده اند تحت فرض طرح نمونه تصادفي ساده محاسبه شده است، واضح است كه مقادير برآورده شده mA و my به وسيله رنگ منطقي به نظر مي رسد.  براي مثال مطالعه نتايج در اين زمينه به وسيله آبرناتي [1] نشان داد كه سقط در ميان زنان غير سفيد پوست بيشتر متداول بود. همچنين از مشاهده مقادير Z واضح است كه به نظر نمي رسد آنان نمون اي از تركيب خطي دو توزيع باشند كه تابع چگالي احتمال يكساني دارند.

            تجاوز از مقدار 0 و 2 مي تواند چند گروهبندي ويژه اي را توسط پاسخ دهندگان پيشنهاد كند اگر صحيح باشد. كار بيشتر در تحليل صحيح تحقيق انجام خواهد شد.

2-5) درآمد

جدول 1-الف: بررسي پاسخ به سوالات سقط توسط رنگ و نمونه در كاروليناي شمالي در سال 1968

تعداد پاسخ ها

مقدار Z

نمونه دوم

نمونه اول

غیر سفید

سفید

سفید

سفید

56

114

130

304

0

8

10

22

14

1

17

30

39

56

2

2

6

9

10

3

5

1

8

7

4

2

1

-

2

5

1

-

-

-

6

9

25

9

13

ناشناخته

100

187

217

406

کل

923/0

599/0

764/0

494/0

(شامل ناشناخته ها)

 

 

 

 

 

 


جدول 1b: بررسي برآورده  هاي ميانگين و انحراف معيار از مجموعه سوالات سقط، توسط رنگ در كاروليناي شمالي در سال 1968

 

 

 

            برآوردهاي ميانگين درآمد سرپرست خانواده ها به روش مشابهي محاسبه شدند، در اين آزمايش احتمال اينكه پاسخ دهنده اولين سوال را در نمونه اول انتخاب كند 64/0 و احتمال اينكه در نمونه دو انتخاب كند 36/0 بود. ميانگين درآمد سرپرست اين
خانواده
            و ميانگين درآمد سرپرست يك خانواده در حد شما            در جدول 2 با مولفه رنگ نشان داده شده است.

            فرض مي شود كه واريانسهاي برآورد شده يك نمونه تصادفي ساده طراحي  نيز ارائه مي دهند، اين برآوردهاي درآمد نيز بخصوص  براي جامعه تحت مطالعه، منطقي به نظر مي‌رسد، درآمدهاي غير سفيد پوستان، به طور قابل ملاحظه اي همانطور كه انتطار مي رفت كمتر از سفيد پوستان مي باشد. بعلاوه هر دو رقابت پايداري اقتصادي سرپرست خانواده در حد متوسط را به صورت ارجح تر به تصوير مي كشاند. البته اگر همانطور كه به نظر مي رسد پاسخ دهنده تمايل به ايجاد مقايسات درون گروهي (نژاد خود)داشته باشد. ممكن است اين امر مورد انتظار بوده باشد و در طبيعت بشري متداول تفسير شود. به نظر مي رسد كه سند قابل ملاحظه اي در نوشته ها روي بررسي هاي درآمد وجود داشته باشد كه پاسخ دهندگان به سوالات، تمايل به دانستن درآمد دارند.

            اگر درآمد سرپرست يك خانواده متوسط به نزديك شدن صحيح پاسخ دهنده تفسير شود نتايج شامل چنين پديده اي مي شود.

جدول 2) برآورد هاي ميانگين و انحراف معيار در مجموعه اي از سوالات توسط مولفه رنگ  در كاروليناي شمالي در سال 1968

 

 

 

            روش پاسخ تصادفي براي متغير پيوسته كه آيا واقعا اين روش، مقدار مورد نظر درآمد را كاهش مي دهد يا نه، نياز به مطالعه بيشتري دارد. پاسخ تصادفي نسبت رد پاسخ درآمد را كاهش مي دهد با اين وجود حدود كمتر از 3 درصد بود خوب است توجه كنيم كه كمتر از يك درصد، از پاسخ دادن به سوال مربوط به سقط، سرباز زدند.

6. خلاصه

            توسعه روش پاسخ تصادفي از زمان شروع آن به صورت يك روش تحقيقي براي كاهش پاسخ غلط در سوالات حساس براي نشان حالتي از مهارت به طور اريب، امتحان شد.

            تلاشهايي براي گسترش اين روش براي سوالاتي انجام شد كه پاسخهاي كمّي را نسبت به پاسخهاي كيفي استنطاق مي كرد.

            نظريه اي جهت گردآوري اطلاعات، كاربرد كمّي روش پاسخ تصادفي را مورد تاكيد قرار مي دهد كه براي هدفي در بررسي اخير سقط در كاروليناي شمالي ارائه مي شود. برآوردها و  واريانسهاي ميانگين سقط هاي يك جامعه شهري از زنان در طول زندگيشان بدست آمده و ميانگين درآمد سرپرست خانواده ها گزارش شده است.

ضميمه: (كارايي برآورد كنندگان)

درهر يك از پارامترها در (1-3) قرار دهيد.

A1                                 

 


به وسيله         متغير تصادفي                    به دست مي آيد. سپس در تطابق با (6-3) خواهيم داشت.

 

مقدار مورد انتظار هر دوره توليد صفر مي شود. اگر zij مستقل باشد داريم:

 


براي همه i,j ها

            از آنجايي كه z1j به طور مشابه مطابق با              توزيع شده و  z2j هم بطور يكسان مطابق با              توزيع شده است، داريم:

 

            بنابراين اگر        يك برآورد كننده ناريب q  ، باشد قانون كرامر- رائو مي دهد:

A2

 

            ما اثر نسبي E از يك برآورد كننده نااريب     از     را نسبتي از محدوديت         براي                 

             در نظر مي گيريم، ما در مورد اثر نسبي برآورد كننده         كه در (3-3) مشخص شد در مواردي كه g(z), f(z) هر دو داراي توزيع پواسون، نمايي يا نرمال باشند و اندازه هاي نمونه ها با هم برابر                              باشد را بررسي كرده ايم.

A.1 : توزيع هاي پواسون با پارامترهاي  

 


           

 

 


A3

 

 

 

 

 

 

            با استفاده از اين در(A2)ما قانون كرامر- رائو را به دست مي آوريم. براي
         به وسيله
(3.5) خواهيم داشت:

 


            كه با قرار دادن آن در فرمول(3.4)                دست مي آيد. جدول A1  نتايج را براي برخي مقادير انتخاب شده از             و                       با                          به‌ دست‌آورد.

(جدول  (A1اثر       در توزيع پواسون هنگامي كه               براي                   و ساير جفتهاي انتخابي    

 

 

 

 

 


2 .A: توزيعهاي نهايي با پارامتر هاي                        :

 

 

 


A4

 

 

اين نتيجه براي (A2)جهت ارائه قانون كرامر - رائو بكار ميرود.

براي          بوسيله (5-3) داريم:

 


A5

 

و با قرار دادن آن در (4-3)                  به دست مي ايد.

از (A5) , (A4)مشاهده مي كنيم كه براي اندازه هاي نمونه
مساوي،                     تاثير
E ، عملكرد (P1,P2) و پارامتر نسبت                 مي باشد. جدولA2 چند نتيجه را در اين مورد ارائه مي دهد.

جدول  (A2 تاثير        در توزيع نمايي براي مقادير انتخاب شده                زماني
كه
n1=n2

 

 

 

جدول (A3 تاثير       در توزيع نرمال به ازاي n1,n2 براي مقادير انتخاب شده                 و

 

 

 

 

 

 

 

A.3: توزيع نرمال با پارامتر هاي    

 


A6

 

 

 

 

 

 

 


كه

با بكار بردن(A6) براي (A2)قانون كرامر رائو بيان مي شود براي        به وسيله(3.5):

A7

 

به طوري كه           بهمان صورتي هستند كه در (A6) بودند با استفاده
 از
(A7) و (3.4) ،             را خواهيم داشت. وقتي كه اندازه دو نمونه يكسان باشند. تاثير نتايج به دست آمده از  عملكردي از (P1,P2) و پارامتر هاي              خواهند بود. جدول A3 مقادير ديگري را ارائه مي دهد.

(A4 چند تذكر عمومي:

آزمايش تاثير بر آورد ها در (3.3) در ارتباط با قانون كرامر- رائو با سه توزيع نرمال، نمايي و پواسون چند نكته در طراحي تحقيقات آينده ارائه مي دهد.

هر سه توزيع نشان مي دهند كه ماكسيمم، اثر زماني به دست مي آيد كه پارامتر گرايش به مركز و واريانس در خصوصيت غير حساس باشند  سطح واقعي تاثير %2/95 زماني بالاست كه  P2=0.9 يا P1باشد. اما اين مقادير بالا از  Pi  عملي نيستند.در محدوده‌اي كه مقادير Pi  بالاست، اما هنوز تمايل به قابل قبول بودن دارد، يعني در حدود 8/. و 2/. مي باشد، تاثير 78% است. تاثيري كه ما مد نظر قرار داده ايم متناسب با قانون كرامر- رائو مي باشد.

رفتار اين تاثير مربوطه در مورد حداكثر احتمال بر آورد كننده هايي كه از اندازه‌هاي نمونه محدود استفاده مي كنند براي فرد مجهول است.

در حالت دو جمله اي، آبول- الا(2) توضيح داد كه بر آورد كننده هاي (3-3) همان MLE مي باشند. و در تحقيق در اين مورد، مشابه قسمتهاي قبلي كه نشان داده شده اند . نتايج بسيار نزديكي داشته است.

 براي مثال، براي هرn1=n2 زماني كه  يا تاثير دقيقا مشابه  توزيع پواسون بالا و با              اثر داراي توزيع نمايي و با  و  داراي توزيع نرمال مي باشد.

براي هر كدام از مقادير جدول (P1,P2)  ، اثر  در واحد به تدريج تغيير
 مي كند تا يكي از
 دقيقا به 5/. برسد، در حالي كه ديگري دقيقا به 0 يا 1 ميرسد.

در حقيقت، در مورد دو جمله اي نيز در قسمتهاي فرعي A.1 و A.2 و A.3 . ساختار6 در    نشان مي دهد كه يك بر آورد كننده درست از که واريانس كرامر - رائو را بر آورد مي كند وجود ندارد. زيرا  در  نمي تواند شرايط لازم و كافي براي وجود چنين بر آورد كننده اي را فراهم كند،
يعني
 در  است. با فرض اينكه C مستقل از باشد البته ممكن است وابسته نيز باشند.  بنابر اين به عقيده ما از آنجايي كه بر آوردها به وسيله (3-3) بر آورد مي شوند. بر آورد هايي منطقي براي استفاده از كشف روشهاي موثر بيشتر براي بر آورد پارامتر ها در موقعيتهاي مي باشند كه شامل خصوصيتي هستند كه براي يك پاسخ دهنده حساس مي باشد.

 



[1] کارشناس ارشد آمار و عضو هیئت علمی دانشگاه علوم پزشکی گلستان

[2] Abul-Ela

+ نوشته شده در  دوشنبه سی ام آبان 1384ساعت 15:41  توسط انجمن علمی   | 

تجزیه و تحلیل میانگین درجه حرارت ماهانه

تجزیه و تحلیل میانگین درجه حرارت ماهانه

(مطالعه موردی شهرستان قائمشهر)

 

محمد رضا ربیعی[1]، محمد طالبی[2]، علی جعفرپور[3]

 

چکیده:

یکی از مهمترین تحقیقات آماری در زمینه هواشناسی بررسی تغییرات دما در یک ناحیه و در دوره ای خاص می باشد. نتایج این تحقیقات می تواند کمک بسزایی در برنامه ریزی  و تصمیم گیری  کشاورزان و مدیران  عرصه کشاورزی آن منطقه  داشته باشد.

میانگین درجه حرارت ماهانه هر منطقه یکی از مهمترین شاخصهای دمای آن منطقه است . سعی ما در این تحقیق  بر آن است که با بررسی میانگین درجه حرارت ماهانه شهرستان قائمشهر ، این شاخص را برای ماه های سالهای آتی پیش بینی کنیم.

داده های این تحقیق از سازمان هواشناسی استان مازندران جمع آوری شده است.این داده ها  شامل میانگین درجه حرارت ماهانه شهرستان قائمشهر  در یک دوره 24 ساله طی سالهای 1359 تا 1382 شمسی می باشد. تجزیه و تحلیل داده های بدست آمده با استفاده سری های زمانی و توسط  نرم افزار Minitab  انجام  شده است.

پس از تجزیه و تحلیل  سری میانگین درجه حرارت ماهانه این شهرستان این شاخص را برای24 ماه سال 1382و 1383 پيش بيني کرده ایم.

واژگان کلیدی:  میانگین درجه حرارت ماهانه، سری زمانی، Minitab.

 

1.   مقدمه

محیطی که در آن زندگی می کنیم، مجموعه ای از عوامل گوناگون از جمله پدیده های مربوط به وضعیتهای جوی و آثار اقلیمی است. برای تامین زندگی بهتر و تولید بیشتر در بخشهای مختلف بخصوص بخش کشاورزی که بسیار دستخوش تغییرات و رخدادهای جوی است باید به دانش هواشناسی و کاربرد آن توجه بیشتری داشت.

دما بعنوان شاخصی از شدت گرما یکی از عناصر مهم تاثیر گذار بر پدیده های جوی است . چنانکه مشهود است تغییرات دما تاثیر مستقیم بر زندگی روزمره بشر دارد و اختلال در این مقوله کار ها را دشوار می کند  و گاهی خسارتهای جبران ناپذیری نیز به بار می آورد. برای مثال کاهش دما در اوایل فصل بهار هر از چند گاه به باغهای میوه و مرکبات کشور خسارت وارد می کند و یا کاهش نزولات جوی در بسیاری از کشورها موجب خشکسالی  می گردد که استرالیا یک نمونه از این کشورهاست که اين چند سال اخیر با این مشکل دست به گریبان است .

برای ایمن ماندن از این وقایع و مقابله با آن واتخاذ تصمیمات اصولی برای مدیریت بحران و نیز آمادگی برای رویا رویی با اینگونه حوادث  چه باید کرد و چگونه می توان  از عواقب آن در امان باشیم ؟پیش بینی اینگونه حوادث برای آینده از طریق اطلاعاتی که در سالهای گذشته جمع آوری شده است می تواند کمک بسزایی در حل این مشکل باشد.

سری های زمانی یکی از شاخه های علم آمار است که برای پیش بینی آینده براساس آنچه در گذشته ثبت و ضبط گردیده است ،کاربرد فراوان دارد. سریهای زمانی برای درک، توصیف، کنترل و پیش بینی بهتر فرایند زیربنایی تحلیل می شوند و بدیهی است چنانچه وابستگی خاصی میان داده ها در طول زمان وجود داشته باشد، فرصت مناسبی پیش می آید که به کمک آن مشاهدات بتوان روند آینده پدیده ای را پیش بینی کرد.

اهمیت و کاربرد تحقیقات در زمینه هواشناسی ما را برآن داشت  تا  به تحلیل سری زمانی مربوط به میانگین درجه حرارت ماهانه  قائمشهر طی24 سال(1359 تا 1382) بپردازیم و در صورت امکان با اطلاعات موجود و با استفاده از ویژگی وابستگی بین داده ها، میانگین درجه حرارت ماهانه این شهرستان را در ماه های آتی پیش بینی کنیم.

2.  جمع آوري داده ها:

داده های این تحقیق که از پایگاه هواشناسی قراخیل شهرستان قائمشهر به سازمان هواشناسی استان مازندران واقع در شهرستان ساري مخابره شده، جمع آوری شده است. داده ها مربوط به میانگین درجه حرارت  ماهانه شهرستان قائمشهر می باشد که با استفاده از فرمول زیر محاسبه می گردد.

/2(ميانگين حداكثر دمای ماهانه[4]+ ميانگين حداقل دمای ماهانه[5]) = ميانگين درجه حرارت ماهانه

3-تحليل سري زماني مربوط به ميانگين درجه حرارت ماهانه

3.    1    تشخيص مولفه هاي روند و تغييرات فصلي

 اولين قدم در تحليل سري زماني رسم نمودار سري ميانگين درجه حرارت (Xt) در مقابل ماه هاي  سال (t ) مي باشد (نمودار 1). به نظر مي رسد كه واريانس مشاهدات با پيشرفت در ماه تغير نمي كند ولي وجود يك روند ضعيف رو به بالا در ميانگين سري مشاهده می شود بنابراين سري ميانگين درجه حرارت ماهانه يك سري ناماناي در روند مي باشد. همچنین طول دوره تغيرات فصلي ميانگين درجه حرارت ماهانه 12 مي باشد.


                                                                                 (نمودار 1)

همچنين در اين نمودار وجود تغيرات فصلي براي ميانگين درجه حرارت ماهانه ، را مي توان  تشخيص داد. اما مهمتر از همه تشخيص طول دوره تناوب تغيرات فصلي  براي ميانگين درجه حرارت ماهانه است ، كه از اين نمودار بنظر مي رسد كه طول دوره تغيرات فصلي ميانگين درجه حرارت ماهانه 12 مي باشد.

(نمودار2)

 

علاوه بر نمودار سري زماني مي توان بوسيله همبستگي نگار مشاهدات اوليه ، به وجود روند و تغيرات فصلي در سري  ميانگين درجه حرارت ماهانه نيز پي برد (نمودار 2). با توجه به این نمودار  وجود يك روند ضعيف در سري مشاهدات میانگین درجه حرارت ماهانه بار ديگر تاييد مي شود. همچنین مشاهدات سري زماني داراي اثر فصلي مي باشند، يعني میانگین درجه حرارت ماهانه بصورت سينوسي با طول دوره ي تناوب 12 ماه نوسان مي كند که اين ، نامانا بودن سري مربوط به ميانگين درجه حرارت، در اثر فصلي را تاييد مي كند.

3.    2    تجزيه سري ميانگين درجه حرارت ماهانه به مولفه هاي فصلي ، روند و تغييرات نا منظم

همانطور كه در بخش3. 1 نتيجه شد ،سري زماني مربوط به میانگین درجه حرارت ماهانه داراي سه مولفه روند (  )،تغييرات فصلي ( ) و تغييرات نامنظم ‌( ) مي باشد. در اين بخش اين سري زماني را به سه مولفه ي مذكور تجزيه كرده ايم .الگوي فصلي مناسب براي اين سري  يك الگوي كاملا جمعي است يعني ، زيرا اثرهاي فصلي با ميانگين افزايش پيدا نمي كند.

نمودار سري زماني واقعي به همراه سري زماني برازش داده شده و نيز خط روند برازش داده شده ، در نمودار(3) نمايش داده شده است.


 (نمودار 3)

 

 چهار شكل موجود در نمودار (4) تجزيه سري به مولفه ها را تحت يك مدل جمعي[6] نشان مي دهد كه عبارتند از : نمودار سري میانگین درجه حرارت ماهانه[7] ، نمودارسري مشاهدات بدون مولفه روند[8]، نمودار مقادير تعديل شده نسبت به مولفه فصلي[9] و نمودار سري بدون روند و نيز تعديل شده نسبت به مولفه فصلي ( باقیمانده ها)[10] ، مي باشد.

 


نمودار(4)

. همچنين در مجموعه نمودار هاي(5) به ترتيب نمودارهای زیر رسم شده اند:

 نمودار شاخص هاي فصلي[11] : همان طور كه اين نمودار نشان مي دهد، اثر فصلي ماه های اردیبهشت، خرداد، تیر، مرداد ، شهریور و مهر بر میانگین درجه حرارت ماهانه يك اثر مثبت است. برعكس اثر ماه هاي آبان، آذر، دي، بهمن، اسفند و فروردین  بر میانگین درجه حرارت ماهانه يك اثر فصلي منفی است. از مقدار شاخص هاي به دست آمده در مي يابيم كه بزرگترين اثر فصلي منفي بر میانگین درجه حرارت ماهانه بهمن  ماه مي باشد كه برابر « »درصد متوسط میانگین درجه حرارت  ماهانه در تمام سال مي باشد. همچنين بزرگترين اثر فصلي مثبت بر میانگین درجه حرارت  در مرداد ماه رخ مي دهد كه برابر « » درصد میانگین درجه حرارت ماهانه در تمام سال است. با توجه به مقدار شاخص ها مي بينيم كه مجموع آنها در يك دوره 12 ماهه برابر صفراست.

Seasonal Indices

 

Period    Index

 

1      -3.20208

2       1.73125

3       6.31042

4       8.61042

5       9.78542

6       7.88542

 

Seasonal Indices

 

Period    Index

 

7       3.06042

8      -1.67708

9      -6.15625

10      -8.80625

11      -9.66250

12      -7.87917

 

 

 


                  

 

 

 

نمودار جعبه اي براي سري بدون روند[12]: اين نمودار نشان دهنده چگونگي توزيع سري ميانگين درجه حرارت ( ) در ماه هاي مختلف يك سال مي باشد.

نمودار جعبه اي براي باقيمانده ها (تغييرات نامنظم)[13] : چگونگي توزيع باقيمانده هاي مربوط به سري ميانگين درجه حرارت ( ) را در هر يك از 12 ماه سال به وسيله نمودار جعبه اي نشان مي دهد.


نمودار درصد پراكندگي میانگین درجه حرارت براي پريود فصلي[14] : اين نمودار نشان دهنده درصد تغييرات سري در هر ماه از يك سال مي باشد. اين نمودار نيز بيشترين درصد پراكندگي براي ميانگين درجه حرارت ماهانه را در ماه مهر و كمترين آن در تيرماه  ، نشان مي دهد.

نمودار(5)

3.    3    حذف تغيرات فصلي و روند از سري ميانگين درجه حرارت

الف) حذف اثر فصلي از سري  نمودار سري زماني اين مشاهدات تفاضلي شده با تاخير 12  همراه با يك خط روند برازش داده شده، در نمودار (6) رسم شده است. با حذف مولفه فصلي از سري، اين مشاهدات تنها دارا ي دو مولفه روند در ميانگين و تغيرات نامنظم مي باشند .


(نمودار6)

مدل روند خطي Yt = -0.16 +0.00099*t كه به روش كمترين مربعات به اين سري از مشاهدات برازش داده شده بيانگر وجود يك روند ضعيف روبه بالا در ميانگين درجه حرارت  ماهانه مي باشد. دليل برازش يك مدل خطي به اين سري از مشاهدات را مي توان مناسب بودن اين مدل با توجه به نمودار سري زماني آنها دانست. البته مي توان از معيارهای درستي[15] MAPE و MAD و MSD نيز براي مشخص كردن صحت برازش استفاده كرد.

ب) حذف روند در ميانگين سري

با يك بار تفاضلي كردن با تاخير يك از سري بدون تغيرات فصلي مربوط به ميانگين درجه حرارت به سري اي دست مي يابيم كه معادله ي خط روند برازش شده به آن  Yt = 0.0125 + 0.000025*tمي باشد .ضريب زاويه ي اين خط بيانگر حذف مولفه ي روند در ميانگين از سري مذكور ، تاحدود زيادي مي باشد.(نمودار 7)


(نمودار 7)

 

انجام تفاضلي با تاخير يك براي بار دوم باعث به وجود آمدن روندي قوي تر در سري مي گردد، و اين چيزي است كه از معادله ي خط روندYt = -0.016 + 0.000094*t  در مي يابيم. اين خط به سري حاصل از تفاضلي دوم با تاخير يك برازش داده شده است.(نمودار 8)   


(نمودار 8)

بنابراين يك بار تفاضلي كردن با تاخير يك تا حد امكان مولفه ي روند را از سري فاقد تغيرات فصلي مربوط به ميانگين درجه حرارت ، حذف مي كند. در نهايت سري اي كه باقي مي ماند ، يك سري ايستا است كه تنها داراي مولفه ي تغيرات نامنظم مي باشد.(نمودار 8)


3. 4      برازش مدل كليARIMA به سري میانگين درجه حرارت ماهانه

همان طور كه مشاهده شد، سري زماني مربوط به ميانگين درجه حرارت ماهانه در شهرستان قائمشهر، يك سري ناماناي در روند و اثر فصلي مي باشد، لذا براي پيش بيني درجه حرارت در ماه هاي آتي بايد يك الگوي فصلي كليARIMA(p[16],d[17],q[18],P[19],D[20],Q[21]) را برازش داد.

براي برازش يك مدل فصلي مناسب ARIMA بايد شش پارامتر p,d,q,P,D,Q مدل را به طور مناسب انتخاب كنيم.

الف) تعيين مرتبه ميانگين متحرك فصلي و غير فصلي (Qوq)

 با توجه به مقادیر آماره t  و نمودار تابع خود همبستگی  سری اي كه تنها داراي مولفه تغييرات نامنظم است (سري باقیمانده ها)، مشاهده می کنیم که فرض صفر بودن  را برای   را  نمی توان رد کرد و این چیزی است که با بیرون افتادن مقدار خود همبستگی برای تاخیر های 1و2، از حدود اطمینان در نمودار تابع خود همبستگی سری باقیمانده ها تایید  می شود. بنابراین با توجه به ویژگی تابع خود همبستگی سری میانگین متحرک می توان q را 2 برآورد کرد. اما برای برآورد مرتبه میانگین متحرک فصلی (Q) کافی است فرض  را در تاخیر های  مورد آزمون قرار دهیم بنابر نمودار تابع خود همبستگی تنها دو مقدار  خارج از حدود اطمینان می باشند و به ازای دیگر تاخیر ها ( که مضربی از 12 هستند ) داخل حدود اطمینان قرار می گیرند . بنابر این مرتبه میانگین متحرک فصلی، یعنی Q را 2  برآورد می کنیم.(نمودار 9)


نمودار(9)

ب) تعیین مرتبه اتو رگرسیو فصلی و غیر فصلی(P,p)

در نمودار(10) مقادیر آماره  tو  برای هر یک از تاخیرها ، همچنین نمودار تابع خود همبستگی جزئی نمونه برای سری باقیمانده ها داده شده است. با توجه به این نمودار فرض   را براي سه تاخير  اول رد می كنيم ،اما  بدليل واقع شدن چند مقدار خود همبستگي جزئي بعدي در حدود اطمينان نمي توان فرض صفر بودن آنها را رد كرد . بنابراین مرتبه اتورگرسیو غیر فصلی را 3 برآورد می کنیم . همچنین با بررسی مقادیر خود همبستگی جزئی نمونه برای  در نمودار PACF ، به دلیل خارج افتادن  و   از حدود اطمینان ، مرتبه اتورگرسیو فصلی را 2 برآورد می کنیم.


نمودار(10)

بنابر آنچه که حاصل شد مدل پیشنهادی برای سری اولیه ي ميانگين درجه حرارت ماهانه ARIMA(3,1,2;2,1,2) می باشد.(خروجي 1)

Model: Mean Air Temperature (c)

 

ARIMA model for Mean Air Temperature (c)

 

Final Estimates of Parameters

Type          Coef     SE Coef         T        P

AR   1     -0.7105      0.0695    -10.22    0.000

AR   2      0.1748      0.0816      2.14    0.033

AR   3     -0.0321      0.0668     -0.48    0.631

SAR 12     -0.6679      0.7775     -0.86    0.391

SAR 24     -0.0461      0.0790     -0.58    0.560

MA   1     -0.0234      0.0381     -0.61    0.539

MA   2      0.9353      0.0256     36.50    0.000

SMA 12      0.2706      0.7746      0.35    0.727

SMA 24      0.6057      0.7344      0.82    0.410

Constant  0.002082    0.001457      1.43    0.154

 

Differencing: 1 regular, 1 seasonal of order 12

Number of observations:  Original series 288, after differencing 275

Residuals:    SS =  403.059  (backforecasts excluded)

              MS =   1.521  DF = 265

 

Modified Box-Pierce (Ljung-Box) Chi-Square statistic

Lag               12        24        36        48

Chi-Square       7.8      20.9      37.3      45.8

DF                 2        14        26        38

P-Value        0.020     0.105     0.070     0.179

خروجي (1)

 

با توجه به مقدار p-value در ستون p ملاحظه می کنیم که تنها فرضهاي  [22] و [23] در سطح معني داري 0.05 رد مي شود. لذا مدل برازش داده شده در بالا، مدل چندان مناسبي نمي باشد. بنابراین براي برازش یک مدل مناسب تر برای سری میانگین درجه حرارت  پارامترهاي مدل را تغيير داده  و مدل  ARIMA(3,1,0;1,1,1)  را برازش داده ايم.   نتایج  مربوط به برآورد ضرایب و آزمون فرضها در خروجی (2) آمده است. به غير از فرضهاي [24]                                 و ،  ديگر فرضهاي صفر رد مي شوند. (خروجي2)

ARIMA Model: Mean Air Temperature (c)

 

ARIMA model for Mean Air Temperature (c)

 

Final Estimates of Parameters

Type          Coef     SE Coef         T        P

AR   1     -0.5195      0.0581     -8.94    0.000

AR   2     -0.4433      0.0608     -7.29    0.000

AR   3     -0.2800      0.0583     -4.81    0.000

SAR 12     -0.0141      0.0684     -0.21    0.837

SMA 12      0.9182      0.0463     19.84    0.000

Constant  0.004273    0.009636      0.44    0.658

 

Differencing: 1 regular, 1 seasonal of order 12

Number of observations:  Original series 288, after differencing 275

Residuals:    SS =  464.355  (backforecasts excluded)

              MS =   1.726  DF = 269

 

Modified Box-Pierce (Ljung-Box) Chi-Square statistic

Lag               12        24        36        48

Chi-Square      16.9      39.2      53.8      66.4

DF                 6        18        30        42

P-Value        0.010     0.003     0.005     0.010

 

(خروجي2)

بنظر مي رسد الگوی فصلی مناسب برای سری زمانی مربوط به ميانگين درجه حرارت ماهانه ، ARIMA(3,1,0;1,1,1) بدست آمده است و به شکل    می باشد که در آن                     

                                                  

   ،    

با استفاده از آناليز باقيمانده هاي مدل فوق مي توان مناسبت مدل  برازش شده ARIMA(3,1,0;1,1,1)  را به سري ميانگين درجه حرارت ماهانه شهرستان قائمشهر  آزمود. معيارهايي كه مناسبت مدل را تاييد مي كنند شامل : استقلال باقيمانده هاي مدل، نرمال بودن باقيمانده ها، تصادفي بودن مانده ها و در نهايت پايداري واريانس باقيمانده ها مي باشد كه اين ويژگيها را براي باقيمانده هاي مدل برازش شده فوق مي توان در چهار شكل موجود در نمودار (11)  مشاهده كرد. كه اين مناسب بودن مدل ARIMA(3,1,0;1,1,1)  را براي سري مذكور تاييد مي كند.


نمودار(11).

4. نتایج

 اطلاعات این تحقیق از ایستگاه هواشناسی قراخیل قائمشهر جمع آوری شده است . مشخصات جغرافیایی این ایستگاه درجدول زير آمده است.

ایستگاه هواشناسی

قراخیل قائمشهر

عرض جغرافیایی

طول جغرافیایی

ارتفاع

N   27 36

E 46 52

M  7/14

 

با تجزیه وتحلیل سری زمانی میانگین درجه حرارت ماهاننه شهرستان قائمشهر، میانگین درجه حرارت ماهانه  این شهرستان را برای 24 ماه سالهای 1382و 1383 پیش بینی کردیم.این پیش بینی در خروجی(3) آمده است.برای مقایسه ي بين مقادير پيش بيني شده و واقعي ميانگين درجه حرارت ، مقدار واقعی میانگین درجه حرارت ماهانه سالهای 1382 و 1383 در ستون Actual خروجی(3) آمده است. چنانچه مشاهده می گردد فقط 2 پیش بینی  از 24 پیش بینی انجام شده  خارج از بازه اطمینان  افتاده اند و بقیه پیش بینی ها در  فاصله اطمینان 95%   قرار دارند.


Forecasts from period 276

               95 Percent Limits

Period      Forecast        Lower        Upper      Actual

277         13.0622      10.4865      15.6378      11.60

278         18.1441      15.2865      21.0017      16.70

279         22.8905      19.9255      25.8556      22.30

280         25.0163      21.9192      28.1135      25.20

281         26.2018      22.7973      29.6063      25.90

282         24.4192      20.8016      28.0367      25.30

283         19.5193      15.7488      23.2898      21.30

284         14.8021      10.8785      18.7257      16.30

285          9.9386       5.8362      14.0411      11.10

286          7.8657       3.5984      12.1329       9.40

287          7.1455       2.7311      11.5600      10.30

288          8.8393       4.2820      13.3967      10.60

289         15.1210      12.5453      17.6967      13.90

290         19.9697      17.1121      22.8274      18.90

290         19.9697      17.1121      22.8274      22.40

291         24.9018      21.9368      27.8669      24.80

292         27.1904      24.0932      30.2875      27.10

293         28.3074      24.9029      31.7119      25.20

294         26.5580      22.9404      30.1755      20.90

295         21.7835      18.0130      25.5540      16.60

296         17.0395      13.1159      20.9631       9.30

297         12.1035       8.0010      16.2059       8.00

298         10.0608       5.7935      14.3280       6.30

299         9.4702       5.0557      13.8846       11.70

 


خروجی (3)  


 منابع و ماخذ:

· مقدمه ای بر تجزیه و تحلیل سریهای زمانی/تالیف سی چتفیلد/ترجمه دکتر حسینعلی نیرومند، دکتر ابولقاسم بزرگ نیا

· آمارو کاربرد آن در مدیریت، جلد دوم:تحلیل آماری/تالیف دکتر عادل آذر و دکتر منصور مومنی    تهران: سازمان مطالعه و تدوین کتب علوم انسانی دانشگاهها(سمت)

· آمار کاربردی، جلد دوم تالیف جان نتر،ویلیام واسرمن، ویتمور/ ترجمه دکتر علی عمیدی               تهران: مرکز نشر دانشگاهی

·  سریهای زمانی/ تالیف دکتر حسینعلی نیرومند، دکتر ابولقاسم بزرگنیا /  نشر دانشگاه پیام نور

· شناخت و سنجش سازه های جوی موثر در کشاورزی/ تالیف دکتر اسمائیل مالک/ مرکز نشر دانشگاه شیراز

·   پردازش داده ها با Minitab /  تاليف عليرضا نگهبان / انتشارات جهاد دانشگاهي فارس



[1] کارشناس ارشد آمار اقتصادی و اجتماعی- عضو هیئت علمی دانشگاه علوم پزشکی گلستان- آدرس: گرگان – کیلومتر 5 جاده گرگان-ساری – اول جاده شصت کلاته- ساختمان فلسفی- دانشکده پزشکی – تلفن: 4421656-0171 –rabie1354@yahoo.com Email:

[2] دانشجوی کارشناس ارشد آمار محض

[3] کارشناس آمار

[4]  میانگین ماکسیمم دمای روزانه در طول ماه

[5]  میانگین مینیمم دمای روزانه در طول ماه

[6] Additive model

[7] Original Data

[8] Data Detrend

[9] Seasonally Adjested Data

[10] Seasonally Adj.and Detrended Data

[11] Seasonal Indices

[12] Original Data, by Seasonal Period

[13] Residuals by Seasonal Period

[14] Percent Variation by Seasonal Period

[15] Accuracy Measure

[16] مرتبه اتورگرسيو غير فصلي

[17] تعداد تفاضل گيري هاي غير فصلي

[18] مرتبه ميانگين متحرك غير فصلي

[19] مرتبه اتورگرسيو فصلي

[20] تعداد تفاضل گيري هاي فصلي

[21] مرتبه ميانگين متحرك فصلي

+ نوشته شده در  دوشنبه سی ام آبان 1384ساعت 12:43  توسط دبیر انجمن علمی  | 

با سلام به تمامی شما عزیزان

اگر مطلبی داشتید...اگر خواستیدبا ما تماس داشته باشید

این ایمیل را از یاد نبرید

gorgan_statistics_soc @yahoo.com

با تشکر انجمن علمی آمار

+ نوشته شده در  یکشنبه هشتم آبان 1384ساعت 11:54  توسط انجمن علمی   | 

تاریخچه ای از علم احتمال از مقاله "احتمال" اثر علی رجالی از دانشگاه صنعتی اصفهان

 پیدایش رسمی احتمال از قرن هفدهم به عنوان متدی برای محاسبه شانس در بازیهای قمار بوده است. اگر چه ایده های احتمال شانس و تصادفی بودن از تاریخ باستان در رابطه با افسونگری و بخت آزمایی و بازیهای شانسی و حتی در تقسیم کار بین راهبان در مراسم مذهبی وجود داشته است و به علاوه شواهدی از بکارگیری این ایده ها در مسائل حقوق٫ بیمه٫ پزشکی و نجوم نیز یافت میشود٫ اما بسیار عجیب است که حتی یونانیان اثری از خود در رابطه با استفاده از تقارنی که در هندسه بکار می برده اند در زمینه احتمال یا اصولی که حاکم بر مسایل شانس باشد بجا نگذاشته اند.
ارسطو پیشامدها را به سه دسته تقسیم می نمود:
۱) پیشامدهای قطعی که لزومآ اتفاق می افتادند.
۲) پیشامدهای احتمالی که در بیشتر موارد اتفاق می افتادند.
۳) پیشامدهای غیر قابل پیش بینی و غیر قابل شناسایی که فقط با شانس محض رخ میدهند.

اما ارسطو به تعبیرهای مختلف احتمال اعتقاد نداشته و فقط احتمال شخصی که مربوط به درجه اعتقاد افراد نسبت به وقوع پیشامدهاست را معتبر می دانسته است.
پاسکال و فرما اولی کسانی هستند که در اوایل قرن هفدهم مسایل مربوط به بازیهای شانسی را مورد مطالعه قرار دادند و این دو نفر به عنوان بنیانگزاران تئوری ریاضی احتمال لقب گرفته اند. دانشمندانی از قبیل هی گنز کارهای آنها را ادامه داده و ویت و هلی این مسایل را در آمارهای اجتماعی بکار گرفتند. این علم جدید نخستین نقطه اوج خود را در اثر مشهوری از ژاکوب برنولی بدست آورد. در این اثر علاوه بر تعریف کلاسیک احتمال ریاضی٫ اساس خاصی از قانون اعداد بزرگ و کاربردهای احتمال در آمارهای اجتماعی نیز مطرح شده است.
در قرن هجدهم متفکران بزرگی چون دی مور٫ دانیل برنولی٫ آلمبرت٫ اویلر٫ لاگرانژ٫ بیز٫ لاپلاس و گاوس قسمتی از وقت خود را به این علم جدید اختصاص دادند. بیز در سال ۱۷۶۳ قانون معروف بیز را ارائه می دهد و لاپلاس در نوشته ای تمام موضوع علم احتمال را جمع آوری می کند. مهمترین قضایای حدی که در محاسبات احتمالی بکار می رفته و تاثیر احتمال در ریاضی٫ فیزیک٫ علوم طبیعی٫ آمار٫ فلسفه و جامعه شناسی در این اثر جمع آوری شده است.
با مرگ لاپلاس در سال ۱۸۷۲ اوج پیشرفت این علم به اتمام رسید و علی رغم برخی تلاشهای فردی که ماحصل آنها کشف قضایایی چون قضیه اعداد بزرگ پواسون و یا نظریه خطاهای گاوس بود٫ بطور کلی احتمال کلاسیک ارتباط خود را با مسائل تجربی و علمی از دست میدهد. اما جریانهای متقابل ظاهر می شوند. به موازات پیشرفت نظریه ریاضی یک نظریه آمار به عنوان کاربردهایی از احتمال بوجود می آید. این نظریه در رابطه با مسایل مهم اجتماعی از قبیل اداره داده های آماری٫ مطالعه جمعیت و مسایل بیمه بکار می رفته است. اساس کار توسط افرادی چون کوتلت و لکسیز ریخته شده و توسط دانشمندانی چون فشنر(روانشناس)٫ تیله و برانز(منجمان)٫ گالتون و پیرسون(زیست شناسان) پیشرفت نموده است. این کارها در اواخر قرن نوزدهم در جریان بوده و در انگلستان و برخی دیگر از کشورها حرفه حسابگری٫ به مفهوم آماردانی که از اقتصاد و ریاضی هم اطلاعاتی دارد و در جمعیت شناسی و بیمه خبره می شود٫ رونق می یابد. از طرف دیگر فرمولهای کلاسیک ایده های احتمال میز مسیر پیشرفت و کاربردی خود را ادامه میدادند. در این قرن در تلاش برای روشن سازی پایه منطقی کاربردهای احتمال٫ وان میزز یک فرمولبندی جدید برای محاسبات احتمالی ارائه میدهد که نه تنها از نظر منطقی سازگار بوده بلکه نظریه ریاضی و تجربی پدیده های آماری در علوم فیزیکی و اجتماعی را پایه گذاری می نماید.
مدل کلاسیک احتمال توسط برنولی و لاپلاس معرفی شد. این مدل به دلیل فرض همطرازی و عدم امکان تکرار در شرایط یکسان و دلایل دیگر با اشکالاتی روبروست که بسیاری از پدیده های طبیعی بر آن منطبق نیست.
ایده های اساسی نظریه تجربی احتمال که قرار دادن فراوانی نسبی بجای احتمال است در سال ۱۸۷۳ توسط پواسون ارائه گردید.
بسیاری از مسائل احتمال حتی قبل از بیان اصول آن توسط کلموگرف در سال ٫۱۹۳۳ با ابزارهای تجربی و حتی نظری توسط دانشمندان مطرح شده است. ولی کلموگرف با بیان اصول احتمال پایه این علم و ارتباط دقیق آنرا با مباحث ریاضی مستحکم می نماید.
در این زمان احتمال به عنوان یکی از شاخه های ریاضی٫ نه تنها کلیه ابزارهای ریاضی را جهت پیشرفت خود بکار می گیرد٫ بلکه توانسته کاربردهایی را در حل برخی از مسایل ریاضی داشته باشد. نظریه احتمالی اعداد٫ نظریه احتمالی ترکیبیاتی و کاربردهای شاخص احتمال در برخی از مسایل آنالیز٫ بعضی از کاربردهای احتمال در ریاضی هستند.
از طرف دیگر احتمال به عنوان زیربنای ساختاری و اصول ریاضی علم آمار٫ در جهت پیشرفت این علم و قوام بخشی به دستورات آن نقشی اساسی دارد.
مسائل جالب احتمال هندسی و نظریه احتمالی اعداد٫ شمه ای از زیبایی های احتمال است که همه اینها با هم زیبایی٫ کارآیی و توان علم احتمال را نشان می دهند.

+ نوشته شده در  دوشنبه دوم آبان 1384ساعت 15:32  توسط انجمن علمی   | 

تاريخچه تاسيس انجمن آمار ايران

تاريخچه تاسيس انجمن آمار ايران

در سال 1368 پس از تبادل نظر ميان آماردانان كشور, يك اساسنامه پيشنهادي از سوي گروه آمار دانشگاه شهيد بهشتي به دانشگاهها و سازمانهاي آماري كشور ارسال شد و درخواست گرديد كه ضمن ارائه نظرهاي اصلاحي, نمايندگان خود را براي پيگيري موضوع تاسيس انجمن آمار ايران معرفي كنند .در تاريخ 24/12/68 مقارن با برگزاري بيست و يكمين كنفرانس رياضي كشور در دانشگاه اصفهان در طي يك گردهمائي نه نفر از استادان آمار دانشگاهها و ديگر آمارشناسان (خانم دكتر ماه‌بانو تاتا, آقايان دكتر جواد بهبوديان, دكتر محمدرضا مشكاني, دكتر ابوالقاسم بزرگ‌نيا, دكتر عين‌اله پاشا, دكتر مرتضي جمشيديان, محمدرضا حميدي‌زاده, محمدرضا فقيهي, اكبر بديع‌زادگان) انتخاب شدند تا جلسه‌اي در تاريخ12/2/69 در دفتر همكاريهاي علمي و بين‌الملل وزارت فرهنگ و آموزش عالي تشكيل داده موضوع تاسيس انجمن را پيگيري كنند. متعاقب اين جلسه, جلسه ديگري در تاريخ 22/3/69 در دانشگاه شهيد بهشتي برگزار شد. شركت كنندگان در اين جلسه عبارت بودند از نمايندگان دانشگاهها كه براي بررسي و تصويب اساسنامه پيشنهاد شده از سوي گروه آمار دانشگاه شهيد بهشتي دعوت شده بودند و در حقيقت اولين مجمع موسس را تشكيل مي‌دادند. اسامي آنان عبارت است از خانم دكتر تاتا (دانشگاه كرمان), آقايان دكتر آزادگان (دانشگاه علوم پزشكي تهران), دكتر ايزدوستدار (دانشگاه تهران), دكتر بهبوديان (دانشگاه شيراز), دكتر جمشيديان (دانشگاه صنعتي اصفهان), دكتر حكيمي (دانشگاه شهيد چمران اهواز), دكتر عميدي (مركز نشر دانشگاهي), دكتر مشكاني (دانشگاه شهيد بهشتي), دكتر نوربلوچي (دانشگاه شهيد بهشتي) و دكتر وحيدي (دانشگاه تربيت معلم تهران). درا ين جلسه مواد اساسنامه  پيشنهادي قرائت شد و پس از بحث و بررسي اصلاحات لازم ماده به ماده تصويب گرديد .ضمناً اين جمع آقايان دكتر وحيدي, دكتر پاشا و دكتر مشكاني را براي تاسيس رسمي انجمن و ثبت آن مامور نمودند

با تقديم اساسنامة پيشنهادي به دفتر همكاريهاي علمي و روابط بين‌الملل تقاضاي مجوز براي انجمن شد. در آن موقع اجازة انجمنها از طرف وزارت كشور صادر مي‌شد. از اين رو دفتر همكاريها ضمن موافقت اصولي با فعاليت انجمن مدارك مربوط را طي نامة شماره 15229/22 مورخ 9/12/1369 به وزارت كشور ارسال نمود. با وجود پيگيريهايي كه در وزارت كشور به عمل آمد, به خاطر روشن نبودن طرز كار موضوع به تاُخير افتاد در ايام برگزاري بيست و دومين كنفرانس رياضي كشور در دانشگاه فردوسي مشهد در تاريخ 24 اسفند 1369 مجمع عمومي موقت انجمن تشكيل شد. و آقايان نامبرده زير را به عنوان شوراي اجرايي و اعضاي علي‌البدل به طور موقت برگزيد تا ضمن شروع فعاليتهاي انجمن امر به ثبت رساندن انجمن و تشكيل نخستين كنفرانس آمار را دنبال كنند. اين عده عبارت بودند از آقايان دكتر محمدرضا مشكاني, دكتر جواد بهبوديان, دكتر علي رجالي, دكتر احمد پارسيان, دكتر ابوالقاسم بزرگ‌نيا, دكتر عين‌الله پاشا, دكتر جلال داودزاده, دكتر ناصر رضا ارقامي,  دكتر قاسم وحيدي و آقاي آزاده. اين عده نخستين شوراي اجرايي موقت انجمن را تشكيل دادند و كار خود را آ‎غاز نمودند

دراين ضمن شورايعالي انقلاب فرهنگي باتصويب ماده واحده‌اي درتاريخ          29/5/70  امر صدور مجوز انجمن‌هاي علمي را به تناسب نوع آنها به عهده وزارت فرهنگ و آموزش عالي, وزارت بهداشت, درمان و آموزش پزشكي, يا وزارت فرهنگ و آموزش عالي مراجعه مي‌شد. چون براي شروع كار بايد كميته‌اي مركب از سه وزارتخانه تشكيل و آئين‌نامه اجرائي نوشته مي‌شود, بازهم ثبت انجمن با تاُخير مواجه شد

پس از تدوين آئين‌نامه, كسب اطلاع شد كه مجوز انجمن‌هاي علمي به نام اعضاي شوراي اجرائي صادر مي‌شود و اين زماني بود كه انجمن آمار فعاليتهاي خود را شروع كرده بود, از آن جمله نخستين كنفرانس آمار در دانشگاه صنعتي اصفهان برگزار شده بود. در همان روزهاي كنفرانس, مجمع عمومي نيز تشكيل شد. در اين مجمع اعضاي اصلي و علي‌البدل شوراي اجرائي انتخاب شدند و تركيب جديد عبارت بودند از آقايان دكتر محمدرضا مشكاني, دكتر جواد بهبوديان, دكتر احمد پارسيان, دكتر مرتضي جمشيديان, دكتر ناصررضا ارقامي, دكتر عين‌الله پاشا, مهندس محمدباقر سخاوت و اكبر بديع‌زادگان.

بالاخره پس از آنكه وزارت فرهنگ و آموزش عالي آئين‌نامه اجرائي تصويب انجمن‌هاي علمي را تدوين و به موقع اجرا گذاشت, تقاضاي تاسيس انجمن آمار نيز در آنجا مطرح شد. در اين موقع در اداره ثبت شركتها امضاي هيئت موسس را كه طبق آئين‌نامه همان اعضاي شوراي اجرائي بودند خواستار شدند و چون برخي از اعضاي موسس سابق در خارج از كشور به سر مي‌بردند, با صلاحديد وزارت فرهنگ و آموزش عالي اعضاي اصلي شوراي اجرائي جديد به عنوان موسسين از طرف وزارت فرهنگ و آموزش عالي به اداره ثبت شركتها معرفي شدند. سرانجام پس از طي مراحل طولاني انجمن آمار ايران در تاريخ 21/4/1372 طي شماره 7558 در ادراة ثبت شركتها به ثبت رسيد و حيات قانوني يافت

شايان ذكر است كه در طي اين مسير طولاني و پرپيچ و خم از نظرات و كمكهاي افراد زيادي بهره گرفته‌ايم كه از برخي از آنها نام برده شد و از برخي ديگر نام برده نشد. گو آنكه تشريفات اداري ما را ملزم مي‌ساخت كه فقط تعداد معدودي به عنوان موسس در دفاتر ثبت شود, ولي در حقيقت همه آنها موسس و صاحب انجمن آمار ايران هستند زيرا با علاقه و تشويق و كمك خود آن را پايه‌گذاري كردند و بايد از همه آنها سپاسگزاري كرد. در پايان از كمك آقاي شيباني كارشناس امور انجمن‌هاي علمي در وزارت فرهنگ و آموزش عالي كه همواره با گشاده‌رويي به كمك انجمن آمار ايران آمده‌اند تشكر مي‌كنيم

+ نوشته شده در  دوشنبه دوم آبان 1384ساعت 15:30  توسط انجمن علمی   | 

 

اول آبان روز آمار و برنامه ریزی گرامی باد

  

   تحليل وضعيت موجود و پيش بيني وضعيت آينده در بخشهاي مختلف اقتصادي مستلزم  وجود داده‌هاي آماري دقيق، جامع و به روز است. بنابراين آمار و اطلاعات يكي از عوامل مؤثر و ضروري براي برنامه‌ريزي، ارزيابي عملكردها و تصميم‌گيري در سطوح مختلف مديريت بوده و سياستگزاران، برنامه‌ريزان و كارشناسان براي تدوين راهبردها، سياستگزاري و تعيين خط مشي، برنامه‌ريزي، نظارت، هماهنگي و هدايت برنامه‌ها و نيز فعالان اقتصادي و تجار در فرآيند ارتقاء جايگاه كشور در بازار جهاني به داده‌هاي آماري نياز دارند.

    آمار و اطلاعات پايه و اساس هر تحقيق، پژوهش، تصميم گيري، برنامه ريزي و سياستگزاري است.  به همين جهت سياستگزاران، برنامه ريزان و كارشناسان براي تدوين برنامه‌ها، سياستگزاري‌ها و تصميم گيري‌ها به داده‌هاي آماري ويژه اي نياز دارند كه براساس آنها تحليل‌هاي خرد و كلان خود را شكل دهند. برخي فعالان اقتصادي به داده‌هاي آماري صنعت يا بازار خاصي توجه دارند، حال آنكه برخي ديگر علاوه بر آمارهاي موردي به داده‌هاي آماري متغيرهاي كلان اقتصادي توجه مي‌كنند. همچنين پژوهشگران به طيف گسترده‌اي از داده‌هاي آماري نياز دارند. استفاده از اين ابزار اساسي و مطمئن به نحوي مورد توجه قرار گرفته كه ميزان توسعه‌يافتگي كشورها ارتباط تنگاتنگي با حجم و كيفيت آمار و اطلاعات توليد شده توسط آنها دارد. تهيه و توليد اطلاعات آماري صحيح و ارايه بهنگام آن به منظور رفع نيازهاي آماري جامعه به ويژه برنامه‌هاي توسعه اقتصادي، اجتماعي و فرهنگي كشور و همچنين تغذيه پايگاه اطلاعات آماري از جمله مهمترين هدفهاي نظام آماري كشور مي‌باشد.

+ نوشته شده در  شنبه سی ام مهر 1384ساعت 14:16  توسط انجمن علمی   | 

ضریب همبستگی

 ما اين روزها در اواسط دهه بعد از صد سالگي همبستگي و رگرسيون هستيم.دستاوردهاي تجربي و نظريي كه موجب شد رگرسيون   وهمبستگي به صورت مطالب آماري تعريف شوند در1885 به وسيله ي سرفرانسيس گالتن ارائه شدند.سپس كارل پيرسن در1895r پيرسن را انتشار داد.

   ايده اصلي همبستگي اساساًًََََ قبل از 1885 عنوان شده بود.پيرسن در سال 920 ارائه نرمال n متغيرهمبسته را به گاوس نسبت داد.اما گاوس به همبستگي به عنوان يك مفهوم متمايز توجه خاصي نداشت و در معادله هاي توزيعي اش همبستگي را به عنوان يكي از پارامترها تعبير كرد .

   پيرسن در در يك مقاله ي تاريخي كه در 1895 انتشار يافت ارائه ي توزيع نرمال دو متغيره را به اگوست براوه ستاره شناس فرانسوي نسبت داد. براوه در واقع به پارامتري از توزيع نرمال دو متغيره عنوان هبستگي را اطلاق كرد .

   اينك پس از يك قرن دانشمندان معاصر اغلب ضريب همبستگي را مطلبي بديهي و مسلم مي دانند.امروزه ضريب همبستگي و معادله رگرسيون همتاي آن در بسياري از زمينه ها براي آزمايشهاي مبتني بر مشاهدات ,يك ابزار آماري اصلي است .

   كارول در خطابه اي كه به مناسبت انتصابش به رياست انجمن روانسنجي ايراد كرد ,ضريب همبستگي را يكي از متداولترين ابزارهايي كه در روانسنجي به كار مي رود ...و شايد يكي از متداولترين ابزارهايي كه بد به كار گرفته شده است خواند .در تجزيه ي عاملي , در مدلهاي زنتيكي رفتاري ،در مدلهاي معادله هاي ساختاري (مثلأ LISREL )، و در ديگر روشهاي وابسته ، ضريب همبستگي به عنوان واحد اساسي داده ها به كار مي رود.

براي آشنايي با مفهوم ضريب هبستگي ابتدا از مفاهيم اميد رياضي ، واريانس ، وكوواريانس شروع مي كنيم.

   اميد رياضي يك متغير تصادفي يكي از مهمترين مفاهيم نظريه ي احتمال است. كه نقش آن در نظريه احتمال همانند نقش انتگرال است در حسابان.

  براي روشن شدن مفهوم انگيزه اميد رياضي يك بازي را در نظر بگيريد كه در آن احتمال باخت يك دلار در هر بازي 6/0 و احتمالهاي برد به ترتيب 3/0 ، 08/0 و 02/0 است . هر چند برد يا باخت هر بازيكني بيشتر از هر چيز به شانس او بستگي دارد اما اگر بازيكني تصميم بگيرد كه دفعات زيادي بازي را ادامه دهد ، مقدار برد يا باخت او بيشتر از هر چيز به تعداد دفعات بازي بستگي دارد . هر بازيكن حسابگر ، حساب مي كند كه اگر n بار بازي را تكرار كند وقتي n بزرگ است آن گاه به طور تقريب در n(6/0) با ر1 دلار مي بازد ، و تقريبأ در n(3/0) ، n(08/0) ، و n(02/0) بار به ترتيب 1 ، 2 ، و 3 دلار مي برد. بنابر اين كل مقدار برد او برابر است با

n (08/0-)=3×n(02/0)+2×n(08/0)+1×n(3/0)+(1-      (×n(6/0)  

   

و08/0- نشان مي دهد كه به طور متوسط در هر بازي نزديك به 08/0 دلار مي بازد.اگر X يك متغير تصادفي باشد كه مقدار برد بازيكن را در هر بازي نشان مي دهد در اين صورت عدد 08/0- را مقدار مورد انتظار  Xمي گوييم و مي نويسيم 08/0-=E(X) . E(X) متوسط مقدا رX است.

   تعريف  مقدا رمورد انتظار متغير تصادفي X با مجموعه مقادير ممكن A و تابع احتمال p(x) بنا به تعريف عبارت است از :

                              A  E(X)=∑xp(x)  , x €

اگر اين مجموع به طور مطلق همگرا باشد در اين صورت مي گوييم E(X) وجود دارد.

  مقدار مورد انتظار متغير تصادفي X را ميانگين يا اميد رياضي X مي نامند و آن را با E(X) نشان مي دهند .

  به همين ترتيب اگر X يك متغير تصادفي پيوسته با تابع چگالي احتمال ƒ باشد،آن گاه مقدار مورد انتظار X بنا به تعريف عبارت است از :

                                                     E(X)=∫xƒ(x)dx

واريانس متغير تصادفي

 

  واريانس يك متغير تصادفي (چه گسسته چه پيوسته ) عبارت است از”متوسط مجذور فاصله متغير تصادفي از ميانگين خود”.

  پس در حالت گسسته داريم:

. σ^2=Var(X)=E(X-μ)^2=Σ(ai- μ)^2P(X=ai)      

كه منظور از μ همان اميد رياضي است.

 

كوواريانس

 

  فرض كنيد X و Y دو متغير تصادفي با توزيع تواَم باشند، در اين صورت كوواريانس X و Y به صورت زير تعريف مي شود

Cov(X,Y)=E[(X-E(X))(Y-E(Y))]                 

توجه كنيد كه،

Cov(X,X)= σx^2=Var(X)                    

همچنين بنا بر نابرابري كشي ـ شوارتز،

Cov(X,Y)=E[(X-E(X))(Y-E(Y))] <= σX σY      

     

يك مثال براي آشنايي با مفهوم اميد رياضي و كوواريانس

 

فرض كنيد X طول عمر يك دستگاه الكترونيكي و Y طول عمر يكي ازاجزاي آن باشد. فرض كنيد با از كار افتادن اين جزء دستگاه از كار بيفتد(اما عكس آن لزومأ درست نباشد.) به علاوه فرض كنيد كه تابع چگالي احتمال تواُم X وY (بر حسب سال) به صورت زير باشد

 

ƒ(x,y)=         1/49e^(-y/7)   0<=x<=y

جاهاي ديگر                    0

الف) اميد رياضي باقيمانده طول عمر اين جزء را وقتي دستگاه از كار مي افتد تعيين كنيد.

ب) كوواريانس X و Y را بيابيد.

  حل.(الف) باقيمانده طول عمر جزء وقتي دستگاه از كار مي افتد برابر  است با Y-X. بنابر اين مقدار مورد انتظار برابر است با :

E(Y-X)=∫ ∫(y-x)(1/49)e^(-y/7)dxdy                

=(1/49) ∫e(-y/7)(y^2-y^2/2)dy            

=(1/98) ∫y^2e^(-y/7)dy=7                   

كه در آن آخرين انتگرال با استفاده از دو بار روش جزء به جزء محاسبه شده است .

(ب) براي محاسبه Cov(X,Y)=E(XY)-E(X)E(Y) ، توجه كنيد كه،

 

E(XY)= ∫ ∫(xy)(1/49)e(-y/7)dxdy                  

=1/49∫ye^(-y/7)( ∫xdx)dy                    

=1/98∫y^3e^(-y/7)dy=14406/98=147 

كه در آن آخرين انتگرال با استفاده از سه بار روش جزء به جزء محاسبه شده است . همچنين داريم :

E(X)= ∫ ∫x(1/49)e^(-y/7)dxdy=7               

E(Y)= ∫ ∫y(1/49)e^(-y/7)dxdy=14             

بنابراين ،Cov(X,Y)=147-7*14=49 . توجه كنيد همچنان كه انتظار آن را داريم ، Cov(X,Y)>0 زيرا X و Y مثبت اند.

همبستگي

 

در حالي كه براي متغيرهاي تصادفي X و Y ، Cov(X,Y) اطلاعاتي درباره تغييرات تواُم Y,X به دست ميدهد ، اما نقص عمده اي هم دارد : كوواريانس مستقل از واحد اندازه گيري نيست.توضيح اين كه فرض كنيد براي متغيرهاي تصادفي Y,X وقتي اينها مثلاًَ با سانتيمتر اندازه گيري مي شوند داشته باشيم Cov(X,Y)=0.15 . براي همين متغيرهاي تصادفي اگر واحد اندازه گيري را به ميليمتر تغيير دهيم در اين صورت مقادير جديد مشاهده شده X1=1*X و Y1=1*Y بوده و داريم :

Cov(X1,Y1)=Cov(10X,10Y)=100Cov(X,Y)=15

اين رابطه نشان ميدهد كه Cov(X,Y) نسبت به واحد اندازه گيري حساس است .

اگر براي هر متغير تصادفي X مقدار استاندارد شده آن

X٭=[X-E[X]]/σx

مستقل از واحد اندازه گيري است. پس چنين به نظر مي رسد كه براي تعريف اندازه همبستگي Y,X ، به صورتي كه مقدار آن به مقياس اندازه گيري بستگي نداشته باشد، Cov(X٭,Y٭) به جاي Cov(X,Y) مناسبتر باشد. پس داريم :

Cov(X٭,Y٭)=Cov((X-E[X])/σx ,(Y-E[Y])/σy )

=Cov(X/σX-E(X)/ σX,Y/ σY-E(Y)/ σY )

=1/(σxσY)Cov(X,Y)

=Cov(X,Y)/ σxσY

تعريف فرض كنيد Y,X دو متغير تصادفي باشند به قسمي كه 0<σ²x<∞ و 0<σ²y<∞ . كوواريانس مقادير استاندارد شده Y,X را ضريب همبستگي بين Y,X مي نامند و آن را با ρ=ρ(X,Y) نشان مي دهند . بنابراين ،

ρ=Cοv(X,Y)/ σxσY

كميت Cοv(X,Y)/ σxσY همه اطلاعات مهمي را كه Cοv(X,Y) درباره تغييرات تواُم Y,X به دست ميدهد ،در بر دارد ، و در عين حال نسبت مقياس اندازه گيري هم حساس نيست.

در ادامه مبحث ضريب همبستگي به بيان يك لم مي پردازم كه بسيار جالب است.

لم:براي هر دو متغير تصادفي Y,X با ضريب همبستگي ρ(X,Y) ، داريم :

Var(X/σx +Y/σy)=2+2ρ(X,Y)             

Var(X/σx -Y/σy)=2-2ρ(X,Y)              

 

 

قضيه:براي هر دو متغير تصادفي Y,X با ضريب همبستگيρ(X,Y) داريم:

الف)-1<=ρ(X,Y)<=1

ب)با احتمال 1،ρ(X,Y)=1 اگر و تنها اگر براي بعضي مقادير ثابت a,b وa>0 ،Y=Ax+b

ج) با احتمال 1،ρ(X,Y)=-1 اگر و تنها اگر براي بعضي مقادير ثابت a,b وa<0 ،Y=Ax+b

 

 

يك سؤال:

نشان دهيد كه اگر تابع چگالي تواُم متغيرهاي تصادفي پيوسته X,Y به صورت زير باشد

ƒ(x,y)=             x+y   ,0                   

         در غير اين صورت ,      0 

در اين صورت X,Y وابسته خطي نخواهند بود.

چون X,Y وقتي و تنها وقتي وابسته خطي اند كه با احتمال يك ρ(X,Y)=±1 ، لذا كافي است ثابت كنيم   .  ρ(X,Y)≠±1

براي اين منظور توجه كنيد كه ،

E(X)=∫∫x(x+y)dxdy=7/12                   

E(XY)=∫∫xy(x+y)dxdy=1/3                

همچنين با توجه به تقارن X,Y، E(Y)=7/12

لذاCov(X,Y)=E(XY)-E(X)E(Y)=1/3-(7/12)(7/12)=-1/144

همين طور

E(X²)=∫∫x²(x+y)dxdy=5/12                         

√(E(X²)-[E(X)]²)=√11/12                 =σ

پس±1 ρ(X,Y)=-144/(√11/12)(√11/12)=-1/11≠

 

+ نوشته شده در  شنبه سی ام مهر 1384ساعت 14:0  توسط انجمن علمی   | 

توزیع گاما

توزیع گاما

توزیع گاما با پارامتر صحیح a ، زمان انتظار برای a-اُمین رخداد در یک فرآیند پواسون است که به ازای a=1، همان توزیع نمایی، زمان انتظار برای اولین رخداد، است.

تابع چگالی احتمال برای یک توزیع گاما معمولا به صورت زیر می باشد :

که a و b هر دو مثبت تعریف می شوند. این توزیع وقتی استاندارد نامیده می شود که B = 1 باشد. تابع گاما که در فرمول بالا ذکر شده٬ تعریف می شود :


\begin{displaymath}\Gamma(\alpha)=\int_0^{\infty} t^{\alpha-1}e^{-t} dt
\end{displaymath}
 
و این تابع یک خصوصیت مفید دارد به این شرح که :


  \begin{displaymath}\Gamma(\alpha + 1)=\alpha \Gamma(\alpha)
\end{displaymath}
 
 
 توزیع گاما داری دو پارامتر مقیاس (B) و شکل (a) می باشد که می توانند مقادیر غیرصحیح را نیز شامل شوند. مثلا وقتی برای تعریف مجموع تعدادی از متغیرهای توزیع شده نمایی٬ به کار رود٬ فاکتور شکل٬ a ٬ نمایانگر تعداد متغیرها و فاکتور مقیاس٬ B ٬ نمایانگر میانگین توزیع نمایی می باشند.
 
 
نمونه هایی از توزیع گاما برای مقدار متغیر a و مقدار ثابت B=1 را می توانید در شکل زیر مشاهده کنید. دقت کنید که برای a <= 1  ٬ توزیع همواره نزولی است.
 
 
حال نمونه هایی از توزیع گاما برای مقدار ثابت a=2 و مقادیر متغیر B را می توانید در شکل زیر مشاهده کنید. همانطور که در شکل می توانید ببینید٬ B نمودار را در راستای محور  x ها میکشد.
 
 
میانگین توزیع گاما برابر ضرب a و B است. واریانس آن نیز حاصل ضرب a در مربع B می باشد.
mean = a B
variance = a B2
 
کاربردهای توزیع گاما را می توان تحت دو عنوان زیر تقسیم بندی کرد :
  • کاربردهای مبتنی بر فواصل زمانی بین رخدادها که در این حالت٬ جمع یک یا چند متغیر نمایی می باشد. مثالهایی از این قبیل کاربرد٬ عبارتند از : مدلهای رده بندی queuing (که در قسمت مثال توزیع نمایی هم به آن اندکی اشاره شده بود)٬ گردش اقلام در فرآیندهای تولید و توزیع کالا٬ لود شدن وب سرورها و حالات بسیار زیاد و متنوعی از تبادلات ارتباطی.
  • به عنوان مدلی در مواردی مانند آب و هوا شناسی که در اینجا مدلی کارآمد برای میزان بارش باران می باشد یا مواردی از قبیل خدمات مالی٬ مثلا به عنوان مدلی برای مطالبات بیمه ای یا قراردادهای وام دهی٬ و کلا مواردی که قبلا در احتمال های مربوط به موفقیت و شکست در محاسبات ریسک پذیر٬ بکار برده میشد.
لازم به ذکر است که توزیع نمایی٬ حالت خاصی از توزیع گاما است هنگامیکه  a=1 و B = 1/lambda .
نوع خاص دیگری از توزیع گاما٬ توزیع ارلانگ می باشد که برای مدل سازی مجموع فواصل زمانی مربوط به چندین رخداد پواسون٬ بکار می رود. در اینجا٬ پارامتر a نمایانگر تعداد رخدادها و پارامتر B نمایانگر میانگین فواصل زمانی بین رخدادها می باشند.
+ نوشته شده در  شنبه سی ام مهر 1384ساعت 13:55  توسط انجمن علمی   | 

زنجیر مارکوف

میگویند شخصی میخواست دم اسب خود را کوتاه کند،با مردی با تجربه در مورد اینکه تا چه اندازه دم اسب را کوتاه کند مشورت کرد.ان مرد به او گفت:هر اندازه که دلت میخواهد کوتاه کن زیرا هر کازی بکنی بعضیها خواهند گفت خیلی بلند است و بعضیها خواهندخیلی کوتاه،و نظر شما نیز گاه به گاه تغییر خواهد کرد.

انسان در زندگی روزمره با بسیاری از فرایندها و متغیرهای تصادفی  در ارتباط است.مانند پیشامد شکسته شدن یک اتم یا بی عیب بودن یک اجاق مایکروویو.تصادفی بودن یک پیشامد به معنای ان است که تنها وجود شرایط لازم که تحت انها ازمایش انجام میشود،وقوع پیشامد را تضمین نکند.تعیین مقدار دقیق یا براورد شانس رخداد یک پیشامد ان هم به صورتی کمی نهایت مطلوب است.

در این مجموعه ما بحث فرایندهای تصادفی را به یکی از مهمترین قضایای این بحث یعنی زنجیر مارکوف محدود میکنیم که توسط دانشمند شهیر روسی، اندری مارکف در قرن ۱۹میلادی بیان شد.ابتدا توضیحی به اختصار در مورد زندگی این دانشمند بزرگ میخوانیم:

اندری اندریوویچ مارکوف در ۱۴ جون سال ۱۸۵۶ در ریازان روسیه متولد شد.وی در سال ۱۸۷۸ از دانشگاه سنت پترزبورگ فارق التحصیل شد و مقطع دکترا را در همان دانشگاه به پایان رساند.از کارهای ابتدایی وی میتوان به تحقیقاتی در نظریه اعداد و انالیز،حدو انتگرال،نظریه تقریبها و همگرایی سریها اشاره کرد.

از سال ۱۹۰۰ به بعد،مارکوف از متد کسرهای پیوسته در نظریه احتمالات استفاده کرد که پیشرو این راه استاد او چبی شف بود.او همچنین روی دنباله ی متغیرهای مستقل متقابل مطالعه کرد تا بتواند قوانینی برای رفتار احتمالاتی این متغییزها بیابد.او قضییه حد مرکزی را تحت مفروضات عمومی ثبات نمود.

اما مارکوف عمدتا" به خاتر مطالعاتش بر روی زنجیر مارکوف مشهور است،دنبالهای از متغییرهای تصدفی که رفتار متغییر در اینده با رفتار متغییر در زمان حال تخمین زده میشود.که بدها این اثر پیش زمینه و سراغاز تیوری فرایندهای تصادفی قرار گرفت.

مارکوف به شعر هم علاقه داشت و مطالعاتی در زمینه استیل شعر انجاام داد.از وی فرزند پسری هم نام خودش به جای ماند که ادامه دهنده ی راه پدر شد.

این دانشمند بزرگ در۲۰ جولای سال ۱۹۲۲ در سنت پترزبورگ روسیه چشم از جهان فرو بست.

 

زنجیر مارکوف چیست؟

فرض کنید مجموعه ی S،مجموعه ی کل حالتهایی باشد که یک سیستم میتواند اختیار کند و فرض کنید در هر مرحله از زمان،سیستم یا تغییر حالت میدهد یا همان حالت قبل را حفظ میکند.فراتر،فرض کنید ماتریس انتقال احتمال P با سطر و ستونهایی از S موجود است که اگر سیستم در یک مرحله ی زمانی در حالتsعضو S باشد،انگاه احتمال انکه در مرحله بعدی زمانی در حالت t عضو S باشد، (P(s,tاست که احتمال انتقال حالت از s به t از زمان و مسیر طی شده تا رسیدن به حالت s مستقل است.توجه کنید که(P(s,s احتمال باقی ماندن در حالت s در یک مرحله زمانی است و احتمال  پیمودن هر مسیر ،حاصل ضرب احتمال های هر مرحله زمانی است.چنین سیستمی را یک زنجیر مارکوف می نامند که با (M(S,P نمایش می دهیم.

گاهی اوقات معمول تر است که یکزنجیر مارکوف را یک گراف نشان دهیم، که هر مرحله در زنجیر مارکوف یک راس از گراف است و هراحتمال انتقال غیر صفر یالی از گراف است نه با اندازه احتمال ان مرحله نامگذاری(بر چسب گذاری)می شود.

در شکل ۱ اگر سیستم از حالت o در در زمان صفر شروع به حرکت کند ، در زمان ۱ در حالت (A) قرار خواهد گرفت با احتمال ۱ در زمان ۲ با احتمال ۰.۵ یا درحالت (B) قرار می گیرد یا در در(D) در زمان ۳ با احتمال ۰.۵ یا در خانه (C) قرار می گیرد یا در خانه (E) و در زمان ۴ با احتمال ۱ به حالت اولیه (A) باز می گردد.پس اگر سیستم از حالت (O) شروع به حرکت کند در یک چرخه قرار می گیرد نه هر بار از A شروع شده و به A منتهی می شود.

بسیاری از زنجیر های مهم مارکوف رفتارهای متفاوتی نشان می دهند که چرخه ای نیست و هر بار تمام رئوس گراف را متناهیا" طی می کند.برای مثال در شکل ۲ اگر از(a,b,c) برای نشان دادن احتمال قرار گرفتن سیستم در حالت هایA,B,C استفاده کنیم اگر سیستم از حالت A در زمان صفر شروع به حرکت کند(اگر احتمال ها در این مرحله از زمان به صورت (۰و۰و۱)  باشند) ،در زمان ۱  (یعنی قرار گرفتن در وضعیت(B))احتمال ها به صورت(۰و۰.۵و۰.۵) خواهد  بود،در زمان ۲ به صورت (۰.۲۵و۰.۲۵و۰.۵) ،در زمان ۳ به صورت(۰.۲۵و۰.۱۲۵و۰.۶۲۵)  و در زمان ۴ به صورت (۰.۱۲۵و۰.۳۱۲۵و۰.۵۶۲۵) خواهند بود و به ترتیب فرقی نمی کند که سیستم از کحا شروع به حرکت کند،در صورت سیستم همگرا به توزیع(۰.۲۵و۰.۲۵و۰.۵) می شود.به چنین زنجیری یک زنجیر مارکوف ترکیبی گویند.

 

دسته بندی حالتها ی زنجیر مارکوف:

در یک زنجیر مارکوف هر حالت یا وضعیت میتواند در سه دسته قرار بگیرد.چون هر وضعیت سیستم،فقط و فقط یک دسته اختیار میکند،این دسته ها حالتها را تقسیم بندی میکنند.عللت این دسته بندی پیدا کردن کلاسهای مرتبط روی هر گراف است.وضیعت های اختیار کننده در هر زنجیر مارکوف یکی از این ۳ کلاس مرتبط را اشغال می کنند.دو وضعیت مرتبطند اگر و فقط اگر امکان انتقال از یک حالت به حالت دیگر موجود باشد.یعنی حالات A ,B مرتبط هستند اگر و فقط اگر امکان انتقال ازA~B , B~A موجود باشد.میتوان مشاهده کرد که این کلاس های مرتبط  یک رابطه ی هم ارزی روی گراف مربوطه تعریف می کند.A~A زیرا به یکدسته مرتبط یکسان متعلق دارند،A~Bاگر ارA میری به Bباشد و از B به Aمسیر می باشد (تعریف مرتبط بودن)،و در اخر اگر A~B  , B~C انگاه A~C چون این .ضعیت ها مرتبط هستند پس مشابها" از C به B و B یه A مسیری هست.پس A~C.

*توجه داشته باشید که A,B به یک دسته ی مرتبط متعلق دارند اگرو فقط اگر از A به B  و از B به Aمسیری موجود باشد.۳ دستهی مرتبط روی زنجیر مارکوف تعریف می شود

 ۱. گذرا : وضعیت A گذراست اگر امکان عبور از A باشد به گونه ای که هرگز دوباره به A باز نگردیم

۲. لحظه ای : وضعیت A لحظه ای است اگر گذرا نباشد و به تعداد مضارب صحیح از یک عدد مثبت بزرگ تر از یک A را طی کند از این عدد صحیح به عنوان ! یا دوره ی وضعیت A نام برده می شود

۳. مانا : وضعیت A مانا است اگر گذرا و لحظه ای نباشد.

 

 شکل 1 این سه کلاس های مرتبط را نشان می دهد.

این گراف از 5 کلاس مرتبط که به صورت زیر دسته بندی می شوند تشکیل می شود : حالات a,b,c یک کلاس مرتبط تشکیل می دهد . برای بار اول که سیستم ازa به d  می رود نمی تواند به a بازگرددپس وضعیت هایa یاTransient هستند. وضعیت d خود یک کلاس مرتبط است . هنگامی که به d وارد می شویم و از آن می گذریم هرگز به آن باز نمی گردیم پس d نیز یک حالت گذراست . حالت e یک کلاس مرتبط است و Transient نیست هنگامی که برای اولین بار وارد e می شویم باز به آن باز می گردیم و جای دیگری نمی رویم پس e یک حالت مانا یا ergadic است حالت های f,g,h,i,j یک کلاس مرتبط را تشکیل می دهند . هرگاه به وضعیت آن ها وارد شویم هرگز از آن قسمت زنجیر خارج نمی شویم . پس این حالات گذرا نیستند اگر به وضعیت h نگاه کنیم در می یاببیم که با عدد period یا دوره ی ۳ به h باز می گردیم ( یعنی : h,j,i,h,g,f ) پس حالت h و هریک از حالات g,f,i,h لحظه ای یا periodic هستند حالات m,l,k نیز یک کلاس مرتبط تشکیل می دهند می بینیم که با وارد شدن به زنجیر m,l,k دیگر خارج شدن از آن ممکن نیست پس نمی تواند Transient باشد چون m دوره ی طوقه است periodic نیست و چون این سه حالت نه periodic هستند و نه Transient پس مانا هستند .

 زنجیر مارکوف و گراف های ساده :

گراف ساده  (G = (V,E را در نظر می گیریم با راس V که مجموعه ای است به صورت{V = {1,…,n  و یال E که مجموعه ای است به صورت E زیر مجموعه V x V با ! . فرض می کنیم که هر راس دارای طوقه باشد یعننی یالی از یک راس به همان راس به طوری که :       i,i) є E) و (...,i = 1,2,3)

یک زنجیر مارکوف زمان گسسته را به صورت زیر بر روی راس های دیگر این گراف تعریف می کند : یک وضعیت را در زمان t به صورت X(t) єV و …,t = 1,2   تعریف می کنیم . هر یال در این گراف با یک احتمال انتقال برچسب گذاری شده است . این احتمالات یالی باید مثبت باشند و مجموع احتمالات یال های متصل به هر راس با در نظر گرفتن طوقه (i,i) هر راس (X(t را در زمان  مربوط به آن راس t نشان می دهد

ما این زنجیر مارکوف را از طریق ماتریس انتقال احتمال P که P به Rn*n تعلق دارد تعریف می کنیم :

((Pij = P(X(t + 1 ) = j| (X(t = i

این ماتریس باید شرط های زیر را ایجاب کند :

۱.P>=0

۲.P.1 = 1

۳.P = PT

که نامساوی P ≥ 0 به این معنی است که به ازای هر i,j = 1,…,n  و Pi,j ≥ 0  و ۱ به معنای برداری است که همه درایه هایش ۱ است.شروط بالا به این معنی است که P  یک ماتریس متقارن است.همچنین :

Pi,j = 0 و (i,j) عضوی نیست از ε

که بیان می کند که انتقال فقط بین دو راسی بر قرار است که با یال به یکدیگر مربوط باشد.

 کاربردی از زنجیر مارکوف :

يكي از كاربردهاي بسيار مهم زنجير ماركوف، كاشي كاري تصادفي است كه روشي است براي پركردن تصادفي هر شكل دلخواه بوسيله‌ي كاشي هايي مستطيلي مشكل كه توضيحي از آن مي‌خوانيم :

يك دومينو (كاشي) يك مستطيل 1*2 (يا 2*1) است و كاشي كردن يك ناحيه بوسيله دومينوها راهي است براي پوشاندن آن ناحيه بوسيله دومينوها به طوري كه هيچ منطقه‌اي خالي از دومينو نباشد (سوراخي در شكل موجود نباشد.)

(ما ابتدا اين شيوه را براي الماس از تك توضيح مي‌دهيم و سپس آن را براي اشكال ديگر تعميم مي‌دهيم.)

يك الماس از تك از درجه n، ناحيه‌اي است مركب از 2n(n+1) واحد مربع، كه به صورت مجموعه‌اي از 2n رديف متمركز از مربع ها تشكيل شده كه رديف kام طولي به اندازه  min(2k,n-2k+2) دارد و هر دومينو روي آن به صورت مجموع هر دو واحد مربع كه ضلع مشترك دارند تعرف مي‌شود.

مشاهده مي‌شود كه كاشي كاري نشان داده شده در شكلتركيبي است از يك ناحيه دايروي بي قاعده كه مكان‌هاي كاشي ها با يكديگر تريب شده است و بوسيله 4 ناحيه از الگويي به صورت "ديوار آجري" محصور شده است.

 

                                         

                             

در اولين قدم، بايد توجه كرد كه 4 ناحيه ديوار آجري به واقع از يكديگر متفاوتند. ممكن است در اولين نگاه تفاوت ميان ناحيه بالاي الماس و ناحيه پايين الماس به نظر نرسد. براي اين منظور مربع‌ها را يك درميان سفيد و سياه رنگ مي‌كنيم. سپس از چپ به راست چك مي‌كنيم. مي‌بينيم كه رديف‌هاي نيمه‌ي بالاي الماس با يك مربع از يك رنگ شروع مي‌شوند در حالي كه رديف‌هاي

نيمه‌ي پاييني با مربعي از رنگ ديگر شروع مي‌شوند. پس هر دومينو در نيمه بالايي مربع سمت چپش سياه رنگ شده است و در نيمه پاييني مربع بسمت چپش سفيد رنگ مي‌شود. اين الگو برااي هر دومينو (افقي يا عمودي) صدق مي‌كند.

الگوريتم پراب – ويلسون روشي است براي رنگ آميزي تصادفي اين كاشي ها. در اين الگوريتم ابتدا هر ناحيه به دو بخش تقسيم مي‌شود (مانند الماس از تك) به طوري كه هيچ دو شكل داراي ضلع مشترك كرنگ نيستند. هر كاشي يك صورت سفيد و يك صورت سياه دارد. مثلاً در اشكال الماس از تك و شش وجهي منتظم، تقارن اين صورت‌ها (يكي در ميان سياه و سفيد)، باعث مي‌شود كاشي‌ها شبيه به يكديگر باشند. در دومينو و چهاروجهي نيز به همين صورت در هر قسمت، كاشي‌ها با توجه به فازهاي تقسيم بندي شان (2 و 4 و ...) رنگ‌آميزي مي‌شوند. اين فازها در گوشه‌هاي شكل الگويي آجري تشكيل مي‌دهند ولي در مركز شكل رنگ‌ها تصادفي هستند. بخش بزرگي از اين applet دراين رابطه است كه اين رنگ‌آميزي آجرها كجا متوقف مي‌شوند. ژ

براي تشكيل كاشي كاري، به هر رأس يك اندازه ارتفاع ابتدايي نسبت داده مي‌شود. برخي از رأس‌هاي بخصوص با دايره‌اي از كاشي ها محصور مي‌شود كه به اين معني است كه كاشي‌ها به دور رأسي مي‌روند كه رئوس سياه و سفيد را به يكديگر مرتبط مي‌كند. در اين حالت رأس موردنظر به صورت افقي يا عمودي قرار مي‌گيرد، بسته به اينكه كاشي‌هايي كه صورت‌هاي سياه و سفيد را مي‌پوشانند ساعتگرد حركت كنند يا پاد ساعتگرد. ارتفاع كاشي به صورت مجموع اين ارتفاع ها تعريف مي‌شود كه به گونه‌اي نرمال مي‌شوند كه كمترين مقدار آن صفر و بيشترين مقدار آن 1 است. الگوريتم پراب – ويلسون يك كاشي كاري يكتا با كمترين ارتفاع ممكن و با بيشترين ارتفاع ممكن در نظر مي‌گيرد و مكرراً اين چرخش ها را انجام مي‌دهد تا هر دو هم اندازه شوند.

سمت چپ هر applet، مينيمم كاشي كاري و در سمت راست ماكزيمم آن قرار دارد. زماني كه اين كاشي كاري شكل مي‌گيرد، بالا و پايين بردن تصادفي بر طبق تشكيل دايره‌هاي رنگي ذكر شده حول هر رأس انجام مي‌شود. با توجه به اينكه كاشي كاري min امكان حركت بالارونده‌ي بيشتري نسبت به حركت پايين رونده دارد، عدد كلي يا ارتفاع حركت بالابرنده به سرعت رشد مي‌كند.

اين عدد با شيب بالاي خط آبي در گراف پايين شكل مطابقت مي‌كند. همان طور كه كم كم به شيب ميل مي‌كند، مي‌بينيم كه هر دو گراف به اين خط ميل مي‌كنند و همگرا مي‌شوند. يعني در آخر هر دو شكل به ارتفاع ميانه‌اي همگرا مي‌شوند. هنگامي اين دو همگرا مي‌شوند، كاشي كاري ديگر به طور كامل تصادفي نخواهد بود.

توجه : برای دیدن applet های اشکال زیر روی انها کلیک کنید.

 

مربع : يك مربع از درجه ۸ 

 

 

  شش وجهي : در اين شكل عمل هاي بالا و پايين برنده، به صورت كم و زياد شدن يك مكعب نشان داده مي‌شوند. در اين شكل نيز نظير الماس از تك، نواحي دايره‌اي در وسط شكل به صورت رندوم هستند و نواحي مرزي به صورت الگوي آجرچيني.

 

 

دژ : اين ناحيه از مثلث‌هاي 45-45-90 تشكيل شده‌اند و داراي دونوع كاشي كاري هستند. يك نوع از بهم پيوستن مثلث‌ها روی قطرشان تشكيل مي‌شود كه يك مربع بدست مي‌دهد و نوع ديگر از بهم پيوستن دو مثلث روي يكي از دو ضلع ديگر بوجود مي‌آيد كه تشكيل يك مثلث بزرگتر مي‌دهند. به همين جهت همگراشدن اين شكل بيشتر از اشكال ساده‌ي ديگر طول مي‌كشد. در مورد نواحي دايره‌اي هنوز تحقيقات ادامه دارد.

 

 

سياهچال : اين ناحيه از مثلث‌هاي 30-60-90 تشكيل شده‌اند و سه نوع كاشي كاري در آن موجود است كه هركدام از بهم چسباندن دو مثلث از يكي از اضلاع آنها بدست مي‌آيد. در نتيجه همگراشدن اين بسيار طولاني تر از اشكال ذكر شده ديگر است.

 

نمونه های دیگر از کاشیکاری اشکال به وسیله الکوریتم پراب - ویلسون :

۱.Randomly created 3-D Young diagram  (دیاگرام تصادفی یانگ) :

 

.

 

۲. Order 40 Alternating Sign Matrix tiled with gaskets and baskets

 

 

۳Randomly tiled order 35 fortress (کاشی کاری تصادفی دژ مرتبه ۳۵) :    

 

 

۴.Randomly tiled order 25 octagon (کاشیکاری تصادفی هشت وجهی مرتبه ۲۵)

 

 

۵.Randomly tiled order 50 Aztec Diamond, showing differences in its local statistics(کاشیکاری تصادفی الماس  ازتک)

 

              Aztec Diamond

+ نوشته شده در  شنبه سی ام مهر 1384ساعت 13:42  توسط انجمن علمی   | 

متغیر تصادفی

متغير تصادفي

متغير تصادفي
متغير تصادفي گسسته
متغير تصادفي پيوسته
متغير تصادفي گسسته
 تابع چگالي احتمال
خواص تابع چگالي احتمال
تابع توزيع تجمعي
خواص تابع توزيع تجمعي
اميد رياضي
واريانس
متغير تصادفي پيوسته
تابع توزيع احتمال
 تابع توزيع تجمعي
اميد رياضي
واريانس


تعريف متغير تصادفي
متغير تصادفي, عددي است حقيقي که به پيشامدهاي حاصل از يک آزمايش نسبت داده ميشود. با نسبت دادن اعداد به پيشامدها ميتوان آنها را به صورت کمي بيان کرد. به¬عنوان مثال در آزمايش پرتاب سکه بجاي ذکر نتيجه به صورت رو يا پشت مايليم نتيجه را به صورت عددي بيان کنيم. متغير تصادفي به هر يک از نتايج آزمايش    به صورت يکتا عددي را نسبت مي¬دهد.
اگر v يک پيشامد مورد نظر در فضاي نمونه w باشد, تابع (X(vکه تابعي از پيشامد v است, يعني مقدار آن بستگي به وقوع v در آزمايش دارد, متغير تصادفي ناميده مي¬شود. ( X(v عددي حقيقي و نگاشتي از w در R است. براي اختصار ( X(v را به صورت   نمايش مي¬دهند.
متغيرتصادفي به دو صورت متغير تصادفي گسسته و متغير تصادفي پيوسته وجود دارد.
 متغير تصادفي گسسته
متغير تصادفي گسسته, فقط مقادير گسسته اي مانند 0,1,2,3,.. را خواهد داشت. اين مجموعه مي¬تواند شمارش پذير باشد يا نباشد.
متغير تصادفي پيوسته
وقتي مجموعه مقادير متغير تصادفي ممکن باشد متغير تصادفي را پيوسته گوييم.
مثال:
1- در آزمايش ده بار پرتاب سکه, متغير تصادفي X تعداد دفعاتي است که رو مي¬آيد. در اينصورت X مي¬تواند مقادير 0,1,…,10 را داشته باشد. در اينجا X يک متغير تصادفي گسسته مي¬باشد. همچنين تعداد تلفنهايي که در فاصله زماني معين به يک شرکت زده مي¬شود متغير تصادفي گسسته X است که مقادير x=0,1,..,n,.. را مي¬توان به آن نسبت داد.
 2- براي زمان کارکرد يک لامپ, چنانچه متغير تصادفي Y نشان¬دهنده طول عمر لامپ باشد, مي¬تواند مقادير حقيقي مثبت داشته باشد بنابراين Y  متغير تصادفي پيوسته مي¬باشد.
تابع چگالي احتمال
تابع چگالي احتمال متغير تصادفي گسسته, احتمال مربوط به مقادير ممکن متغير تصادفيي گسسته را به دست مي¬دهد. به عبارت ديگر تابع چگالي احتمال متغير تصادفيي گسسته X, تابعي است که احتمال p(X=xi) را نشان مي¬دهد.
 
  را تابع چکالي احتمال متغير تصادفي X گويند.
خواص تابع چگالي احتمال
تابع چگالي احتمال شرطهاي زير را برآورده مي¬کند:
 
تابع توزيع تجمعي
تابع توزيع تجمعي متغير تصادفي, احتمال اينکه متغير تصادفي X کوچکتر يا مساوي x باشد را به¬دست مي¬دهد, که آنرا با F(x) نشان مي¬دهيم.
 
خواص تابع توزيع تجمعي
تابع توزيع F(x) در مورد هر متغير تصادفي X داري خواص زير است:
 
تابع توزيع F(x) ,وقتي x افزايش مي¬يابد غير نزولي است.  F(x) در مورد متغيرهاي تصادفي گسسته شکل بسيار ساده¬اي دارد و اغلب به صورت پله¬اي است و در نقاط ناپيوستگي, F(x) از راست پيوسته است. به اين ترتيب احتمال اينکه متغير تصادفي X در فاصله آلفا و بتا قرار بگيرد برابر است با
 
اميد رياضي
اميد رياضي متغير تصادفي, مقدار ميانگين آن¬ را نشان مي¬دهد. که اطلاعات مختصر و مفيدي در رابطه با نحوه توزيع مقادير متغير تصادفي را به دست مي¬دهد. اميد رياضي متغير تصادفي X را با E(x)يا   نشان مي¬دهيم.
 
دو متغير تصادفي با اميد يکسان ممکن است توزيع¬هاي کاملا متفاوتي داشته باشند از اينرو واريانس را تعريف مي¬کنيم که حاوي اطلاعات مفيدتري است

چرا متغير تصادفي تعريف مي کنيم؟

 

در تعريف فضاي نمونه يک آزمايش لازم نيست نتيجه­ي پيشامد مفروضي حتما يک عدد باشد. مثلا فضاي نمونه­ي مربوط به دو بار پرتاب يک سکه را مي توان به صورت زير نشان داد.

 

S = {HH ,HT, TH, TT}

 

پديده هاي تصادفي متعددي نيز وجود دارند که نتايجشان زير مجموعه­هايي از اعداد حقيقي اند.مانند عمر انسان، مسافت طي شده به وسيله ي يک خودرو به ازاي مقدار معيني سوخت و...، همه نمونه هايي از پديده هاي احتمالي هستند که نتايج آنها زير مجموعه هاي اعداد حقيقي اند.

نکته اينجاست که آزمايش چه نتايج عددي به دنبال داشته باشد و چه نداشته باشد، تقريبا در همه موارد ما به نتايج عددي علاقه منديم. براي اين منظور به قانون و يا قاعده اي نياز منديم که از طريق آن بتوان فضاي نمونه ي آزمايش را به فضاي اعداد حقيقي تصوير کرد.

اين نقش را متغير تصادفي به عهده مي گيرد.

 

 

 

تعريف متغير تصادفي: تابعي است که از فضاي نمونه يک آزمايش به مجموعه اعداد حقيقي تعريف مي شود X:S → R

 

در بسياري موارد ما ناگزيريم که متغير تصادفي تعريف کنيم.

در آزمايشهايي نظير:

 

-يک واکنش شيميايي

-فوتون هاي ساطع شده از توسط يک ليزر

 

نمي توان توصيف دقيقي از فضاي نمونه (Sample Space) داشت، اما مي توان با اندازه گيريهاي مشخصي اين فرايند ها را به صورت رياضي توصيف کرد.

مثلا در موارد فوق مي توان اندازه گيري هاي زير را انجام داد.

 

-تغيير دماي حاصل از آزمايش

-تعداد فتونهاي ساتع شده در يک ميليونيم ثانيه

 

بنابراين مي توان متغير تصادفي را به عنوان اندازه­گيري يک آزمايش تجربي در نظر گرفت که به فضاي نمونه يک مقدار حقيقي نسبت مي دهد.

 

متغير تصادفي گسسته

 

متغيري است که تنها مي تواند مقادير گسسته نظير 1، 2، 3و... را بگيرد متغير تصادفي گسسته معمولا(و نه لزوما) شمارا است.

 

تعداد فرزندان يک خانواده

تعداد مراجعات به مطب يک پزشک در روز

تعداد لامپهاي معيوب در يک جعبه صد تايي

 

نمونه هايي از متغير تصادفي گسسته هستند.

توزيع احتمال متغير تصادفي گسسته جدولي است که احتمال مربوط به هر مقدار ممکن آن متغير را بدست مي دهد که به آن تابع احتمال نيز گفته مي شود.

 

مثال

فرض کنيد متغير تصادفی X مي تواند مقادير 1، 2، 3 و يا 4 را بگيرد.که احتمال مربوط به هر يک از اين مقادير با جدول زير بدست مي آيد

 

پيشامد

1

2

3

4

احتمال

0.1

0.3

0.4

0.2

 

احتمال اين که X مقادير 2 يا 3 بگيرد برابر است با :

 

P(X = 2 or X = 3) = P(X = 2) + P(X = 3) = 0.3 + 0.4 = 0.7

به همين طريق احتمال پيشامد هاي بزرگتر از 1 برابر است با :

1 - P(X = 1) = 1 - 0.1 = 0.9

 

براي متغير تصادفي X تابع F که روي بازه­ي (-∞,+∞)  به صورت F(t)=P(X≤t) تعريف مي شود را تابع توزيع X يا گاهي تابع توزيع تجمعي X مي ناميم.

 

تابع توزيع براي متغير تصادفي مثال بالا به صورت زير محاسبه مي شود:

 

احتمال آن که X کوچکتر يا مساوي 1 باشد برابر است با: 0.1

احتمال آن که X کوچکتر يا مساوي 2 باشد برابر است با: 0.1+0.3 = 0.4

احتمال آن که X کوچکتر يا مساوي 3 باشد برابر است با: 0.1+0.3+0.4 = 0.8

احتمال آن که X کوچکتر يا مساوي 4 باشد برابر است با: 0.1+0.3+0.4+0.2 = 1

 

 

متغير تصادفي پيوسته

 

مقادير ممکن متغير تصادفي پيوسته مجموعه­ي مقادير حقيقي شمارش ناپذير است.

 

فاصله زمان انتشار دو ذره

دامنه­ي تشخيص يک رادار

خطاي اندازه گيري

 

نمونه هايي از متغير تصادفي پيوسته هستند.

 

براي متغير تصادفي X فرض کنيد يک تابع حقيقي مقدار نا منفي مانند f:R→[0,∞) وجود دارد که براي هر زير مجموعه اعداد حقيقي مانند A داشته باشيم:

 

 

 

تابع f را تابع چگالي احتمال X مي ناميم.

براي هر متغير تصادفي پيوسته با تابع چگالي احتمال f(X) داريم:

يعني مجموع احتمال روي کل بازه برابر 1 است.

 

مثال

X يک متغير تصادفي پيوسته است با تابع چگالي پيوسته

 f(x) = cx  براي 0 ≤ x < 1 مقدار ثابت c را بيابيد

طبق فرمول بالا اگر انتگرال f(x) را بين مقادير 1 و صفر را برابر 1 قرار دهيم مقدار ثابت بدست مي آيد.

c = 2      

بررسي دقيق تر تابع توزيع متغيرهاي تصادفی

 

توزيع احتمال گسسته

 

در مورد هر متغير تصادفي گسسته مانند X با مجموعه­ي مقدير ممکن A ، توزيع احتمال مي تواند در قالب فرمول، جدول يا شکلي نشان داده شود که احتمال

 

0≤ P(X=x) = p(x) ≤1

 

را به هر يک از مقادير x تخصيص مي دهد. در اين صورت:

 

*      p(x)=0 براي xهايي که عضو A نيستند.

*      ∑ p(x) =1 براي همه­ي xهاي عضو A .

 

در بسياري از موارد به محاسبه­ي احتمال اينکه مقدار متغير تصادفي X کوچکتر يا مساوي مقدار معلوم x باشد، علاقمنديم.اگر اين احتمال را به صورت:

 

F(x) = P(X ≤ x)

 

بنويسيم، آنگاه تابع F(x) به نام تابع توزيع تجمعي متغير تصادفي X ناميده مي شود و به اختصار با cdf(Cumulative Distribution Function) نشان­داده مي­شود. بعضي از خصوصيات تابع توزيع تجمعي عبارت است از:

 

*      0 ≤ F(x) ≤ 1

*      F غير نزولي است.

*      Lim x ∞ F(x) = 1

*      Lim x -∞ F(x) = 0

*      F از سمت راست پيوسته است.

 

توزيع احتمال پيوسته

 

اين که يک متغير تصادفي پيوسته دقيقاَ يکي از مقاديرش را بگيرد، درست مانند انتخاب يک نقطه از تعداد نا محدود نقاط فضاي آزمايش است، و به همين دليل احتمالي برابر صفر دارد. در نتيجه، تابع توزيع يک متغير تصادفي پيوسته را نمي­توان در قالب يک جدول نشان داد.

در اين حالت در مورد احتمال نظير يک فاصله (بازه) از مقادير متغير تصادفي نظر مي دهيم.

اگر چه توزيع احتمال يک متغير تصادفي را نمي توان در قالب يک جدول نشان داد، ولي مي توان ان را در قالب يک فرمول رياضي بيان کرد. اين فرمول لزوماَ تابعي است از مقادير عددي متغير تصادفي X که با نماد f(x) نشان داده مي­شود و تابع چگالي احتمال و يا به عبارت ساده تر چگالي احتمال متغير تصادفي X ناميده مي شود و اختصاراَ با pdf(probability density function) نشان داده مي شود. تابع چگالي احتمال در روابط زير صدق مي کند:

توزيع تجمعي متغير تصادفي پيوسته  X با چگالي احتمال f(x) عبارت است از:

لینک های مفید در رابطه با متغیر تصادفی

 

 

http://home.jesus.ox.ac.uk/~clifford/a5/chap1/node1.html

 

http://www.mathsrevision.net/alevel/statistics/continuous_random_variables.php

 

http://www.stat.yale.edu/Courses/1997-98/101/ranvar.htm

 

http://www.ed.uiuc.edu/courses/epsy480/notes/l1516.htm

 

http://library.wolfram.com/conferences/devconf99/rose/Links/Rose_mathStatica_lnk_6.html

 

http://people.hofstra.edu/faculty/Stefan_Waner/cprob/cprob1.html

 

http://www.stats.gla.ac.uk/steps/glossary/probability_distributions.html#indeprandvar

 

http://economics.about.com/library/glossary/bldef-independent.htm

 

 

+ نوشته شده در  شنبه سی ام مهر 1384ساعت 13:41  توسط انجمن علمی   | 

انجمن علمی آمار دانشکده علوم دانشگاه علوم کشاورزی و منابع طبیعی گرگان به شما دوست عزیز خوش آمد می گوید.امیدواریم لحظات خوبی با ما داشته باشید

+ نوشته شده در  شنبه سی ام مهر 1384ساعت 13:24  توسط انجمن علمی   |