بیگ دیتا

قسمت چهارم: مدل کردن یا برازش منحنی روی داده ها در پایتون

قسمت چهارم: مدل کردن یا برازش منحنی روی داده ها در پایتون

فرض کنید یک سایت خرید داریم، که میزان خرید با سرعت لود شدن صفحه سایت ارتباط دارد. حال میخواهیم این ارتباط را مدل کنیم. در برنامه زیر ابتدا یک سری داده ها فرضی از میزان خرید و سرعت لود شدن صفحه سایت تولید می کنیم. سپس قسمتی از داده ها را برای مدل کردن منحنی مشاهده ادامه مطلب…

قسمت سوم: ارتباط بین سن بازدیدکنندگان وبسایت و احتمال خرید آن ها با استفاده از احتمال شرطی

قسمت سوم: ارتباط بین سن بازدیدکنندگان وبسایت و احتمال خرید آن ها با استفاده از احتمال شرطی

در مثال زیر میخواهیم ارتباط بین سن خریداران و میزان خرید آن ها را متوجه شویم. بنابراین فرض می کنیم دو دیکشنری زیر مربوط به دهه های سنی مختلف از 20 تا 70 سال باشد باشد:

  ابتدا یک دیتافریم از این دیکشنری ها تشکیل می دهیم:

  ترکیب دو دیتافریم :

مشاهده ادامه مطلب…

قسمت دوم: محاسبه پارامترهای آماری رایج در پایتون

قسمت دوم: محاسبه پارامترهای آماری رایج در پایتون

قبل از شروع لازم است تا ماژول های لازم را فراخوانی نمایید :

  تولید اعداد تصادفی به صورت توزیع نرمال مربوط به دستمزد کارگران

نمایش هیستوگرام 50 تکه ای مربوط به داده های بالا

محاسبه میانگین و میانه  

محاسبه انحراف معیار و واریانس

  نمایش بیشتر فراوانی یا مشاهده ادامه مطلب…

قسمت اول: مروری بر ماژول تحلیل داده و ساختار ساز Pandas

قسمت اول: مروری بر ماژول تحلیل داده و ساختار ساز Pandas

ابتدا لازم است تا این ماژول را از سایت http://pandas.pydata.org/ دریافت کرده و نصب کنید. و از طریق خط فرمان cmd با استفاده از دستور pip install pandas به راحتی نصب کنید. قبل از شروع لازم است تا ماژول های لازم را فراخوانی کنید به این صورت :

  سه ساختار در pandas پشتیبانی مشاهده ادامه مطلب…