ابزارهایی که با بررسی فایلهای متنی یا چند رسانهای به کاوش در دادهها میپردازند سنجههای گوناگونی را ملاک عمل قرار میدهند که از آن جمله به موارد زیر میتوان اشاره کرد: قواعد انجمنی (Association): الگوهایی که بر اساس آن ...
به طور کلی هر چه ابعاد یا همان تعداد ویژگی های مسأله مورد کاوش بالاتر رود، باعث خواهد شد رکوردها در فضای جستجو پراکنده تر شوند. یکی از روش ها روش انتخاب زیر مجموعه ای از ویژگیها بود. البته در آن روش ویژگی هایی که ارزش ...
در این مبحث ما با تکنیک های داده کاوی آشنا می شویم. با پیشرفت فناوری اطلاعات، تعداد زیادی پایگاه داده در زمینه های مختلف ایجاد شده است. در نتیجه، نیاز به ذخیره و تغییر در داده های مهم، که بعداً می توان از آن ها برای تصمیم ...
در همین راستا کتاب و حل المسائل داده کاوی هان ویرایش 4 قابل دانلود است. داده کاوی فرآیند جستجو و تجزیه و تحلیل دسته بزرگی از داده های خام به منظور شناسایی الگوها و استخراج اطلاعات مفید است.
در این مطلب از چهار سرنام برای هر مجموعه داده استفاده شده است که هر یک در ادامه شرح داده شدهاند. (ک) کلاسیک: موارد دارای این نشان برخی از محبوبترین و یا قدیمیترین مجموعه دادههای حوزه هوش ...
دادهکاوی یک زمینه علمی دارای رشد سریع است که با عنوان کشف دانش از داده (Knowledge Discovery From Data | KDD) نیز شناخته میشود. در این مطلب به دلایل استفاده از دادهکاوی و تعاریف آن (با توجه به فرآیند انجام دادهکاوی) پرداخته میشود ...
دادهکاوی دو هدف اصلی پیش بینی و توصیف دارد. پیشبینی شامل استفاده از برخی متغیرها در مجموعه دادهها به منظور پیشبینی مقادیر ناشناخته سایر متغیرهای مرتبط است (مانند طبقهبندی، رگرسیون، و تشخیص ناهنجاری).
داده کاوی تمام الگوهای غیرعادی را که از حالت عادی و نرمال انحراف دارند و ممکن است منجر به کلاهبرداری شوند را پیدا می کند. نتایج داده کاوی حالت های مختلفی را که مفسر باید در مراحل بعدی تحقیق کند ...
الگوریتم در دادهکاوی به معنای یک مجموعه مرتب و تعیین شده از مراحل و مراحل محاسباتی است که برای حل یک مسئله یا انجام یک وظیفه خاص در حوزه دادهکاوی به کار میرود. ... هدف اصلی Isomap، حفظ فواصل ...
مفهوم داده کاوی از مدت ها قبل از عصر دیجیتال با ما بوده است. ایده بهکارگیری داده ها در کشف دانش قرن هاست که با فرمول های دستی برای مدل سازی آماری و تحلیل شروع شده است. در دهه 1930، آلن تورینگ ایده یک ماشین محاسباتی جهانی را ...
در این مقاله تمام نکات مهم و اساسی در مورد داده کاوی را آموزش خواهیم داد . داده کاوی با هدف کشف الگوهای موجود در داده های جمع آوری شده ، به بررسی پایگاه های بزرگ داده می پردازد .
در این نوشتار به موضوع مدیریت داده گمشده در داده کاوی به زبان پایتون پرداختیم. از آنجایی که یکی از مراحل اصلی در داده کاوی، عمل پاکسازی دادهها است، بررسی داده گمشده بسیار مهم جلوه میکند.
دادهکاوی (به انگلیسی: Data Mining) به مفهوم استخراج اطلاعات نهان یا الگوها و روابط مشخص در حجم زیادی از دادهها در یک یا چند بانک اطلاعاتی بزرگ گفته میشود.بسیاری از مردم داده کاوی را مترادف واژههای رایج کشف دانش در ...
در روش بالا از کتابخانه scikit-learn با استفاده متد make_circles یک مجموعه داده برای تولید یک بردار هدف دو کلاسه و دو ویژگی شبیه سازی شده است . make_circles داده ها را به صورت خطی از هم جدا نمی کند.
در ادامه برخی از نکات کلیدی و مهم پیرامون چیستی داده کاوی فهرست شده است. داده کاوی فرایند تجزیه و تحلیل دستههای بزرگی از اطلاعات و تشخیص روندها و الگوها تعریف میشود.
مثلاً محدودیتهایی برای دانشجویان مشروط شده در پایگاه داده اعمال میشود تا نتوانند بیشتر از 1۴ یا 1۲ واحد در ترم بعدی اخذ کنند. ... مهارتهای سازمانی، توانایی بالا در حل مسئله، توجه به جزئیات ...
فرایند داده کاوی تاریخچه طولانی دارد.در قدیم ، به این فرآیند ، کشف دانش میگفتند.اما به شکل کلی ، دیتا ماینینگ ( داده کاوی ) در دهه ی 1990 میلادی ساخته شد.اولین بار در سال 1995 ، اصطلاح داده کاوی توسط ...
مسئله «مقادیر گمشده» (Missing Values) در «علم داده» (Data Science) و بخصوص «دادهکاوی» (Data Mining)، زمانی رخ میدهد که یک یا چند مشاهده دارای مقدارهایی ثبت نشده یا ناموجود در ستونهای «چارچوب اطلاعاتی» (Data Frame) هستند. در چنین حالت می ...
ابزارهای داده کاوی رایگان از محیط های توسعه کامل مدل مانند Knime و Orange تا انواع کتابخانه های نوشته شده در جاوا، C++ و اغلب در پایتون را شامل می شود. چهار نوع کار معمولاً در داده کاوی وجود دارد:
تقریباً همه مجموعه داده های دنیای واقعی مقادیر از دست رفته missing value دارند، برای حذف، پر کردن یا جایگزینی داده های گم شده شناسایی نوع آن از دست رفتن داده مهم است و این یک مشکل جدی است که باید پاسخگوی آن باشیم.
کتاب ها همواره یکی از اصلی ترین منابع دانش و اطلاعات بوده اند، دانشجویان و طالبان علم سعی می کردند با مطالعه کتاب ها در مورد یک موضوع، دانش کافی را اخذ کنند. در این سلسله مقالات کتاب های چاپ شده در حوزه های مختلف علم داده ...
داده کاوی آموزشی یکی از حوزه های داده کاوی است که با سرعت غیر قابل باوری در حال رشد است. این نوع داده کاوی به ایجاد راه هایی برای کشف اطلاعات از داده های حاصل از محیط های آموزشی می پردازد.
داده کاوی اطلاعات ارزشمندی را در اختیارما قرارمیدهد، دراین مقاله ابتدامفهوم آن را توضیح میدهیم و سپس مراحل و نرمافزارهای مورداستفاده آن رامعرفی میکنیم
تحلیل مولفه اساسی (PCA) یا (Principal Component Analysis) یک «روش تبدیل خطی» (Linear Transformation Technique) ساده و در عین حال محبوب و کارآمد محسوب میشود.از این روش در کاربردهایی مانند پیشبینی بازار بورس، تحلیل دادههای بیان ژن و بسیاری از دیگر ...
به دلیل اهمیت بالای داده کاوی و کاربردهای متنوع آن در انجام امور مختلف، قصد داریم در ادامه این مطلب به انواع تکنیک های داده کاوی بپردازیم و کاربرد آنها را در حل مسائل مختلف بررسی کنیم.
داده کاوی یکی از روشهای حل مساله است که تحلیل مورد نیاز را بر روی حجم زیادی از دادهها انجام میدهد و با استخراج تعدادی الگوی تکرارشونده، برای چالشهای موجود راهحل مناسب ارائه میکند.
دادهکاوی (Data Mining) علم استخراج الگوها، اطلاعات و تحلیل از مجموعه دادههای خامی است که در یک سازمان و یا یک جامعه یا هر مجموعه دیگری تولید شده است.
داده کاوی، عبارت است از مرتبسازی کلاندادهها برای یافتن الگوها و رابطهها با هدف حل مسائل. در واقع، در داده کاوی، با آنالیز کلاندادهها، به سوالات مختلف جواب میدهیم.
به عنوان مثال، اگر دادههای 1، 3، 5 و 7 را به عنوان تعداد قطعات فروخته شده در چهار روز متوالی در نظر بگیریم، اطلاعات میتواند نشان دهد که فروش در حال افزایش است.
داده کاوی فرآیندی است که برای استخراج داده های مهم از مجموعه بزرگتری از داده خام استفاده می شود. این به معنای تجزیه و تحلیل در دسته زیادی از اطلاعات با استفاده از یک یا چند نرم افزار است.
روشهای کامپیوتری قدرت بیسابقهای را به دادهکاوی بخشیدهاند، اما در عین حال، شانس آنکه برخی روشها به صورت کورکورانه و بدون توجه به کاربرد آنها در مسائل مورد استفاده قرار بگیرند نیز افزایش دادهاند. بینش تحلیلی با هیچ نرمافزار کاربردی عرضه …
یکی از اولین نمونههای داده کاوی در سال 1936 رخ داد ... شما میتوانید از داده کاوی برای حل تقریباً هر مشکل تجاری که در رابطه با تنظیم دادهها است استفاده کنید، از جمله: ... دادههای تولید شده ...
اخیراً، طبقهبندی داده های نامتوازن به یکی از چالشهای مهم در زمینهی یادگیری ماشین و دادهکاوی تبدیل شده است. دادهی نامتوازن به دادههایی گفته میشود که در آنها، نمونهها به طور غیریکنواخت و نامتوازن بین کلاس ...
دو برنامه راهبردی زیر برای حل مشکل دادههای پِرت در دسترس متخصصان داده کاوی قرار دارد. ... برای مثال، برای انتساب هوشمند مقادیر گمشده در دادهها، تنها باید پکیج scikit learn's impute library را نصب و از ...