مروری بر مفاهیم و الگوریتمهای داده کاوی1
چکیده:
داده کاوی شامل بهره گیری از ابزارهای آنالیز داده های پیچیده برای کشف الگوهای موجود و روابط ناشناختهی میان داده ها در حجمی وسیع می باشد. این ابزارها شامل مدلهای آماری، الگوریتمهای ریاضی و متد های یادگیری ماشین (الگوریتمهایی که بازدهی خود را بصورت خودکار از طریق تجربه افزایش می دهند، مانند شبکه های عصبی و درختهای تصمیم گیری) می باشد. نتیجتاً داده کاوی علاوه بر جمع آوری و مدیریت دادهها، در بر گیرنده ی آنالیز و پیش بینی هایی نیز می باشد. داده کاوی می تواند بر روی داده های ارئه شده در فرمهای عددی، متنی و یا چند رسانه ای اعمال شود و کشف پولشویی و فساد مالی و بدست آوردن نتایج راهبردی جهت تصمیم گیری های آینده از مهمترین کاربردهای آن می باشد.
کلمات کلیدی: داده کاوی، انبار داده ها، اکتشاف علوم.
1- مقدمه:
با گسترش روز افزون استفاده از بانکهای اطلاعاتی رابطه ای و انبارهای داده جهت نگهداری اطلاعات شرکتها و سازمانها، همچنین اهمیت انکارناپذیر استفاده از رخدادها و اطلاعات گذشته جهت تصمیم گیری های آینده، نیاز به استفاده از روشهایی علمی جهت تحلیل اطلاعات موجود و دریافت نتایج مورد نظر بیش از گذشته مورد توجه قرار گرفته است. با توسعه ی کاربردی علم آمار، مفاهیم بنیادی داده کاوی مطرح شده و تحقیقات در این زمینه آغاز شد. نتایج حاصله عبارتند از روشها و الگوریتمهای متفاوت مطرح شده در این زمینه.
آنچه پیش روی شما قرار گرفته، مروری است بر مفاهیم و الگوریتمهای داده کاوی، که در 10 بخش ارائه میشود.
این بخشها عبارتند از: مقدمه، تعریف، زیر بنای داده کاوی، تکنولوژی های مرتبط با داده کاوی، داده کاوی و مفهوم اکتشاف علوم، بررسی اینکه چه نوع دادههایی میتوانند مورد کاوش قرار گیرند، بررسی اطلاعات مناسب برای داده کاوی، نگاهی مختصر به الگوریتمهای داده کاوی و نهایتا با معرفی کاربرد علم آمار و روشهای آماری در داده کاوی و نتیجه گیری کلی مطلب خاتمه می یابد.
- تعریف داده کاوی:
عبارت داده کاوی مترادف با یکی از عبارت های استخراج دانش، برداشت اطلاعات، وارسی داده ها و حتی لایروبی کردن داده هاست که در حقیقت کشف دانش در پایگاه داده ها (KDD ) را توصیف می کند. بنابراین ایده ای که مبنای داده کاوی است یک فرآیند با اهمیت از شناخت الگوهای بالقوه مفید، تازه و در نهایت قابل درک در داده هاست. واژه کشف دانش در پایگاه داده ها در اوایل دهه 80 در مراجعه به مفهوم کلی، گسترده، سطح بالا و به دنبال جستجوی دانش در اطلاعات شکل گرفته است. داده کاوی کاربرد سطح بالای فنون و ابزار بکار برده شده برای معرفی و تحلیل داده ها ی تصمیم گیرندگان است. اصطلاح داده کاوی را آمار شناسان، تحلیل گران داده ها و انجمن سیستم های اطلاعات مدیریت به کار برده اند، در حالی که پژوهشگران یادگیری ماشین و هوش مصنوعی از KDD (اکتشاف علوم) بیشتر استفاده می کنند. برنامه های کاربردی داده کاوی می توانند ازپارامترهای متنوعی برای رسیدگی به داده ها استفاده کنند. برخی از این پارامتر ها برای رسیدگی به داده ها بشرح زیر می باشند:
· ترکیبیات: نمونه هایی که در آنها یک رویداد به رویداد دیگری وابسته است، همچون خرید یک خودکار و خرید کاغذ.
· تحلیل ترتیب یا روش: نمونه هایی که در آنها انجام یک رویداد منجر به رویداد دیگری میشود، همچون تولد یک نوزاد و خرید مایحتاج مورد نیاز او.
· طبقه بندی: شناسایی نمونه های جدید، مثل تطابق بین لوله های خریداری شده و درپوش های پلاستیکی آنها.
· دسته بندی: یافتن و مستند سازی بصری گروههایی از حقایق ناشناخته ی قبلی، مثل موقعیت جغرافیایی و نشان های تبلیغاتی.
· پیش بینی: کشف و یافتن نمونه هایی که بتوان از آنها پیشبینی های منطقی بعمل آورد، مثلا افرادی که در یک کلوپ ورزشی سرمایه گذاری می کنند ممکن است در کلاسها و برنامه های ورزشی شرکت کنند.
برنامه های کاربردی داده کاوی در مقایسه با سایر برنامه های کاربردی تحلیل داده همچون Structured Query که در اکثر بانکهای اطلاعاتی تجاری بکار میرود، یا نسبت به نرم افزارهای آماری، تفاوتهای قابل ملاحظه ای دارد. در دسترسی بر پایه ی اثبات، جایی که کاربر یک فرضیه را بسط میدهد و سپس داده ها را از جهت پوشش یا عدم پوشش فرضیه مورد آزمون قرار می دهد، ابزارهای تحلیلی بسیار ساده تری مورد استفاده قرار می گیرند; مثلا کاربر ممکن است فرض کند مشتری خریدار یک چکش، ممکن است نیازمند یک جعبه ابزار صنعتی نیز باشد. تاثیر این رویکرد میتواند با خلاقیت کاربر در توسعه ی فرضیات مختلف، محدود شود. در واقع داده کاوی یک رویکرد اکتشافی بکار میبرد که در آن می توان از الگوریتمها برای بررسی و تجزیهی چندین رابطه ی داده ای چند بعدی، بصورت همزمان و با شناسایی موارد منحصر بفرد، استفاده کرد. برای مثال یک فروشگاه قطعات سخت افزاری ممکن است قدرت خرید مشتریان خود را با ابزارهایی از قبیل مالکیت خانه، نوع اتومبیلی که سوار می شوند، سن، حرفه، درآمد و یا فاصله ی محل اقامت تا فروشگاه بسنجد. نتیجتا دو مهم در اعمال داده کاوی موفق دخیل هستند:
· فرمولاسیون واضح و مشخص برای حل مساله.
· دسترسی به داده های مناسب و درست.
در بازتاب مفهوم سازی عمومی داده کاوی ، برخی مشاهدات انجام شده، داده کاوی را بعنوان تنها یک مرحله از یک پردازش وسیعتر با نام اکتشافات علوم در پایگاه های داده ای شناخته شده، مورد توجه قرار می دهند.
http://www.microrayaneh.com
آخرین محصولات
|
|
|
||||||
|
|
|
||||||
|
|
|
مقالات
برنامه نویسی و پایگاه های داده نرم افزارهای تحت وب نرم افزارهای کامپیوتر موتورهای جستجو و بهینه سازی سایت شبکه ، سرور و میزبانی وب سخت افزار و قطعات کامپیوتر گرافیک ، انیمیشن و تدوین وسایل صوتی و تصویری امنیت ، هک ، کرک اینترنت آموزش ها لینک ها تستاخبار
اخبار دنیای رایانه در ایران اخبار دنیای رایانه در جهان اخبار اینترنت در جهان اخبار اینترنت در ایران اخبار امنیت و هک وب سایت های ایرانیآخرین محصولات
|
|
ویدئو پروژکتور اپسون Epson EB-445Wi
قیمت: 1 ﷼ |
|
|
تدی Teddy
قیمت: 1 ﷼ |
|
|
پاندا Panda
قیمت: 1 ﷼ |
|
|
موش Mouse
قیمت: 1 ﷼ |
|
|
ببر سیاه Black Panther
قیمت: 1 ﷼ |
| محصولات جدید | |
ورود كاربر
آمار
بازدید كننده: 982079رأی گیری
تبادل لینک فقط با پیج رنک 4 و 5: پنل اس ام اس | ایران تجارت | موبایل | بهترین سایت تفریحی دنیا | دانلود | ایران سیتی | دانلود | آگهی رایگان شیراز تجارت | پرتال آی تی مگ | دانلود کامل | آرشیو فیلم های آموزش کامپیوتر | دانلود رایگان | مقالات دانشجویی | فروشگاه اینترنتی | سایت تفریحی دیف دیفی | دانلود پروژه و نرم افزار | سایت فرهنگی سیناکو | پرشین رکس | عکس | سایت درج آگهی و تبلیغات |
منتظر برای تایید: عکس |



0 نظر
هیچ نظری وجود ندارد. اولین نفر برای نظر دهی به این مقاله باشید!