داده کاوی و کاربردهای آن

امنیت فناوری اطلاعات



 

چكيده
اين مقاله موضوع داده كاوي را به صورت خلاصه مورد بررسي قرار مي دهد و به تعاريف، كاربردها و نمونه هاي اجرا شده اشاره مي كند.




1- داده کاوی چیست؟

دادهکاوی به معنای کشف دانش درون دادههاست! کشف دانش درون دادهها آنهم در عصر اطلاعات یکی از هیجانانگیزترین و کلیدیترین مفاهیمی است که روز به روز اهمیت بیشتری میگیرد.
دادهکاوی به بررسی و تجزیه و تحلیل مقادیر عظیمی از دادهها به منظور کشف الگوها و قوانین معنیدار گفته میشود.
دادهکاوی، استخراج اطلاعات مفهومی، ناشناخته و به صورت بالقوه مفید از پایگاه داده میباشد.
دادهکاوی استخراج نیمه اتوماتیک الگوها، تغییرات، وابستگیها، نابهنجاریها و دیگر ساختارهای معنیدار آماری از پایگاههای بزرگ داده میباشد.
2- چرا به سراغ دادهکاوی رفتهایم؟

چون
  • حجم دادهها (Data) با سرعت زيادي در حال رشد است.
  • اطلاعات (Information) ما در مورد اين دادهها کم است.
  • دانش (Knowledge) ما نسبت به اين اطلاعات صفر است.
جالب اینجاست که مشکل تمام اینها یک کلمه است و آن دادهکاوی است.
از طرف دیگرتوسعه تکنولوژيهای ذخيره و بازيابی اطلاعات امکانی است برای محقق شدن دادهکاوی:
  • افزايش روزافزون حجم اطلاعات ذخيره شده
  • تنوع بسيار زياد در اطلاعات موجود
  • بانکهای اطلاعاتی
  • فايلهای چندرسانهای (تصاوير متحرک، فايلهای صوتی)
  • اطلاعات متنی و فاقد ساختار
آرشيوهای اطلاعاتی، به دليل حجم بسيار زياد، غالباً به مقبرههای اطلاعات تبديل میشوند. عليرغم هزينههای سنگين در بخش تکنولوژی اطلاعات، بسياری از تصميمها همچنان در فقر اطلاعاتی اتخاذ میگردند. از قابليتهای بالقوه اطلاعات ذخيره شده استفاده نمیشود. نياز به تبديل اطلاعات به دانش در بسياری زمينهها آشکار گرديده است.
3- تعریف داده کاوی

دادهکاوی را میشود به شکلهای زیر هم تعریف کرد:
  • دادهکاوی پل ارتباطی میان علم آمار، علم کامپیوتر، هوش مصنوعی، الگوشناسی، فراگیری ماشین و بازنمایی بصری داده میباشد.
  • دادهکاوی فرآیندی پیچیده، جهت شناسایی الگوها و مدلهای صحیح، جدید و به صورت بالقوه مفید، در حجم وسیعی از داده میباشد، به طریقی که این الگوها و مدلها برای انسانها قابل درک باشند.
  • دادهکاوی به صورت یک محصول قابل خریداری نمی باشد، بلکه یک فرآیندی است که بایستی به صورت یک پروژه پیادهسازی شود.
  • دادهکاوی پل ارتباطی میان علم آمار، علم کامپیوتر، هوش مصنوعی، الگوشناسی، فراگیری ماشین و بازنمایی بصری داده میباشد.
  • دادهکاوی فرآیندی پیچیده، جهت شناسایی الگوها و مدلهای صحیح، جدید و به صورت بالقوه مفید، در حجم وسیعی از داده میباشد، به طریقی که این الگوها و مدلها برای انسانها قابل درک باشند.
  • دادهکاوی به صورت یک محصول قابل خریداری نمیباشد، بلکه یک فرآیندی است که بایستی به صورت یک پروژه پیادهسازی شود.
4- فنون داده کاوی

برخی از فنون رایج بکار گرفته شده تحت عنوان دادهکاوی عبارتند از:
  • ابزارهای پرس و جو
  • فنون آماری
  • مصورسازی
  • پردازش تحلیلی پیوسته
  • یادگیری مبتنی بر مورد
  • درختان تصمیمگیری
  • قوانین وابستگی
  • شبکههای عصبی
  • الگوریتم ژنتیکی
5- کاربردهای داده کاوی

دادهکاوی يك رشته جديد با كاربردهاي وسيع و گوناگون است که به عنوان ده علم برتر که منجر به ایجاد تحول در عصر تکنولوژی میشود و در تمام زمینهها کاربرد دارد، معرفی میشود. اصولاً هر جایی که داده وجود داشته باشد دادهکاوی نیز معنا مییابد، از قبيل: امور تجاري و مالي، امور پزشكي، زيست پزشكي، تجزيه و تحليلهاي مربوط به DNA، كشف ناهنجاريها و اسناد جعلي، ارتباطات از راه دور، ورزش و سرگرمي، كتابداري و اطلاعرساني.
امروزه عملیات دادهکاوی به صورت گسترده توسط تمامی شرکتهایی که مشتریان در کانون توجه آنها قرار دارند، استفاده میشود، از جمله: فروشگاهها، شرکتهای مالی، ارتباطاتی، بازاریابی و غیره. استفاده از دادهکاوی به این شرکتها کمک میکند تا ارتباط عوامل داخلی از جمله: قیمت، محل قرارگیری محصولات و مهارت کارمندان را با عوامل خارجی از جمله: وضعیت اقتصادی، رقابت در بازار و محل جغرافیایی مشتریان کشف نمایند.
دادهکاوی پیشبینی وضع آینده بازار، گرایش مشتریان و شناخت سلیقههای عمومی آنها را برای شرکتها ممکن میسازد:
  • بازار هدف
  • پيدا کردن الگوي خريد مشتري
  • برنامهریزی برای معرفی محصول جدید
  • Customer profiling
  • دستهبندي مشتريان براساس نوع خريد
  • آناليز نيازهاي مشتريان
  • تشخيص محصولات مناسب براي دستههاي مختلف مشتريان
  • تشخيص فاکتورهايي براي جذب مشتريان جديد
  • تعيين الگوهاي خريد مشتريان
  • تجزيه و تحليل سبد خريد بازار
  • پيشگويي ميزان خريد مشتريان از طريق پست (فروش الکترونيکي)
  • پيشبيني الگوهاي کلاهبرداري از طريق کارتهاي اعتباري و شناسایی جرایم مالی
  • تشخيص مشتريان ثابت و دستهبندی و خوشهبندی مشتریان با توجه به رفتار مشابه آنها در زمینه بانکداری و بازپرداخت وام
  • تعيين ميزان استفاده از کارتهاي اعتباري بر اساس گروههاي اجتماعي
  • تحلیل اعتبار مشتریان
  • شناسایی فاکتورهای اصلی در ریسک بازپرداخت وام
  • تحلیل پاسخگویی مشتریان به ارائه خدمات جدید بانکی
  • پيشگويي ميزان خريد بيمهنامههاي جديد توسط مشتريان
  • تحلیل ریسک و برآورد حق بیمه مشتریان بر اساس میزان ریسک هر مشتری
  • پیشبینی میزان خسارت بر اساس گروههای مشتریان
  • مدیریت ارتباط با بیمهگذاران و تدوین استراتژی بر اساس مشتریان هدف
  • تعیین عوامل وفاداری و یا رویگردانی مشتریان
  • شناخت نیازها و الگوهای خرید سرویسهای بیمهای توسط مشتریان
  • شناخت تخلفات بیمهای
  • تعيين نوع رفتار با بيماران و تعیین روش درمان بیماریها
  • پيشگويي ميزان موفقيت اعمال جراحي و تعيين ميزان موفقيت روشهاي درماني در برخورد با بيماريهاي سخت
  • بررسی میزان تاثیر دارو بر بیماری و اثرات جانبی آن
  • تشخیص و پیشبینی انواع بیماریها مانند تشخیص و یا پیشبینی انواع سرطان
  • تجزیه و تحلیل دادههای موجود در سیستمهای اطلاعات سلامت
  • تحلیل عکسهای پزشکی
6- نمونههای اجرا شده دادهکاوی

6-1- در زمینه صنعت

شرکت فولادسازی پوهانگ کره برای صرفهجویی در مصرف انرژی در کورههای بلند خود از الگوریتمهای دادهکاوی استفاده و در حدود 15% از مصرف انرژی خود را کاهش داد، که باعث 3/1 میلیون دلار صرفهجویی در هزینههای شرکت شده و از طرف دیگر باعث کاهش قیمت محصولات آن شرکت و افزایش تعداد مشتریان و سود بیشتر آن شرکت نیز شد.
6-2- در هتلداری

یکی از هتلهای مشهور در لاسوگاس آمریکا، برای بالا بردن رضایت مسافران از الگوریتمهای دادهکاوی استفاده کرد، به این صورت که با استفاده از اطلاعات جمعآوری شده از مسافران به وسیله پرسشنامه، و آنالیز آن دادهها توانست عواملی که باعث میشد مسافران دوباره به این هتل باز گردند را پیدا کرده و با طبقهبندی مسافران، مسافران وفادار به هتل را پیدا کنند.
6-3- در مدیریت ریسک

در یکی از بانکهای بزرگ کانادا با استفاده از الگوریتمهای دادهکاوی، مدلی را برای دادهها ارائه داده و به وسیله نتايج آناليز آن، مسئله مهم تقلب در حسابها و چگونگی و میزان برگشت وامهای داده شده توسط بانک را حل نمودند و تصمیمی صحیح را برای مشتریهای جدید بانک گرفتند.


منبع: http://www.mgtsolution.com/

نظرات شما عزیزان:

محمدزاده
ساعت19:32---6 خرداد 1393
اگه میشه برام ایمیل بزنید در مورد داده کاوی چه جوری داده های مهم یک برنامه رو شناسایی کنم؟ به کمکتون نیاز دارم
من برا تحمل پذیری خطا باید داده های مهم شناسایی کنم که متاسفانه نمی دونم با چه روشی انجام بدم


نام :
آدرس ایمیل:
وب سایت/بلاگ :
متن پیام:
:) :( ;) :D
;)) :X :? :P
:* =(( :O };-
:B /:) =DD :S
-) :-(( :-| :-))
نظر خصوصی

 کد را وارد نمایید:

 

 

 

عکس شما

آپلود عکس دلخواه:






ادامه مطلب
نمونه سوالات اتوماسیون اداری( Excel ) به همراه جواب نمونه سوالات اتوماسیون اداری( Access ) به همراه جواب نمونه سوالات اتوماسیون اداری( Word ) به همراه جواب بالابردن امنیت اطلاعات تلفن‌همراه با رمزنگاری اندروید اپلیکیشن های رایگان چیزی نیست جز از دست دادن حریم خصوصی! انگلیس رتبه اول لیست قربانیان حملات سایبری ۲۰۱۴ یک هکر روسی رمز عبور ۵ میلیون ایمیل را هک و منتشر نموده است 25 رمز عبور محبوب سال 2013 بدترین «رمز عبور»های اینترنتی معرفی شدند حمله هکرها به 18 دانشگاه ايتاليا ضد‌روش‌های هک پسورد هک سایت های آمریکایی امنیت مرورگرهای اینترنتی رمـــــــــــزهای امـــــــــن رمز عبور قوی یکی از اصول حفاظتی بدترین رمز عبورها انتشار 2 میلیون رمز عبور کاربران اینترنتی NOD32 Password and Username
تمامي حقوق اين وبلاگ محفوظ است | طراحي : قالب سبز