µ¥ÀÌÅÍ ¸¶ÀÌ´×ÀÇ °³¿ä

 

µ¥ÀÌÅÍ ¸¶ÀÌ´× : Àå³²½Ä.È«¼º¿Ï.ÀåÀçÈ£ ÁöÀ½, ´ëû¹Ìµð¾î, 1999

 

1. µîÀå¹è°æ

(1) Á¤º¸È­ ½Ã´ëÀÇ µµ·¡

(2) Á¤º¸±â¼úÀÇ °¡¼ÓÀû ¹ßÀü

(3) ÀüÅëÀûÀÎ Àü¹®°¡½Ã½ºÅÛÀÇ ÇÑ°è

(4) µ¥ÀÌÅÍÀÇ È«¼ö, Á¤º¸ÀÇ ºó°ï

2. Á¤ÀÇ ¹× À¯»ç°³³ä

(1) Á¤ÀÇ

(2) data mining°ú Áö½Ä¹ß°ß

(3) data mining°ú ±âÁ¸ÀÇ Á¶È¸ µµ±¸

3. ÀÛ¾÷À¯Çü

(1) ¿¬°ü(Association) ±ÔÄ¢

(2) ¿¬¼Ó(Sequence) ±ÔÄ¢

(3) ºÐ·ù(Classification) ±ÔÄ¢

(4) µ¥ÀÌÅÍ ±ºÁýÈ­(Clustering)

4. ÀÀ¿ëºÐ¾ß

5. ÇÁ·ÎÁ§Æ®¸¦ À§ÇÑ °í·Á»çÇ×

(1) ¸ñÇ¥ ¹× È°¿ë¹æ¾È

(2) µ¥ÀÌÅÍÀÇ Ãæ½Çµµ

(3) ¹ý·ü¹®Á¦

(4) Àü¹® Àη Ȯº¸

(5) ÀûÀýÇÑ data mining µµ±¸

 

 

±â¾÷°£ÀÇ °æÀïÀÌ ½ÉÈ­µÇ°í Á¤º¸ÀÇ Á߿伺¿¡ ´ëÇÑ ÀνÄÀÌ È®»êµÊ¿¡ µû¶ó ´ë·®ÀÇ µ¥ÀÌÅÍ¿¡¼­ À¯¿ëÇÑ Á¤º¸¸¦ ij³»´Â 'data mining'ÀÌ ÁÖ¸ñ ¹Þ°í ÀÖ´Ù. ÀÌ¹Ì ¿Ü±¹¿¡¼­´Â ´Ù¾çÇÑ ¿¬±¸¿Í ÇÁ·ÎÁ§Æ®°¡ ÃßÁøµÇ¾î ±× °á°ú¹°µéÀÌ ¼Ó¼Ó ¹ßÇ¥µÇ°í ÀÖÀ¸³ª ±¹³»ÀÇ °æ¿ì data miningÀÇ Àü ´Ü°è¶ó ÇÒ ¼ö ÀÖ´Â µ¥ÀÌÅÍ¿þ¾îÇϿ콺(data warehouse) ±¸Ãà ÀÛ¾÷ÀÌ ÀϺΠÁøÇàµÇ°í ÀÕÀ» »Ó º»°ÝÀûÀ¸·Î data miningÀ» Àû¿ëÇÑ »ç·Ê¸¦ ã±â´Â ¾î·Æ´Ù. ±×·¯³ª 21¼¼±â ±â¾÷°æ¿µ¿¡¼­ µ¥ÀÌÅͺ£À̽º¸¶ÄÉÆÃ(Database Marketing)À̳ª °í°´°ü°è°ü¸®(CRM: Customer Relationship Management), À§Çè°ü¸®(Risk Management) µîÀÇ Á߿伺ÀÌ Å©°Ô ºÎ°¢µÇ±â ½ÃÀÛÇϸ鼭 ±¹³»¿¡¼­µµ ´Ù¾çÇÑ ºÐ¾ß¿¡¼­ data mining ÀÛ¾÷ÀÌ ÀÌ·ç¾îÁú Àü¸ÁÀÌ´Ù. ÀÌ Àå¿¡¼­´Â ¾ÆÁ÷Àº ¿ì¸® ±Í¿¡ »ý¼ÒÇÑ data mining¿¡ ´ëÇÑ Àü¹ÝÀûÀÎ °³¿ä¸¦ µîÀå¹è°æ ¹× Á¤ÀÇ, ´ëÇ¥ÀûÀÎ ÀÛ¾÷À¯Çü°ú »ê¾÷º° ÁÖ¿ä ÀÀ¿ë ºÐ¾ß, ±×¸®°í ÇÁ·ÎÁ§Æ® ¼öÇà½Ã °í·ÁÇØ¾ß ÇÒ »çÇ× µîÀ» ÅëÇØ ¼³¸íÇÏ°íÀÚ ÇÑ´Ù.

1. µîÀå¹è°æ

  (1) Á¤º¸È­ ½Ã´ëÀÇ µµ·¡

  ÃÖ±Ù µé¾î ¿ì¸®°¡ °¡Àå ¸¹ÀÌ µè´Â ´Ü¾î °¡¿îµ¥ Çϳª°¡ 'Á¤º¸'ÀÏ °ÍÀÌ´Ù. ½Å¹®À̳ª ÀâÁö, ¹æ¼Û µîÀÇ ¹Ìµð¾î¿Í ¸ðÀÓ, °­¿¬ µî¿¡¼­ ÁÖÁ¦¿¡ °ü°è¾øÀÌ ÇÑ ¹ø ÀÌ»ó ³ª¿À´Â ÀÌ ´Ü¾î¿¡ ¿ì¸®´Â ¾î´À»õ Ä£¼÷ÇØÁ® ÀÖ´Ù. Á¤º¸¶ó´Â °Í ¾øÀ̵µ °ú°Å¿¡´Â º° ¹®Á¦¾øÀÌ »ì¾Æ°¥ ¼ö ÀÖ¾ú´Âµ¥, ÀÌÁ¦´Â Á¤º¸¾øÀÌ´Â ¾Æ¹« °Íµµ ÇÒ ¼ö ¾ø´Ù´Â À§±â°¨À» ´À³¢±âµµ ÇÑ´Ù. Àΰ£Àº ´©±¸³ª ȯ°æ¿¡ ÀûÀýÈ÷ ÀûÀÀÇÏ¿© ¸ÃÀº ÀÏÀ» ¹«¸® ¾øÀÌ È¿°úÀûÀ¸·Î ¼öÇàÇÏ·Á´Â ¿å±¸¸¦ °¡Áö°í ÀÖ´Ù. ±×·¯³ª °³ÀÎÀÇ ´É·ÂÀ̳ª Áö½Ä¿¡´Â ÇÑ°è°¡ ÀÖÀ¸¹Ç·Î ÀÌ·¯ÇÑ ÇѰ踦 ±Øº¹Çϱâ À§ÇÏ¿© °ú°Å¿¡µµ ´Ã Á¤º¸¶ó´Â °ÍÀ» ¼öÁýÇÏ°í È°¿ëÇÏ·Á ¾Ö½á¿Ô´Ù. ±×·¸´Ù¸é Á¤º¸È­ »çȸ¶ó ÀÏÄ´ ¿À´Ã³¯, Á¤º¸ÀÇ Á߿伺°ú Çʿ伺ÀÌ ¾î´À ¶§º¸´Ùµµ Å©°Ô ºÎ°¢µÇ´Â ±î´ßÀº ¹«¾ùÀϱî? ±× ÀÌÀ¯¸¦ ±â¾÷°æ¿µ Ãø¸é¿¡¼­ ã¾Æº¸¸é Á¤º¸È­ »çȸ¿¡¼­´Â Á¤º¸°¡ ±â¾÷°æ¿µÀÇ °æÀï·ÂÀ» °áÁ¤ÇÏ´Â °¡Àå Áß¿äÇÑ ¿ä¼Ò¶ó´Â °ÍÀÌ´Ù.
  18¼¼±â Áß¿±ºÎÅÍ ½ÃÀÛµÈ »ê¾÷È­ÀÇ ¹°°áÀº Áö³­ 200¿©³â µ¿¾È Àηù ¹®¸íÀ» Áö¹èÇÏ¿´´Ù. »ê¾÷»çȸ¿¡¼­ ÀηùÀÇ À°Ã¼ÀûÀÎ ³ëµ¿Àº ±â°è·Î ´ëüµÇ¾úÀ¸¸ç, ´ë·® »ý»ê°ú ¼Òºñ¸¦ °¡´ÉÄÉÇÏ¿© ÀÌÀü¿¡´Â ±â´ëÇÒ ¼ö ¾ø¾ú´ø ¹°ÁúÀûÀΠdz¿ä¸¦ Àηù¿¡°Ô Á¦°øÇÏ¿´´Ù. ÀÌ ½Ã±âÀÇ ±â¾÷µéÀº Á¤ºÎÀÇ º¸È£¿Í ±ÔÁ¦ ¼Ó¿¡¼­ ¾÷Á¾º°·Î µ¶°úÁ¡À» Çü¼ºÇÏ¿´À¸¸ç, ÀüÅëÀûÀÎ ÀÚ¿øÀÎ ÀηÂ, ÀÚ±Ý, ±×¸®°í ¹°ÀÚÀÇ È¿À²Àû ¿î¿ëÀ» ÅëÇØ ´Ù·®ÀÇ Á¦Ç°À̳ª ¼­ºñ½º¸¦ ¸¸µé¾î³»¸é ¼º°øÀ» º¸Àå¹ÞÀ» ¼ö ÀÕ¾ú´Ù. ¹°·Ð ÀÚ¿øÀÇ È¿À²Àû ¿î¿ëÀ̳ª Á¦Ç°ÀÇ °³¹ß, ¸¶ÄÉÆà Ȱµ¿ µîÀ» À§ÇØ Á¤º¸ÀÇ ¼öÁý°ú È°¿ëÀÌ ¿ä±¸µÇ¾úÁö¸¸ ȯ°æÀÇ º¯È­°¡ °ÅÀÇ ¾ø¾ú°í ½ÃÀåÀº »ý»êÀÚ À§ÁÖ·Î Çü¼ºµÇ¾ú±â ¶§¹®¿¡ °æ¿µÀÚ³ª ¼Ò¼ö Àü¹®°¡ÀÇ ¿À·£ °æÇèÀ» ÅëÇØ ¾ò¾îÁø Áö½ÄÀ̳ª ÁÖ°üÀûÀÎ ÆÇ´Ü, °£´ÜÇÑ Åë°è¼öÄ¡ µî ´Ü¼øÇÑ ¼öÁØÀÇ Á¤º¸·Îµµ ÃæºÐÈ÷ ±â¾÷À» °æ¿µÇÒ ¼ö ÀÖ¾ú´Ù.
  ÇÏÁö¸¸ ¿À´Ã³¯ ±â¾÷ÀÌ Ã³ÇÑ È¯°æÀº °ú°Å¿Í´Â ¿ÏÀüÈ÷ ´Ù¸£´Ù. ½ÃÀåÀº ´ÙÇ°Á¾ ¼Ò·® »ý»êÀÌ ¿ä±¸µÇ´Â ¼ÒºñÀÚ ÁÖµµ·Î ¹Ù²î¾ú°í ¼ÒºñÀÚÀÇ ÃëÇâÀº ÇÏ·ç°¡ ´Ù¸£°Ô º¯Çϸç, ±â¾÷°£ÀÇ °æÀïÀº ³¯·Î ½ÉÈ­µÇ°í ÀÖ´Ù. ÀÌ·¯ÇÑ È¯°æ¿¡¼­ ±â¾÷ÀÌ »ýÁ¸ÇÏ°í ¹ßÀüÇϱâ À§Çؼ­´Â Áö¼ÓÀûÀ¸·Î ¼ÒºñÀÚÀÇ µ¿ÇâÀ» ÆľÇÇÏ°í, ÀÚ»ç´Â ¹°·Ð °æÀï»çÀÇ °æ¿µ Àü·«À» È¿°úÀûÀ¸·Î ºÐ¼®ÇÏ°í ´ëóÇÒ ¼ö ÀÖ´Â ´É·ÂÀÌ Àý½ÇÇÏ°Ô ¿ä±¸µÇ´Âµ¥, À̸¦ °¡´ÉÇÏ°Ô ÇÏ´Â °ÍÀÌ ¹Ù·Î Á¤º¸´Ù. µû¶ó¼­ Á¤º¸È­ ½Ã´ëÀÇ ±â¾÷°æ¿µ¿¡¼­ Á¤º¸¶õ ÀüÅëÀûÀÎ ÀÚ¿øµéÀ» È¿°úÀûÀ¸·Î ¿î¿µ·°ü¸®ÇÏ¸ç »õ·Î¿î Á¦Ç°À̳ª ¼­ºñ½º¸¦ âÃâÇÏ´Â ¿ªÇÒÀ» ´ã´çÇÏ´Â ¶Ç ´Ù¸¥ ÀÚ¿øÀ¸·Î¼­, ÀÌ°ÍÀ» Á¦´ë·Î ¼öÁýÇÏ°í È°¿ëÇÒ ¼ö ÀÖ´Â ±â¾÷¸¸ÀÌ °æÀï¿¡¼­ »ì¾Æ³²°í ¿ìÀ§¸¦ È®º¸ÇÏ°Ô µÇ´Â °ÍÀÌ´Ù.

  (2) Á¤º¸±â¼úÀÇ °¡¼ÓÀû ¹ßÀü

  70³â´ë¸¸ ÇÏ´õ¶óµµ Á¤º¸±â¼úÀº ÀϺΠ¿¬±¸¼Ò³ª ÇÐ°è µî ƯÁ¤Á÷¿¡ Á¾»çÇÏ´Â »ç¶÷µéÀÇ ÀüÀ¯¹°·Î ¿©°ÜÁ³´Ù. ±×·¯³ª 80³â´ë Áß¹Ý ÀÌÈÄ °³Àοë ÄÄÇ»ÅÍ°¡ ½ÃÀåÀ» ÁÖµµÇϱ⠽ÃÀÛÇϸ鼭 Àü¹® Áö½ÄÀÌ º°·Î ¾ø´Â ÀÏ¹Ý »ç¿ëÀڵ鵵 ÄÄÇ»Å͸¦ ½±°Ô »ç¿ëÇÒ ¼ö Àִ ȯ°æÀÌ Á¶¼ºµÇ¾ú´Ù. µ¥ÀÌÅ͸¦ ÀúÀåÇÏ°í ó¸®ÇÏ´Â ¼º´É ¶ÇÇÑ ±Þ¼Óµµ·Î ¹ßÀüÇÏ°í Àմµ¥ ¿¹¸¦ µé¾î, 2000³â ÀÌÈÄ¿¡³ª °¡´ÉÇϸ®¶ó ¿¹»óÇß´ø ±â°¡ ¹ÙÀÌÆ®±Þ Çϵåµð½ºÅ©³ª 300MHzÀÌ»óÀÇ CPU°¡ ÀÌ¹Ì °³Àοë ÄÄÇ»ÅÍ¿¡ ÀåÂøµÇ°í ÀÖ´Ù. Çϵå¿þ¾îÀÇ ¹ßÀü°ú ´õºÒ¾î ¼ÒÇÁÆ®¿þ¾î Ãø¸é¿¡¼­µµ Áö´ÉÀ» °®Ãá µ¥ÀÌÅÍ ºÐ¼®½Ã½ºÅÛÀ» °³¹ßÇϱâ À§ÇÑ ³ë·ÂÀÌ 80³â´ë ÀÌÈĺÎÅÍ ²ÙÁØÈ÷ ÁøÇàµÇ¾î ¿Ô´Âµ¥, ÇнÀ´É·Â(learning ability)À» °®Ãá ¾Ë°í¸®ÁòÀ̳ª ÇÁ·Î±×·¥µéÀÌ ÁÖ¿ä ´ë»óÀ̾ú´Ù. ¿©±â¼­ ÇнÀ´É·ÂÀ̶õ ¹Ì¸® Á¤ÇØÁø ¼ø¼­¿Í ÀýÂ÷¿¡ µû¶ó ¹®Á¦¸¦ ÇØ°áÇÏ´Â ÀüÅëÀûÀÎ ÇÁ·Î±×·¡¹Ö ¹æ½Ä°ú´Â ´Þ¸® ÁÖ¾îÁø ·¹ÄÚµåµé·ÎºÎÅÍ Ãß·ÐÀ̳ª Á÷°üÀû ÆÇ´ÜÀ» ÅëÇØ ½º½º·Î ¹®Á¦ ÇØ°áÀ» ²ÒÇÏ´Â ´É·ÂÀ» ÀǹÌÇÑ´Ù. ÀÌ·¸µí ÇнÀ´É·ÂÀ» Áö´Ñ ÇÁ·Î±×·¥ÀÇ µîÀåÀº ÄÄÇ»ÅÍÀÇ °¡°øÇÒ ¸¸ÇÑ Á¤º¸Ã³¸® ´É·Â»Ó ¾Æ´Ï¶ó Á¤º¸Åë½Å ±â¼úÀÇ Á¤º¸À¯Åë ±â´É°ú ¿¬°èÇÏ¿© ´ë·®ÀÇ µ¥ÀÌÆ®¸¦ ½Ç½Ã°£¿¡ ºÐ¼®ÇÏ°í À̸¦ ÅëÇØ °æ¿µÀü·«À» ¼ö¸³ÇÒ ¼ö ÀÖ´Â ±æÀ» ¿­¾ú´Ù.

  (3) ÀüÅëÀûÀÎ Àü¹®°¡½Ã½ºÅÛÀÇ ÇÑ°è

  Àü¹®°¡½Ã½ºÅÛÀº ÀΰøÁö´ÉÀÇ ÇÑ ºÐ¾ß·Î¼­ ƯÁ¤ ºÐ¾ß¿¡¼­ Àü¹®°¡ÀÇ ÃàÀûµÈ Áö½Ä°ú °æÇèÀ» ½Ã½ºÅÛÈ­ÇÏ¿©, ÇÊ¿äÇÒ ¶§ »ç¿ëÇϵµ·Ï ÇÏ´Â ¼ÒÇÁÆ®¿þ¾îÀÌ´Ù. ¿©±â¼­ 'Áö½Ä(knowledge)'À̶ó´Â ¿ë¾î´Â 'Á¤º¸(information)'¿Í È¥¿ëÇÏ¿© »ç¿ëµÇ±âµµ ÇÏ¸ç ±¸ºÐµÇ±âµµ Çϴµ¥, µ¥ÀÌÅÍ °üÁ¡¿¡¼­ ¾ö¹ÐÇÏ°Ô Á¤ÀÇÇϸé Á¤º¸¶õ µ¥ÀÌÅ͸¦ °¡°ø·Ã³¸®Çؼ­ ¾ò¾îÁö´Â »êÃâ¹°ÀÌ°í, Áö½ÄÀ̶õ Á¤º¸ÀÇ Ã¼°èÀûÀÎ È°¿ëÀ» ÅëÇØ ÃàÀûµÈ ³ëÇÏ¿ìÀÌ´Ù. ¿¹¸¦ µé¸é, Àϱ⿹º¸¸¦ Çϱâ À§Çؼ­´Â ±¸¸§ÀÇ À̵¿, ¹Ù¶÷ÀÇ ¹æÇâ ¹× ¼Óµµ µî°ú °°Àº µ¥ÀÌÅ͵éÀÌ ÇÊ¿äÇϸç, À̵éÀ» ºÐ¼®ÇÏ¿© "±ÝÀÏ ºñ°¡ ¿Ã È®·üÀº 70%ÀÌ´Ù."¶ó°í ¾òÀº °á·ÐÀÌ Á¤º¸´Ù. ±×¸®°í ÀÌ·¯ÇÑ Á¤º¸¿Í °ú°ÅÀÇ °æÇèÀ» ±Ù°Å·Î "ºñ¿Ã È®·üÀÌ 60% ÀÌ»óÀÌ¸é ¿ì»êÀ» ÁغñÇ϶ó!"¶ó´Â Áö½ÄÀ» µµÃâÇÒ ¼ö ÀÖ´Ù. Á¤º¸´Â ±× ÀÚü·Î¼­µµ ±â¾÷ °æÀï·ÂÀÇ ¿øõÀÌ µÇÁö¸¸, Áö½ÄÀ¸·Î ¹ßÀüÇÏ°Ô µÇ¸é °æÀï·ÂÀº ´õ¿í °­È­µÈ´Ù.
  Àü¹®°¡½Ã½ºÅÛÀº 1960³â´ë¿¡ È­ÇÕ¹°ÀÇ ±¸Á¶¸¦ ÃßÁ¤Çϱâ À§ÇØ ¸¸µé¾îÁø µ§µå·²(DENDRAL)½Ã½ºÅÛÀÌ ½ÃÃÊ°¡ µÇ¾î ¹ßÀüÇÏ¿´´Ù. ±× ÈÄ ÀÇ·áÁø´Ü½Ã½ºÅÛÀÎ ¸¶À̽Å(MYCIN), ±¤¹°Å½»ç½Ã½ºÅÛÀÎ ÇÁ·Î½ºÆåÅÍ(PROSPECTOR) µîÀÌ 1970³â´ë¿¡ ¸¸µé¾îÁ³À¸¸ç, ±â°è°íÀå Áø´Ü, ¼³°è Áö¿ø, ¼ÕÇعè»ó ÆÇÁ¤ µî »ê¾÷°èÀÇ Àü ºÐ¾ß¿¡¼­ ±¤¹üÀ§ÇÏ°Ô ÀÀ¿ëµÇ°í ÀÖ´Ù. Àü¹®°¡½Ã½ºÅÛÀÇ ±¸¼º¿ä¼Ò Áß ÇÙ½ÉÀÌ µÇ´Â Áö½Äº£À̽º(knowledge-base)¿¡´Â Àü¹®°¡ÀÇ Áö½ÄÀ» ÀúÀåÇϴµ¥, °ú°Å¿¡´Â ÁÖ·Î ÇØ´ç ºÐ¾ß Àü¹®°¡¿ÍÀÇ ÀÎÅͺ䳪 Àü¹®¼­Àû µîÀ» Åä´ë·Î ±¸ÃàÇÏ¿´´Ù. ±×·¯´ø °ÍÀÌ ±â¾÷ȯ°æÀÇ ±Þ¼ÓÇÑ º¯È­¿Í ½Ã½ºÅÛÀ» ÀÌ¿ëÇØ ÇØ°áÇÏ°íÀÚ ÇÏ´Â ¹®Á¦¿µ¿ªÀÌ Á¡Â÷ È®´ëµÇ°í º¹ÀâÇØÁü¿¡ µû¶ó ÇØ´ç ºÐ¾ß¿¡ Åë´ÞÇÑ Àü¹®°¡¸¦ ã±â°¡ ¾î·Á¿öÁö¸é¼­ Áö½Äȹµæ¿¡ Àå±â°£¿¡ °ÉÃÄ ¸¹Àº ºñ¿ëÀ» ÅõÀÚÇØ¾ß ÇÏ´Â °æÁ¦ÀûÀÎ ¹®Á¦¿¡ ºÀÂøÇÏ¿´´Ù. ÀÌ°ÍÀ» ¼ÒÀ§ 'Áö½ÄȹµæÀÇ º´¸ñÇö»ó (knowledge acquisition bottle-neck)'À̶ó Ç¥ÇöÇϴµ¥, ÀÌ·Î ÀÎÇØ µ¥ÀÌÅ͸¦ ºÐ¼®ÇÏ¿© ÀÚµ¿ÀûÀ¸·Î Áö½ÄÀ» ÃßÃâÇØ ³»´Â ¹æ¾È¿¡ ´ëÇÑ ¿ä±¸°¡ ±Þ¼ÓÈ÷ Áõ°¡ÇÏ°í ÀÖ´Â °ÍÀÌ´Ù.

  (4) µ¥ÀÌÅÍÀÇ È«¼ö, Á¤º¸ÀÇ ºó°ï

  ³²¾Æ¸Þ¸®Ä« Ãâ½Å ÀÛ°¡ Á¶Áö ·çÀ̽º(George Louis)´Â ÀÚ½ÅÀÇ ¼Ò¼³ '¹Ùº§ µµ¼­°ü(The Library of Babel)'¿¡¼­ ³¡¾øÀÌ ÆîÃÄÁø ¹«ÇÑÇÑ ±Ô¸ðÀÇ µµ¼­°ü(infinite library)¿¡ ´ëÇØ ¹¦»çÇÏ°í ÀÖ´Ù. ÀÌ µµ¼­°ü¿¡´Â ¼­Àûµé·Î °¡µæ Âù ¿­¶÷½ÇµéÀÌ ¹«¼öÈ÷ ¿¬°áµÇ¾î ÀÖÀ¸³ª ¸ðµç ¼­ÀûµéÀº ±× ³»¿ëÀ» ¾Ë ¼ö ¾øÀ¸¸ç Á¦¸ñµµ 'a*%$#$^$@!'¿Í °°ÀÌ ÀÌÇØÇÒ ¼ö ¾ø´Â ¹®ÀÚ·Î ¾º¿©ÀÖ¾î Àǹ̸¦ Çؼ®ÇÏ´Â °ÍÀÌ ºÒ°¡´ÉÇÏ´Ù. ÀÌ°÷ÀÇ »ç¶÷µéÀº ¿øÇϴ åÀ» ã±â À§ÇØ ¿©±âÀú±â¸¦ Çì¸Å´Ù°¡ ÇÑ Æò»ýÀ» ÇãºñÇÏ°í ÇÐÀÚµéÀº "µµ¼­°ü ¾îµò°¡¿¡ µµ¼­ ¸ñ·ÏÀÌ ÀÖÀ» °ÍÀÌ´Ù.", "±× Ã¥ÀÌ µµ¼­°ü ¾îµò°¡¿¡ ºÐ¸íÈ÷ ºñÄ¡µÇ¾î ÀÖÀ» °ÍÀÌ´Ù." µîÀÇ ¸»¸¸ µÇÇ®ÀÌÇÑ´Ù (ÀÚ·á¿ø : Data Mining by Adriaans, P. and Aantinge, D., Syllogic, 1998).
  ÀÌ ¼Ò¼³Àº ¿À´Ã³¯ Á¤º¸±â¼ú ¹®¸íÀÇ ÇýÅÃÀ» ¹ÞÀ¸¸ç »ì¾Æ°¡´Â ¿ì¸®¿¡°Ô ÀǹÌÇÏ´Â ¹Ù°¡ Å©´Ù. Á¤º¸±â¼úÀÇ ºü¸¥ ¹ßÀüÀº ¾÷¹«ÀÇ ÀÚµ¿È­¸¦ ÃËÁø½ÃÄÑ ¾öû³­ ¾çÀÇ µ¥ÀÌÅ͸¦ ÀüÀÚÀûÀ¸·Î ¼öÁýÇÏ°í º¸°üÇÏ´Â °ÍÀ» °¡´ÉÇÏ°Ô ÇÏ¿´´Ù. ½ÇÁ¦·Î ÃÖ±Ù¿¡ ¹ßÇ¥µÈ ÇÑ º¸°í¼­¿¡ µû¸£¸é ¼¼»ó¿¡¼­ ÀüÀÚÀûÀ¸·Î ¼öÁýµÇ´Â µ¥ÀÌÅÍÀÇ ¾çÀº ¸Å³â ±âÇϱ޼öÀûÀ¸·Î Áõ°¡ÇÏ°í ÀÖÀ¸¸ç, ´ë±â¾÷¿¡¼­ ÀÏÁÖÀÏ µ¿¾È ±â¾÷ È°µ¿À» ÅëÇØ ¼öÁýÇÏ´Â µ¥ÀÌÅÍ´Â ÀϹÝÀÎÀÌ Æò»ý¿¡ °ÉÃÄ Àд µ¥ÀÌÅÍÀÇ ¾çº¸´Ù ¸¹´Ù°í ÇÑ´Ù. ÀÌ·¸µí ¿ì¸®´Â µ¥ÀÌÅÍÀÇ È«¼ö ¼Ó¿¡¼­ ¸¹Àº ¾çÀÇ µ¥ÀÌÅ͸¦ ÃàÀûÇØ ¿Ô´Ù. ±×¸®°í ÀÌ·¸°Ô µ¥ÀÌÅ͸¦ ÃàÀûÇÏ°Ô µÈ ¹è°æÀÇ Àϸ鿡´Â ±× ¾È¿¡ ¹«¾ùÀΰ¡°¡ ÀÖÀ¸¸®¶ó´Â ±â´ë°¡ Á¸ÀçÇÑ´Ù. ±â¾÷°æ¿µ Ãø¸é¿¡¼­ º¼ ¶§ µ¥ÀÌÅÍ´Â Áß¿äÇÑ ½ÃÀå, °æÀïÀÚ, °í°´ µî¿¡ °üÇÑ Á¤º¸¸¦ ³»ÀçÇÏ°í ÀÖ´Ù. »ý»ê°ü¸® Ãø¸é¿¡¼­ µ¥ÀÌÅʹ ó¸®°úÁ¤À» Çâ»ó½ÃÅ°°í, ¹®Á¦¸¦ ÇØ°áÇÏ´Â ¹æ¹ý»Ó¸¸ ¾Æ´Ï¶ó ¿î¿µÀÇ ÃÖÀûÈ­ ±âȸ¸¦ Á¦°øÇÑ´Ù. ±×·¯³ª °¡°øµÇÁö ¾ÊÀº µ¥ÀÌÅÍ ÀÚü´Â ¾Æ¹«·± Àǹ̰¡ ¾ø´Ù. µ¥ÀÌÅÍÀÇ ¾çÀÌ ¿À´Ã³¯°ú °°ÀÌ ¹æ´ëÇÏÁö ¾Ê¾Ò´ø °ú°Å¿¡´Â ¼Ò¼öÀÇ Àü¹®°¡µéÀÌ Åë°è±â¹ýÀ̳ª ÁúÀÇ µîÀ» ÅëÇØ µ¥ÀÌÅ͸¦ ºÐ¼®ÇÏ°í ¿ä¾àµÈ °á°ú¸¦ º¸°í¼­ Çü½ÄÀ¸·Î Á¦°øÇÏ°ï Çß´Ù. ÀÌ·¯ÇÑ Á¢±Ù¹ýÀº µ¥ÀÌÅÍÀÇ ¾çÀÌ Áõ°¡ÇÏ°í Â÷¿ø(¼Ó¼º)ÀÇ ¼ö°¡ Áõ°¡ÇÒ¼ö·Ï È¿À²¼ºÀÌ ¶³¾îÁö°í, ºÐ¼®À» ÅëÇØ ¾òÀ» ¼ö ÀÖ´Â Á¤º¸ÀÇ Ç°Áúµµ ±â´ëÇϱ⠾î·Æ°Ô µÈ´Ù. °ú¿¬ ´©°¡ ¼ö ¹é°¡ÁöÀÇ ¼Ó¼ºÀ¸·Î ±¸¼ºµÈ ¼ö¹é±â°¡ ¶Ç´Â Å׶ó ¹ÙÀÌÆ® »ó´çÀÇ µ¥ÀÌÅ͸¦ Á¦´ë·Î ÀÌÇØÇÏ°í ºÐ¼®ÇÒ ¼ö Àְڴ°¡? µû¶ó¼­ µ¥ÀÌÅÍÀÇ È«¼ö¿Í Á¤º¸ÀÇ ºó°ïÀ̶ó´Â ȯ°æ¿¡ óÇÑ Áö±Ý, ±â¾÷µéÀº Á¤º¸±â¼úÀ» ÀÌ¿ëÇÏ¿© µ¥ÀÌÅ͸¦ ¿©°úÇÏ°í, ºÐ¼®Çϸç, °á°ú¸¦ Çؼ®ÇÏ´Â ÀÚµ¿È­ µÈ µ¥ÀÌÅÍ ºÐ¼® ¹æ¾È¿¡ ³ôÀº °ü½ÉÀ» °®°Ô µÇ¾ú´Ù.

 

2. Á¤ÀÇ ¹× À¯»ç°³³ä

  (1) Á¤ÀÇ

  Áö±Ý±îÁö ±â¾÷µéÀº °Å´ëÇÑ ¾çÀÇ ¾÷¹« µ¥ÀÌÅ͸¦ ÃàÀûÇØ ¿Ô°í ±×¾çÀº ¾Õ¼­µµ ¼³¸íÇßµíÀÌ ÇâÈÄ¿¡µµ °è¼Ó Áõ°¡ÇÒ Àü¸ÁÀÌ´Ù. ¿¹¸¦ µé¾î ¾à 2õ°³ÀÇ ¼Ò¸ÅÁ¡ üÀθÁÀ» °¡Áö°í ÀÖ´Â ¹Ì±¹ÀÇ ¿ù¸¶Æ®(Wal-Mart)¿¡´Â ¸ÅÀÏ 2õ¸¸°ÇÀÇ ÆǸŠ·¹Äڵ尡 Ãß°¡ ¶Ç´Â °»½ÅµÇ°í ÀÖ°í, ¿¡ÀÌƼ¿£Æ¼(AT&T)ÀÇ Åë½Å¸Á ÀÌ¿ë¿ä±Ý °ü¸®½Ã½ºÅÛÀÇ °æ¿ì, ±â·ÏµÇ´Â ·¹Äڵ尡 ÇÑ ´Þ¿¡¸¸ ¼ö±â°¡ ¹ÙÀÌÆ®¿¡ À̸¥´Ù. ÀÌµé µ¥ÀÌÅÍ´Â °ü·Ã ¾÷¹«¸¦ ó¸®ÇÑ °á°ú·Î ÃàÀûµÈ °ÍÀÌÁö¸¸ ´Ù¸¥ ÇÑÆíÀ¸·Î »ý°¢ÇØ º¸¸é ½ÇÁ¦·Î ¾÷¹« ÇöÀåÀÇ ´Ù¾çÇÑ Æ¯¼ºÀ» ¹Ý¿µÇÏ°í Àֱ⠶§¹®¿¡ ±× ¼Ó¿¡´Â ±â¾÷µéÀÌ ¹Ìó ¹ß°ßÇÏÁö ¸øÇÑ ±ÍÁßÇÑ Á¤º¸¿Í ±â¾÷ÀÇ Àü·« ¼ö¸³¿¡ µµ¿òÀÌ µÉ ¸¸ÇÑ ÈùÆ®°¡ ¼û¾î ÀÖÀ» ¼ö ÀÖ´Ù. ¿¹ÄÁ´ë ÇÑ ¹éÈ­Á¡¿¡¼­´Â ȸ¿øµéÀÇ ±¸¸Å µ¥ÀÌÅ͸¦ ºÐ¼®ÇÑ °á°ú "¹ÖÅ©ÄÚÆ®¸¦ ±¸ÀÔÇÑ °í°´ÀÇ »ó´ç¼ö°¡ °¡Á×Ä¡¸¶¸¦ ÇÔ²² ±¸ÀÔÇÑ´Ù."¶ó´Â ´Ù¼Ò ¿¹±âÄ¡ ¸øÇÑ Á¤º¸¸¦ ¾òÀ» ¼ö ÀÕ´Ù. ÀÌ·¯ÇÑ Á¤º¸´Â "°¡Á×Ä¡¸¶¸¦ ±¸ÀÔÇÏ´Â °í°´Àº ·ÕºÎÃ÷µµ ±¸ÀÔÇÒ °ÍÀÌ´Ù."¿Í °°ÀÌ ÀÏ¹Ý ¸¶ÄÉÆà Àü¹®°¡µéÀÌ Åë»óÀûÀ¸·Î »ý°¢ÇØ ³¾ ¼ö ÀÖ´Â Á¤º¸°¡ ¾Æ´Ò»Ó´õ·¯ ´Ù¸¥ ¹éÈ­Á¡µé¿¡ Àû¿ëÇÒ ¸¸ÇÑ Á¤º¸µµ ¾Æ´Ï´Ù. ±×·¯³ª ÀÌ·¯ÇÑ Á¤º¸°¡ »ý¼ºµÈ °÷, Áï »ó±â ¹éÈ­Á¡ÀÇ °æ¿ì´Â ÀÌ Á¤º¸¸¦ ¹Ù·Î ¸¶ÄÉÆà Ȱµ¿¿¡ È°¿ëÇÒ ¼ö°¡ Àִµ¥, ¿¹¸¦ µé¾î ¹ÖÅ©ÄÚÆ®¸¸À» ±¸ÀÔÇÑ È¸¿øµéÀ» ´ë»óÀ¸·Î ÇÏ¿© °¡Á×Ä¡¸¶ »óÇ°ÇÒÀαÇÀ» ¹ß¼ÛÇÑ´ÙµçÁö, »óÇ° Ä«Å»·Î±×¸¦ Á¦ÀÛÇÒ ¶§ ¹ÖÅ©ÄÚÆ®¿Í °¡Á×Ä¡¸¶¸¦ ÇÔ²² º¸¿©ÁÖ´Â Àü·«À» ±¸»óÇÒ ¼ö ÀÖ´Ù. ±×·¯³ª ¸î ±â°¡ ¹ÙÀÌÆ® ȤÀº Å׶ó ¹ÙÀÌÆ®¿¡ À̸£´Â °Å´ëÇÑ ¾çÀÇ µ¥ÀÌÅ͸¦ ºÐ¼®Çϱâ¶õ ½±Áö ¾Ê±â ¶§¹®¿¡ ¸¹Àº ±â¾÷µéÀº ´Ü¼øÇÑ Åë°è Á¤º¸¸¸À» ¾ò´Âµ¥ ±×Ä¡°Å³ª ¾Æ¿¹ ºÐ¼®ÇÒ ¾öµÎÁ¶Â÷ ³»Áö ¸øÇÏ°í, ÀÌ ±ÍÁßÇÑ ÀÚ»êÀ» Á¦´ë·Î ÀÌ¿ëµÇÁö ¸øÇÏ°í ÀÖ´Ù. ÀÌ·¯ÇÑ ºÐ¼® ÀÛ¾÷À» Áö¿øÇÏ´Â Á¤º¸±â¼úÀÌ ¹Ù·Î data miningÀÌ´Ù.
  data miningÀ̶õ ÀÚµ¿È­µÇ°í Áö´ÉÀ» °®Ãá(automated and intelligent) µ¥ÀÌÅͺ£À̽º ºÐ¼®±â¹ýÀ¸·Î 90³â´ë ÃʹݺÎÅÍ Áö½Ä¹ß°ß(KDD: Knowledge Discovery in Databases), Á¤º¸¹ß°ß(information discovery), Á¤º¸¼öÈ®(information harvesting) µîÀÇ À̸§À¸·Îµµ ¼Ò°³µÇ¾î ¿Ô´Âµ¥ ÀϹÝÀûÀ¸·Î "´ë·®ÀÇ µ¥ÀÌÅͷκÎÅÍ »õ·Ó°í ÀǹÌÀÖ´Â Á¤º¸¸¦ ÃßÃâÇÏ¿© ÀÇ»ç°áÁ¤¿¡ È°¿ëÇÏ´Â ÀÛ¾÷"À̶ó Á¤ÀǵȴÙ. ¿ë¾î¿¡ 'ä±¼ÇÏ´Ù'¶ó´Â ÀǹÌÀÇ 'mining'À» Æ÷ÇÔ½ÃŲ ÀÌÀ¯´Â µ¥ÀÌÅͷκÎÅÍ Á¤º¸¸¦ ã¾Æ³»´Â ÀÛ¾÷ÀÌ ¸¶Ä¡ ±ÝÀ̳ª ´ÙÀ̾Ƹóµå¸¦ ¹ß°ßÇϱâ Àü¿¡ ¼ö ¸¹Àº ¾çÀÇ Èë°ú Àâ¼®µéÀ» ÆÄÇìÄ¡°í Á¦°ÅÇÏ´Â °Í°ú À¯»çÇÏ´Ù´Â µ¥¿¡ ±âÀÎÇÑ´Ù.

  (2) data mining°ú Áö½Ä¹ß°ß

  ¼­ÀûÀ̳ª ³í¹®µéÀ» Á¢Çغ¸¸é data mining°ú Áö½Ä¹ß°ß(KDD)À̶ó´Â ¿ë¾î¸¦ È¥¿ëÇؼ­ »ç¿ëÇÏ´Â °æ¿ì°¡ ¸¹¾Æ µ¶ÀÚµéÀÌ È¥µ¿ÇϱⰡ ½±´Ù. °³³äÀÌ ¼Ò°³µÇ´ø ÃÊâ±â¿¡´Â data miningÀ̶ó´Â ¿ë¾î´Â ƯÈ÷ Åë°èÇÐÀÚ, µ¥ÀÌÅͺ£À̽º ¿¬±¸°¡, ±×¸®°í ±â¾÷ü¿¡¼­ ¸¹ÀÌ »ç¿ëÇÑ ¹Ý¸é, Áö½Ã¹ß°ßÀÇ °æ¿ì´Â ÀΰøÁö´ÉÀ̳ª Àü¹®°¡½Ã½ºÅÛ °ü·Ã ¿¬±¸¿¡ ÁÖ·Î µîÀåÇÏ¿´´Ù. ±×·¯³ª 1995³â ij³ª´Ù ¸óÆ®¸®¾ó¿¡¼­ °³ÃÖµÈ Áö½Ä¹ß°ß°ú data mining¿¡ °üÇÑ ±¹Á¦ Çмú´ëȸ (The first international conference on knowledge discovery & data mining)¿¡¼­ Áö½Ä¹ß°ßÀº µ¥ÀÌÅͷκÎÅÍ À¯¿ëÇÑ Á¤º¸¸¦ ¹ß°ßÇÏ´Â ÇÁ·Î¼¼½ºÀÇ Àü °úÁ¤À̶ó ÇÏ¿´°í, data miningÀº Áö½Ä¹ß°ß ÇÁ·Î¼¼½º Áß¿¡¼­ µ¥ÀÌÅͷκÎÅÍ Á¤º¸¸¦ ÃßÃâÇϱâ À§Çؼ­ ±â¹ýÀ» Àû¿ëÇϴ ƯÁ¤ ´Ü°è¶ó Á¦¾ÈÇß´Ù. ÀÌ Ã¥¿¡¼­ ¿ì¸®´Â À§ÀÇ Á¤ÀǸ¦ µû¸£°íÀÚ ÇÑ´Ù. ÀϹÝÀûÀ¸·Î Áö½Ä¹ß°ß ÇÁ·Î¼¼½º´Â µ¥ÀÌÅÍ ¼±ÅÃ, Á¤Á¦, º¸¿Ï, º¯È¯, data mining ±â¹ý ¼±Åà ¹× Àû¿ë, ¸ðÇüÀÇ Æò°¡¿Í °°Àº ¿©¼¸ ´Ü°è·Î ±¸¼ºµÈ´Ù.

  (3) data mining°ú ±âÁ¸ÀÇ Á¶È¸ µµ±¸

   data miningÀº OLAP(On-Line Analytical Processing)°ú  °°Àº ´ÙÂ÷¿øºÐ¼®(multi-dimensional analysis) µµ±¸³ª ÀϹÝÁúÀÇ(query) µî°ú °°Àº ±âÁ¸ÀÇ µ¥ÀÌÅͺ£À̽º Á¶È¸ µµ±¸¿Í ¾î¶»°Ô ´Ù¸¥°¡? °ú¿¬ data miningÀº ±âÁ¸ÀÇ ¹æ½ÄÀ¸·Î´Â Á¶È¸ÇÒ ¼ö ¾ø¾ú´ø Á¤º¸¸¦ ã¾Æ Áִ°¡?
  °á·ÐºÎÅÍ ¸»ÇÏÀÚ¸é data miningÀº ±âÁ¸ÀÇ Á¶È¸ µµ±¸¸¦ ´ëüÇÏ´Â °ÍÀÌ ¾Æ´Ï¶ó º¸¿ÏÇÏ´Â ±â´ÉÀ» Á¦°øÇÏ´Â °ÍÀÌ´Ù. ÇÏÁö¸¸ data miningÀ» ÅëÇØ Ãß°¡ÀûÀ¸·Î ¾ò°ÔµÇ´Â Á¤º¸ÀÇ °¡Ä¡´Â ±×¾ß¸»·Î ¹«ÇÑÇÏ´Ù. ¾î´À À¯Åë¾÷ü°¡ ¼ö³â°£ÀÇ ¿µ¾÷È°µ¿À» ÅëÇØ »ó´çÇÑ ¾çÀÇ °í°´ ±¸¸Åµ¥ÀÌÅ͸¦ ¼öÁýÇÏ¿© °ü¸®ÇÏ°í ÀÖ´Ù°í °¡Á¤ÇØ º¸ÀÚ. µ¥ÀÌÅÍ Á¶È¸¸¦ À§ÇØ °¡Àå ¸¹ÀÌ »ç¿ëÇÏ´Â ÀϹÝÁúÀÇ´Â "1998³â 12¿ù¿¡ AÁ¦Ç°À» ±¸¸ÅÇÑ °í°´ ¸í´ÜÀ» Á¶È¸ÇϽÿÀ.", "1999³â »ó¹Ý±â¿¡ RÁö¿ªÀÇ AÁ¦Ç° ÆǸÅÇöȲÀ» º¸¿©ÁֽÿÀ." µîÀÇ Çü½ÄÀ» ÃëÇϸç, Å×À̺íÀÇ ÇüÅ·Π°á°ú¸¦ Á¦°øÇÑ´Ù. ÀÌ¿¡ ¹ÝÇØ N°³ÀÇ µ¶¸³µÈ ¼Ó¼ºÀ¸·Î ±¸¼ºµÈ µ¥ÀÌÅ͸¦ NÂ÷¿ø(dimension) °ø°£¿¡¼­ ºÐ¼®ÇÑ´Ù´Â °³³äÀ» ±â¹ÝÀ¸·Î ÇÏ´Â OLAP µµ±¸´Â µ¥ÀÌÅ͸¦ ´ÙÂ÷¿øÀ¸·Î ºÐ¼®Çϸç, °á°ú¸¦ ÁÖ·Î ÀÌÇØÇϱ⠽¬¿î Â÷Æ®ÀÇ ÇüÅ·ΠÁ¦°øÇÑ´Ù. OLAP µµ±¸¸¦ ÀÌ¿ëÇÏ¿© "RÁö¿ª¿¡¼­´Â ¾î¶² »óÇ°µéÀÌ ÆÈ·È´ÂÁö¸¦ ¿ùº° ¹× °í°´ ¿¬·É´ëº°·Î º¸¿©ÁֽÿÀ."¶ó´Â Á¶È¸¸¦ ÇÒ °æ¿ì ÀÌ°ÍÀº 4Â÷¿ø(»óÇ°, Áö¿ª, ±â°£, ¿¬·É) ÁúÀÇ¿¡ ÇØ´çÇÑ´Ù. ±×¸² 1Àº °¡ÀüÁ¦Ç°»ç¿¡¼­ OLAPÀ» ÀÌ¿ëÇÏ¿© ƯÁ¤Áö¿ªÀÇ Á¦Ç° ÆǸÅÇöȲÀ» ¿ùº°, ¿¬·É´ëº°·Î Á¶È¸ÇÑ °á°úÀ̸ç, ±×¸² 2´Â ½Å¿ëÄ«µå»ç¿¡¼­ °í°´µéÀÇ Ä«µå µµ¿ëÇöȲÀ» Áö¿ªº°, µµ¿ëÀ¯Çüº°·Î ºÐ¼®ÇÑ È­¸éÀÌ´Ù.

±×¸² 1 OLAPÀ» ÀÌ¿ëÇÑ ¿ùº°, ¿¬·É´ëº° ¸ÅÃâÇöȲ ºÐ¼®

±×¸² 2 OLAPÀ» ÀÌ¿ëÇÑ Áö¿ªº°, »ç±âÀ¯Çüº° ½Å¿ëÄ«µå µµ¿ëÇöȲ ºÐ¼®

  ÀϹÝÁúÀdzª OLAP µµ±¸ µîÀÇ ±âÁ¸ Á¶È¸ ¹æ½Ä°ú´Â ´Þ¸® data miningÀº µ¥ÀÌÅÍ¿¡ ¼û°ÜÁ® ÀÖ´Â Á¤º¸¸¦ ã¾Æ³»´Âµ¥ »ç¿ëÇÑ´Ù. ¿¹¸¦ µé¾î "A¶ó´Â Á¦Ç°À» ±¸¸ÅÇÏ´Â °í°´µéÀÇ Æ¯¼ºÀº ¹«¾ùÀΰ¡?", "B»óÇ°À» À§ÇÑ À̺¥Æ®¿¡ ¾î¶² °í°´µéÀ» ÃÊ´ëÇÒ °ÍÀΰ¡?" µî°ú °°Àº Á¶È¸ÀÇ °á°ú¸¦ µµÃâÇϱâ À§ÇØ ±âÁ¸ÀÇ Á¶È¸¹æ½ÄÀ» ÀÌ¿ëÇÑ´Ù°í °¡Á¤Çغ¸ÀÚ. ¹°·Ð ±â´ëÇÏ´Â °á°ú¸¦ ¾òÀ» ¼öµµ ÀÖ´Ù. ±×·¯³ª ±âÁØÀÌ µÇ´Â ¼Ó¼ºµéÀ» »çÀü¿¡ ÆľÇÇÒ ¼ö ¾ø±â ¶§¹®¿¡ °á°ú¸¦ ¾ò±â À§Çؼ­´Â ¼ö¸¹Àº ½Ãµµ¿Í ½ÇÆа¡ ¿ä±¸µÈ´Ù. ´Ù½Ã ¸»ÇÏÀÚ¸é Áö±Ý±îÁö µ¥ÀÌÅÍÀÇ ºÐ¼®°ú È°¿ë¿¡ »ç¿ëµÇ¾î ¿Â ÁúÀdzª OLAP µµ±¸, ±×¸®°í À̵éÀ» ±â¹ÝÀ¸·Î ¸¸µé¾îÁø ÀÇ»ç°áÁ¤Áö¿ø½Ã½ºÅÛ(decision support systems)À̳ª Áß¿ªÁ¤º¸½Ã½ºÅÛ(executive information systems)µîÀº ±×¸² 3¿¡¼­ º¸¿©ÁÖµíÀÌ ¿øÄ¢ÀûÀ¸·Î ¹Ì¸® °¡¼³(Á¤º¸)À» ¼¼¿ì°í µ¥ÀÌÅ͸¦ ÅëÇØ ±× °¡¼³À» È®ÀÎÇÏ´Â ¹æ½ÄÀ̾ú´Ù. Áï »ç¿ëÀÚ°¡ ÀÚ½ÅÀÇ °æÇè¿¡ ºñÃß¾î °¡¼³À» ¼¼¿ì°í, ¿©±â¿¡ ¸ÂÃß¾î ÁúÀǸ¦ ¸¸µé¾î ½ÇÇàÇϸç, °á°ú¸¦ °ËÅäÇÏ¿© °¡¼³ÀÌ ¸Â´ÂÁö Ʋ¸®´ÂÁö¸¦ È®ÀÎÇÏ´Â °ÍÀÌ´Ù. ¸¸¾à °¡¼³ÀÌ Æ²¸®´Ù´Â °á°ú°¡ ³ª¿Â °æ¿ì¿¡´Â È®ÀεǴ °á°ú°¡ ³ª¿Ã ¶§±îÁö, ȤÀº »ç¿ëÀÚ°¡ °¡¼³ÀÌ Æ²·È´Ù°í »ý°¢ÇÒ ¶§±îÁö ÁúÀǸ¦ ¹Ýº¹ÇÑ´Ù. ±×·¯³ª ÀÌ·¯ÇÑ ¹æ½ÄÀº ÀûÀýÇÑ °¡¼³À» ¼¼¿ï ¼ö ¾ø´Â »óȲ¿¡¼­´Â Àû¿ëÇϱ⠰ï¶õÇϸç, °¡¼³ÀÌ È®Àεǰųª ºÎÁ¤µÇ´Â °Í ¿Ü¿¡´Â »õ·Î¿î Á¤º¸°¡ °ÅÀÇ »ý¼ºµÇÁö ¾Ê´Â´Ù. ¾Õ¿¡¼­ ¾ð±ÞÇßµíÀÌ ¹ÖÅ©ÄÚÆ®¿Í °¡Á×Ä¡¸¶ÀÇ °ü°è´Â ¿¹Àü¿¡´Â ÀüÇô ¿¹»óÇÏÁö ¸øÇß´ø Á¤º¸À̹ǷΠ°¡¼³Á¶Â÷ ¼¼¿ìÁö ¾Ê¾Æµµ ÄÄÇ»ÅͽýºÅÛÀÌ °¡´ÉÇÑ °¡¼³À» ½º½º·Î »ý¼ºÇÏ°í À̸¦ °ËÁõÇÏ´Â data miningÀº ±×¸² 4¿Í °°ÀÌ °¡¼³À» ¹ß°ßÇÏ´Â ¹æ½ÄÀ¸·Î »ç¿ëÀÚÀÇ °¡À̵带 °ÅÀÇ ¹ÞÁö ¾Ê°í Á¤º¸¸¦ ã´Â´Ù. Àß ¼³°èµÈ data mining µµ±¸´Â µ¥ÀÌÅͷκÎÅÍ ÂªÀº ½Ã°£ ³»¿¡ °¡´ÉÇÑ ÇÑ ´Ù¼öÀÇ À¯¿ëÇÑ °¡¼³À» »êÃâÇس»´Â ¹æ½ÄÀ¸·Î Á¤º¸¸¦ ¹ß°ßÇϵµ·Ï ¼³°èµÇ¾î ÀÖ´Ù.

±×¸² 3 °¡¼³ È®ÀÎ Áß½ÉÀÇ ±âÁ¸ Á¶È¸ ¹æ½Ä

±×¸² 4 °¡¼³ ¹ß°ß Áß½ÉÀÇ data mining ¹æ½Ä

  ÀçÂ÷ °­Á¶ÇÏ°íÀÚ ÇÏ´Â ¹Ù´Â ±âÁ¸ÀÇ Á¶È¸ ¹æ½Ä°ú data mining ¹æ½ÄÀº »óÈ£ º¸¿Ï °ü°è¿¡ ÀÖ´Ù´Â °ÍÀÌ´Ù. data miningÀº »óÈ£ º¸¿Ï °ü°è¿¡ ÀÖ´Ù´Â °ÍÀÌ´Ù. data miningÀº ±âÁ¸ÀÇ ¹æ½ÄÀ¸·Î´Â ¾òÀ» ¼ö ¾ø´Â Ãß°¡ÀûÀÎ Á¤º¸¸¦ Á¦°øÇÑ´Ù. ±×¸®°í ÀÌ·¯ÇÑ Á¤º¸´Â ±âÁ¸ÀÇ ¹æ½ÄÀ» ÅëÇØ °ËÁõµÈ´Ù. µû¶ó¼­ ±âÁ¸ÀÇ Á¶È¸¹æ½ÄÀÌ Áö¿øÇÏÁö ¸øÇϴ ȯ°æ¿¡¼­ data miningÀ» »ç¿ëÇÏ·Á´Â °ÍÀº ÀϹÝÀûÀ¸·Î µ¥ÀÌÅÍ¿¡ ³»ÀçµÇ¾î ÀÖ´Â Á¤º¸ÀÇ 90% Á¤µµ¸¦ Â÷ÁöÇÏ´Â ±âº» Á¤º¸´Â ¹«½ÃÇÑ Ã¤ 10% À̳»ÀÇ ¼û°ÜÁø Á¤º¸¸¸À» ã°Ú´Ù´Â ¹ß»óÀ¸·Î, ÀÌ´Â °ÈÁöµµ ¸øÇÏ´Â ¾Æ±â¿¡°Ô Áٳѱ⸦ °¡¸£Ä¡´Â °Í¿¡ ºñÀ¯ÇÒ ¼ö ÀÖ´Ù. ±×¸² 5´Â ÀϹÝÁúÀÇ, OLAP, ±×¸®°í data miningÀ» ÅëÇØ ¾òÀ» ¼ö ÀÖ´Â Á¤º¸ÀÇ ±íÀ̸¦ º¸¿©ÁÖ´Â ±×¸²ÀÌ´Ù.

±×¸² 5 ºÐ¼® ¹æ½Ä¿¡ µû¸¥ Á¤º¸ÀÇ ±íÀÌ

 

3. ÀÛ¾÷À¯Çü

  data mining ÀÛ¾÷ À¯ÇüÀº µ¥ÀÌÅ͸¦ ºÐ¼®ÇÏ¿© ¾î¶² Á¾·ùÀÇ Á¤º¸¸¦ ã°íÀÚ Çϴ°¡¿¡ µû¶ó ±¸ºÐµÈ´Ù. data miningÀ» ÅëÇØ µµÃâµÇ´Â Á¤º¸ÀÇ Á¾·ù´Â ´Ù¾çÇϳª ¿©±â¼­´Â ³Î¸® ¾Ë·ÁÁø ´ëÇ¥ÀûÀÎ Á¾·ù ¸î °¡Áö¸¦ »ìÆ캸°Ú´Ù.

  (1) ¿¬°ü(Association) ±ÔÄ¢

   "¾î¶² »óÇ°µéÀÌ ÇÔ²² Àß Æȸ®³ª?", "AÁ¦Ç°À» ±¸ÀÔÇÑ °í°´¿¡°Ô ¾î¶² Á¦Ç°À» ÇÔ²² ÆÈ ¼ö ÀÖÀ»±î?", "Ä«µå»ç±â À¯Çü°£¿¡´Â ¾î¶² °ü°è°¡ ÀÖ³ª?" ÇÑ Ç׸ñÀÇ °ªÀ» ¾Ë °æ¿ì ´Ù¸¥ Ç׸ñÀÇ °ªÀ» ¿¹ÃøÇÒ ¼ö ÀÖ´Ù¸é µÎ Ç׸ñ°£¿¡´Â Á¾¼Ó(dependency) °ü°è°¡ Á¸ÀçÇÑ´Ù. ¿¬°ü ±ÔÄ¢À» ¹ß°ßÇÏ´Â ÀÛ¾÷À̶õ µ¥ÀÌÅÍ ¾È¿¡ Á¸ÀçÇÏ´Â Ç׸ñ°£ÀÇ Á¾¼Ó°ü°è¸¦ ã¾Æ³»´Â ÀÛ¾÷À̸ç, ¸¶ÄÉÆÿ¡¼­´Â ¼Õ´ÔÀÇ Àå¹Ù±¸´Ï¿¡ µé¾îÀÖ´Â Ç°¸ñ°£ÀÇ °ü°è¸¦ ¾Ë¾Æº»´Ù´Â Àǹ̿¡¼­ Àå¹Ù±¸´Ï ºÐ¼®(market basket analysis)À̶ó°íµµ ÇÑ´Ù.
  ¿¬°ü±ÔÄ¢Àº '(Ç׸ñA) & (Ç׸ñB) ¢¡ (Ç׸ñC)'ÀÇ ÇüÅ·εµ Ç¥ÇöÇϴµ¥, "Ç׸ñA¿Í Ç׸ñB¸¦ ÆûÇÔÇÑ °Å·¡´Â Ç׸ñCµµ Æ÷ÇÔÇÑ´Ù." ¶Ç´Â "Ç°¸ñA¿Í Ç°¸ñB¸¦ ±¸ÀÔÇÑ °í°´Àº C¶ó´Â Ç°¸ñµµ ±¸ÀÔÇÑ´Ù." µîÀ¸·Î Çؼ®ÇÑ´Ù. ±×·¯³ª ÀÌ·¯ÇÑ ±ÔÄ¢µéÀº ½ÇÁ¦ µ¥ÀÌÅ͸¦ ºÐ¼®ÇÒ ¶§¿¡´Â 100% ½Å·Úµµ¸¦ °¡Áö´Â °æ¿ì°¡ °ÅÀÇ µå¹°±â ¶§¹®¿¡ Åë»óÀûÀ¸·Î È®·ùÀ̳ª µµÇ¥ µîÀ» ÀÌ¿ëÇÏ¿© Á¤·®È­ÇÑ´Ù.
  ±×¸² 6Àº ³²¼ºÀÇ·ù »óÁ¡ÀÇ POS½Ã½ºÅÛ¿¡ ÀúÀåµÈ µ¥ÀÌÅͷκÎÅÍ Á¦Ç°°£ÀÇ ¿¬°ü°ü°è¸¦ ã¾Æº¸´Â ¿¹·Î "³ØŸÀÌ(NT011)¸¦ ±¸ÀÔÇÑ °í°´Àº ¼Åó(ST001)µµ ±¸ÀÔÇÑ´Ù."¿Í "Á¤Àå(FS123)°ú º§Æ®(BT432)¸¦ ±¸ÀÔÇϸé ÄÚÆ®(CT005)µµ ÇÔ²² ±¸ÀÔÇÑ´Ù."°í ÇÏ´Â µÎ °¡Áö ¿¬°ü±ÔÄ¢À» ¹ß°ßÇÏ¿´´Ù. ÀÌ¿Í °°Àº °á°ú¸¦ ÀÌ¿ëÇÏ¿© ¸ÅÀå¿¡ ³ØŸÀÌ(NT011)¿Í ¼ÅÃ÷(ST001)¸¦ ÇÔ²² Áø¿­ÇÑ´ÙµçÁö, Ä«Å»·Î±× Á¦À۽à Á¤Àå(FS123)°ú º§Æ®(BT432)¸¦ ÄÚÆ®(CT005)¿Í ÇÔ²² ÆÐÅ°ÁöÈ­ÇÏ´Â ¸¶ÄÉÆà Àü·«À» ¼ö¸³ÇÒ ¼ö ÀÖ´Ù. ÀϹÝÀûÀ¸·Î ¿¬°ü±ÔÄ¢Àº Á¦Ç°À̳ª ¼­ºñ½ºÀÇ ±³Â÷ÆǸÅ(cross selling), ¸ÅÀåÁø¿­(display), ÷ºÎ¿ìÆí(attached mailings), »ç±âÀû¹ß(fraud detection) µîÀÇ ´Ù¾çÇÑ ºÐ¾ß¿¡ È°¿ëµÈ´Ù.

±×¸² 6 POSµ¥ÀÌÅ͸¦ ÀÌ¿ëÇÑ ¿¬°ü±ÔÄ¢ ¹ß°ß

  (2) ¿¬¼Ó(Sequence) ±ÔÄ¢

   ¿¬¼Ó±ÔÄ¢À̶õ ¿¬°ü±ÔÄ¢¿¡ ½Ã°£°ü·Ã Á¤º¸°¡ Æ÷ÇÔµÈ ÇüÅÂÀÌ´Ù. ¿¹¸¦ µé¾î, "Áö³­ÁÖ¿¡ XÁÖ½ÄÀÌ 5ÀÏ µ¿¾È 10% ¿À¸£°í YÁÖ½ÄÀÌ °°Àº ±â°£ µ¿¾È 10~20% ¿Ã¶úÀ» ¶§, ±ÝÁÖ¿¡ ZÁÖ½ÄÀÌ ¿À¸¦ È®·üÀº 70%ÀÌ´Ù.", "»õ ³ÃÀå°í¸¦ ±¸ÀÔÇÑ °í°´ Áß ÇÑ ´Þ À̳»¿¡ »õ ¿ÀºìÀ» ±¸ÀÔÇÏ´Â °æÇâÀÌ ¸¹´Ù." µî°ú °°ÀÌ ½Ã°£»ó¿¡ ¼øÂ÷ÀûÀ¸·Î ³ªÅ¸³ª´Â »ç°ÇÀ̳ª °Å·¡ÀÇ Á¾¼Ó°ü°è¸¦ ÀǹÌÇÑ´Ù.
  ±×¸² 7Àº ¿¬¼Ó±ÔÄ¢À» ã¾Æ³»´Â ¿¹¸¦ »óÇ°ÆǸŠµ¥ÀÌÅ͸¦ ÀÌ¿ëÇÏ¿© ¼³¸íÇÏ°í ÀÕ´Ù. µ¥ÀÌÅʹ ȸ¿øº°, °Å·¡ÀϺ°¿¡ µû¶ó ¿À¸§Â÷¼øÀ¸·Î Á¤¸®µÇ¾î Àִµ¥, 99³â 2¿ù 5ÀÏ¿¡ AÇ°¸ñÀ» ±¸ÀÔÇÑ 1¹ø ȸ¿øÀÌ 99³â 2¿ù 19ÀÏ¿¡ HÇ°¸ñµµ ±¸ÀÔÇÑ °ÍÀ» ¾Ë ¼ö ÀÖ´Ù. ¸¶Âù°¡Áö·Î ȸ¿ø¹øÈ£°¡ 2¹ø, 4¹øÀÎ °í°´µµ AÇ°¸ñÀ» ±¸ÀÔÇÑ ÈÄ HÇ°¸ñÀ» ±¸ÀÔÇß´Ù. ÀÌ·¯ÇÑ µ¥ÀÌÅ͸¦ ±Ù°Å·Î "AÇ°¸ñÀ» ±¸ÀÔÇÑ È¸¿øÀÌ ÇâÈÄ HÇ°¸ñÀ» ±¸ÀÔÇÒ °¡´É¼ºÀº 75%ÀÌ´Ù."¶ó´Â ¿¬¼Ó±ÔÄ¢À» µµÃâÇØ ³¾ ¼ö ÀÖÀ¸¸ç, 99³â 2¿ù 21ÀÏ¿¡ AÇ°¸ñÀ» ±¸ÀÔÇÑ 5¹ø ȸ¿ø¿¡°Ô HÇ°¸ñÀ» ±ÇÇÏ´Â ¸¶ÄÉÆà Àü·«À» ¼¼¿ï ¼ö ÀÖ´Ù. À§¿¡¼­ º¸µíÀÌ ¿¬¼Ó±ÔÄ¢¿¡´Â ½Ã°£ÀÇ È帧ÀÌ Æ÷ÇԵǾî Àֱ⠶§¹®¿¡ ¿¬°ü±ÔÄ¢¿¡ ºñÇØ ´õ ±¸Ã¼ÀûÀ̸ç, ¸ñÇ¥(target) ¸¶ÄÉÆÃÀ̳ª ÀÏ´ëÀÏ(one-to-one) ¸¶ÄÉÆÿ¡ ¹Ù·Î È°¿ëÇÒ ¼ö ÀÖ´Ù. ±×·¯³ª ¿¬¼Ó±ÔÄ¢À» ã±â À§Çؼ­´Â µ¥ÀÌÅÍ¿¡ °Å·¡ÀÏÀ̳ª °Å·¡Ç°¸ñ ÀÌ¿Ü¿¡µµ °í°´ÀÇ ±¸¸Å ÀÌ·Â(history) ¼Ó¼ºÀÌ ¹Ýµå½Ã ÇÊ¿äÇÏ´Ù´Â Á¶°ÇÀÌ ¸¸Á·µÇ¾î¾ß ÇÑ´Ù.

±×¸² 7 POSµ¥ÀÌÅ͸¦ ÀÌ¿ëÇÑ ¿¬¼Ó±ÔÄ¢ ¹ß°ß

  (3) ºÐ·ù(Classification) ±ÔÄ¢

   µ¿¹°À» ÆÄÃæ·ù, Æ÷À¯·ù, ¾ç¼­·ù µîÀ¸·Î, Àΰ£À» ȲÀÎÁ¾, ¹éÀÎÁ¾, ÈæÀÎÁ¾À¸·Î, ±×¸®°í ¼Ò°í±â¸¦ 1µî±Þ, 2µî±Þ, 3µî±ÞÀ¸·Î ºÐ·ùÇϵíÀÌ »ç¶÷µéÀº ÆíÀǸ¦ À§ÇØ ¼¼»óÀÇ ¸¹Àº »ç¹°À̳ª »ç°Ç µîÀÇ °³Ã¼¸¦ ºÎ·ù³ª µî±ÞÀ¸·Î ³ª´©°ï ÇÑ´Ù. ºÐ·ù´Â data mining¿¡¼­ °¡Àå ¸¹ÀÌ »ç¿ëµÇ´Â ÀÛ¾÷À¸·Î ºÎ·ù°ªÀÌ Æ÷ÇÔµÈ °ú°ÅÀÇ µ¥ÀÌÅͷκÎÅÍ ºÎ·ùº° Ư¼ºÀ» ã¾Æ³»¾î ºÐ·ù¸ðÇüÀ» ¸¸µé°í, À̸¦ Åä´ë·Î »õ·Î¿î ·¹ÄÚµåÀÇ ºÎ·ù°ªÀ» ¿¹ÃøÇÏ´Â °ÍÀ» ÀǹÌÇÑ´Ù. ¿¹¸¦ µé¾î A¾÷ü°¡ »õ·Î¿î Åë½Å±â±âÀÇ ÇÁ·Î¸ð¼Ç ´ë»ó°í°´À» ¼±Á¤Çϱâ À§ÇØ ÀÓÀÇ·Î °í°´ Ç¥º»À» ÃßÃâÇÏ¿© ¿ìÆí¹°À» ¹ß¼ÛÇÏ¿´´Ù°í °¡Á¤ÇØ º¸ÀÚ. °í°´ ¹× ÀÀ´ä °á°ú µ¥ÀÌÅÍ¿Í ±àÁ¤ÀûÀÎ ¹ÝÀÀÀ» º¸ÀÎ ÀÀ´äÀÚÀÇ Æ¯¼ºÀº ±×¸² 8°ú °°´Ù. ¿©±â¼­ ºÐ·ù±ÔÄ¢À» ¹ß°ßÇÏ´Â ÀÛ¾÷À̶õ '¿¹'¶ó°í ÀÀ´äÇÑ °í°´À̳ª '¾Æ´Ï¿À'¶ó°í ÀÀ´äÇÑ °í°´ÀÇ ÀϹÝÀûÀΠƯ¼ºÀ» ã¾Æ³»´Â °ÍÀε¥, ºÐ¼®°á°ú '¿¹'¶ó°í ÀÀ´äÇÑ °í°´µéÀº ³ªÀ̳ª °ÅÁÖÁö¿¡ °ü°è¾øÀÌ Á÷¾÷ÀÌ 'ÀÚ¿µ'À̰ųª, 43¼¼ ÀÌÇÏÀÇ °í¿ëÁ÷, ¶Ç´Â Á÷¾÷Àº ¾øÀ¸³ª °­³²¿¡ °ÅÁÖÇѴٴ Ư¼ºÀ» °¡Áö°í ÀÖ´Â °ÍÀ» ¾Ë ¼ö ÀÖ´Ù. ÀÌ·¯ÇÑ ±ÔÄ¢À» ¹ÙÅÁÀ¸·Î °í°´ ÀüüÀÇ ¸ðÁý´Ü¿¡¼­ ÇÁ·Î¸ð¼Ç ´ë»óÀ» ¼±Á¤ÇÑ´Ù¸é ³·Àº ºñ¿ëÀ¸·Î ±¸¸Å °¡´É¼ºÀÌ ³ôÀº °í°´¸¸À» ¸ñÇ¥¸¶ÄÉÆÃÀ» Àü°³ÇÒ ¼ö ÀÖ´Ù. ºÐ·ù±ÔÄ¢ÀÇ ´Ù¸¥ ¿¹·Î´Â ½Å¿ëÄ«µå ȸ»çÀÇ °í°´ ½Å¿ëÆò°¡ ¸ðÇüÀÌ´Ù. ÀÌ È¸»ç¿¡¼­´Â Áö±Ý±îÁöÀÇ °Å·¡¸¦ Åä´ë·Î °í°´µéÀÇ ½Å¿ëÀ» <¿ì¼ö, º¸Åë, ºÒ·®>À¸·Î ºÐ·ùÇß´Ù. 'ºÒ·®' Æò°¡¸¦ ¹ÞÀº °í°´ÃþÀÇ Æ¯¼º Áß Çϳª°¡ "25~30¼¼ °¡·®ÀÇ ¹ÌÈ¥³²À¸·Î ¿ù Æò±Õ ¼öÀÔÀÌ 200¸¸¿ø ÀÌÇÏÀÎ °í°´"À̶ó¸é, ½Å±Ô Ä«µå °¡ÀÔÀÚµéÀÇ ½Å¿ëÆò°¡½Ã ÀÌ·¯ÇÑ ±ÔÄ¢À» È°¿ëÇÔÀ¸·Î½á º¸´Ù °´°üÀûÀÎ ÀÇ»ç°áÁ¤À» À¯µµÇÒ ¼ö ÀÖ´Ù.

±×¸² 8 ÀÀ´ä µ¥ÀÌÅÍ ºÐ¼®À» ÅëÇÑ ºÐ·ù±ÔÄ¢ ¹ß°ß

  (4) µ¥ÀÌÅÍ ±ºÁýÈ­(Clustering)

   ±ºÁýÈ­¶õ ·¹ÄÚµåµéÀ» À¯»çÇÑ Æ¯¼ºÀ» Áö´Ñ ¸î °³ÀÇ ¼Ò±×·ìÀ¸·Î ºÐÇÒÇÏ´Â ÀÛ¾÷À» ¶æÇÑ´Ù. ÀÛ¾÷ÀÇ Æ¯¼ºÀÌ ºÐ·ùÀÛ¾÷°ú Èí»çÇÏ´Ù°í »ý°¢ÇÒ ¼ö ÀÖÀ¸³ª, ºÐ¼®ÇÏ°íÀÚ ÇÏ´Â µ¥ÀÌÅÍ¿¡ ºÎ·ù°¡ Æ÷ÇԵǾî ÀÖÁö ¾Ê´Ù´Â Á¡¿¡¼­ Â÷ÀÌ°¡ ÀÖÀ¸¸ç, ´Ù¸¥ data mining ÀÛ¾÷À» À§ÇÑ ¼±Çà ÀÛ¾÷À¸·Î¼­ÀÇ ¿ªÇÒÀ» ¼öÇàÇÏ´Â °æ¿ì°¡ ¸¹´Ù. ¿¹¸¦ µé¾î ¾î¶² ¹éÈ­Á¡¿¡¼­ °í°´À» È¿À²ÀûÀ¸·Î °ü¸®Çϱâ À§ÇØ °í°´µéÀ» ¸î °³ÀÇ ºÎ·ù·Î ±¸ºÐÇÏ·Á ÇÑ´Ù°í °¡Á¤ÇØ º¸ÀÚ. ÀÌ ¹éÈ­Á¡¿¡¼­´Â Áö±Ý±îÁö °í°´ÀÇ ÃÖ±Ù ±¸¸Å°æ·Â, ±¸¸Åºóµµ, ±¸¸Å¾×(RFM: Recency, Frequency, Monetary) µîÀ» ±âÁØÀ¸·Î °í°´À» VIP°í°´, ¿ì¼ö°í°´, ÀÏ¹Ý°í°´ µîÀ¸·Î ºÐ·ùÇÏ¿© °ü¸®ÇÏ¿´´Ù. ±×·¯³ª À̺¥Æ®³ª ÇÁ·Î¸ð¼Ç ´ë»óÀ» ¼±Á¤Çϴµ¥ ÀÖ¾î ÇöÀçÀÇ °í°´ºÎ·ù´Â ³Ê¹«³ª Ãß»óÀûÀÌ°í °í°´ÀÇ °³Àκ° Ư¼ºÀ» ÀüÇô °í·ÁÇÏÁö ¸øÇÏ°í ÀÖ¾î È°¿ëµµ°¡ ±×´ÙÁö ³ôÁö ¾Ê´Ù. ±×¸² 9´Â °í°´ÀÇ ±¸¸ÅÀ̷»Ӹ¸ ¾Æ´Ï¶ó ÀηùÅë°èÇÐÀû µ¥ÀÌÅÍ, ¶óÀÌÇÁ½ºÅ¸ÀÏ µ¥ÀÌÅÍ, ±×¸®°í ÁöºÒÀ¯Çü µîÀÇ ´Ù¾çÇÑ µ¥ÀÌÅÍ¿¡ ±ºÁýÈ­ ±â¹ýÀ» Àû¿ëÇÏ¿© ¿©¼¸ °³ÀÇ °í°´ ºÎ·ù¸¦ »õ·Ó°Ô Çü¼ºÇÑ ÈÄ, °¢ ±ºÁýº° Ư¼ºÀ» ºÐ·ù¸ðÇüÀ» ÅëÇØ ¾Ë¾Æº¸´Â ÀýÂ÷¿Í B±ºÁý¿¡ ¼ÓÇÑ °í°´µéÀÇ Æ¯¼ºÀ» º¸¿©ÁÖ°í ÀÖ´Ù. ÀÌ¿Í °°ÀÌ °í°´ÀÇ ±ºÁýº° Ư¼ºÀ» ÆľÇÇÒ ¼ö ÀÖ´Ù¸é, Àû¾îµµ B±ºÁý¿¡ ¼ÓÇÑ °í°´µé¿¡°Ô ¾î¸°ÀÌ ÀÇ·ù³ª Àå³­°¨ Ä«Å»·Î±×¸¦ ¹ß¼ÛÇÏ´Â ¿ì·Á´Â ÇÇÇÒ ¼ö ÀÖ´Ù.

 

4. ÀÀ¿ëºÐ¾ß

  ±¹³»ÀÇ °æ¿ì data miningÀº ¾ÆÁ÷Àº °³³äÀ̳ª ±â¹ý, Á¦Ç° µîÀÌ ¼Ò°³µÇ´Â Ãʱ⠵µÀÔ ´Ü°èÀÌ´Ù. ±×·¯³ª Á¤º¸È­¿¡ ¾Õ¼­°¡´Â ¸¹Àº ¿Ü±¹ ¼±Áø±â¾÷µéÀ» ÅëÇØ ½ÇÁ¦ ÀÀ¿ë »ç·ÊµéÀ» Á¢ÇÒ ¼ö Àִµ¥ ¿¹¸¦ µé¾î ¹Ì±¹ÀÇ Ä«µåȸ»çÀÎ ¾Æ¸Þ¸®Ä­ ÀͽºÇÁ·¹½º»ç(American Express)¿Í Åë½Å¾÷üÀÎ ¿¡Æ¼¿£Æ¼»ç(AT&T)´Â °í°´µ¥ÀÌÅÍ ºÐ¼®À» ÅëÇÑ ¸¶ÄÉÆà Ȱµ¿ Áö¿øÀ» À§ÇØ, ¿µ±¹ÀÇ BBC¹æ¼ÛÀº ÇÁ·Î±×·¥¿¡ ´ëÇÑ °í°´º° ¼±È£µµ¸¦ ºÐ¼®Çϱâ À§ÇØ data mining ÇÁ·ÎÁ§Æ®¸¦ ¼öÇàÇÏ¿´´Ù. ÀÌ¿Ü¿¡µµ ÀºÇàÀ̳ª º¸Çè»ç µî¿¡¼­ÀÇ ½Ç±¸Ãà »ç·Ê¸¦ ´Ù¼ö Á¢ÇÒ ¼ö Àִµ¥ À̵éÀº data miningÀÌ ¾ÕÀ¸·Î ÀÚ»çÀÇ °æÀï·Â Çâ»ó¿¡ »ó´çÇÑ ¿ªÇÒÀ» ÇÒ °ÍÀ¸·Î ±â´ëÇÏ°í ÀÖ´Ù. ±×·¯³ª data miningÀº À§¿¡¼­ ¾ð±ÞÇÑ Æ¯¼º ¾÷Á¾¿¡¸¸ ±¹ÇÑµÈ °ÍÀÌ ¾Æ´Ñ ¸ðµç ºÐ¾ß¿¡ Àû¿ëÇÒ ¼ö ÀÖ´Â ¼öÆòÀû ÀÀ¿ëÀû ±â¼úÀÌ´Ù. »ç½Ç "´©°¡ ÇÊ¿ä·Î Çϴ°¡?" º¸´Ù´Â "´©°¡ ÇÊ¿ä·Î ÇÏÁö ¾Ê´Â°¡?" ¶ó°í ¹¯´Â ÆíÀÌ ´õ ³ªÀ» °ÍÀÌ´Ù. ´ÜÁö ¾ÆÁ÷±îÁö´Â data miningÀÇ ¼º°ø»ç·Ê°¡ ÁÖ·Î µ¥ÀÌÅÍÀÇ Ãæ½Çµµ°¡ »ó´ëÀûÀ¸·Î ³ôÀº ÀºÇà, Ä«µå, º¸Çè µîÀÇ ±ÝÀ¶ºÐ¾ß¿Í Åë½ÅºÐ¾ß¿¡¼­ ÁÖ·Î ¹ßÇ¥µÇ°í ÀÖÀ» »ÓÀÌ´Ù.
  Ç¥ 1¿¡¼­´Â data miningÀ» Àû¿ëÇÒ ¼ö ÀÖ´Â ºÐ¾ß ¹× »ç·ÊµéÀÇ ÀϺθ¦ ³ª¿­ÇÏ¿´´Ù. data miningÀÌ Á¦°øÇÏ´Â Á¤º¸µéÀº È£°úÀûÀÎ ±¤°íÀü·« °³¹ßÀ̳ª »óÇ° ¹èÄ¡, ¸ñÇ¥°í°´ ¼±Á¤, ÇÁ·Î¼¼½ºÀÇ °³¼± µî¿¡ È°¿ëµÊÀ¸·Î½á ÀüüÀûÀÎ ºñÁî´Ï½º È¿À² Çâ»ó°ú ºñ¿ë Àý°¨À» ²ÒÇÒ ¼ö ÀÖ´Ù. ¶ÇÇÑ data mining¿¡¼­ ¹ß±¼µÇ´Â Á¤º¸¸¦ ÅëÇØ ±â¾÷Àº ¼±Á¡ È¿°ú¸¦ ´©¸± ¼ö ÀÖ´Â °æ¿ì°¡ ¸¹´Ù. Áï ¸ÕÀú ±× Á¤º¸¸¦ È®º¸ÇÏ¿© È°¿ëÇÔÀ¸·Î½á °í°´À» ¸ðÀ¸°í ¼­ºñ½º¸¦ Á¦°øÇϴµ¥ À¯¸®ÇÑ À§Ä¡¸¦ È®º¸ÇÏ°Ô µÇ´Â °ÍÀÌ´Ù.

Ç¥ 1 data miningÀÇ ÀÀ¿ëºÐ¾ß ¹× Àû¿ë »ç·Ê

ºÐ   ¾ß

Àû¿ë »ç·Ê

¼Ò¸Å/¸¶ÄÉÆÃ

  • °í°´ÀÇ ±¸¸ÅÆÐÅÏ°ú ¼±È£µµ ¹ß°ß
  • DM(Direct Mail)¿¡ ÀÀ´äÇÒ °¡´É¼ºÀÌ ³ôÀº °í°´ ¿¹Ãø
  • Á¦Ç°/¼­ºñ½º ±³Â÷ÆǸÅ
  • ÆǸŠ½ÇÀû¿¡ ¿µÇâÀ» ¹ÌÄ¡´Â ¿ä¼Ò ¹ß°ß
  • °í°´ ºÐ·ù, ±×·ìº° Ư¼º ¹ß°ß
  • ±¤°í, ÇÁ·Î¸ð¼Ç, À̺¥Æ®ÀÇ È¿°ú ÃøÁ¤

ÀºÇà, Ä«µå

  • ½Å¿ëÄ«µå µµ¿ëÆÐÅÏ ÃßÀû
  • ÀÌÅ» ¿¹»ó°í°´ ¼±Á¤ ¹× Ư¼º ºÐ¼®
  • ¿ì¼ö°í°´ ¼±Á¤ ¹× Ư¼º ºÐ¼®
  • ¼­ºñ½ºº° È«º¸ ´ë»ó°í°´ ¼±Á¤
  • ½Å¿ëÆò°¡ ¸ðÇü °³¹ß
  • ÁÖ½Ä °Å·¡±ÔÄ¢ ¹ß°ß

º¸Çè

  • °í°´ºÐ·ù¸¦ ÅëÇÑ º¸Çè·á °¡°Ý Á¤Ã¥ ¼ö¸³
  • º¸Çè·á û±¸ »ç±â ÆÐÅÏ ÃßÀû
  • Ŭ·¡ÀÓ Ã³¸®½Ã°£¿¡ ¿µÇâÀ» ¹ÌÄ¡´Â ¿ä¼Ò ¹ß°ß

Åë½Å

  • Àå°Å¸® ÀüÈ­/¹«¼± ÀüÈ­ÀÇ ºÎÁ¤ÇÑ ÀÌ¿ëÆÐÅÏ ÃßÀû
  • ÀÌÅ» ¿¹»ó°í°´ ¼±Á¤ ¹× Ư¼º ºÐ¼®
  • ¼­ºñ½º°£ÀÇ ¿¬°ü°ü°è ¹ß°ß
  • ¿ì¼ö°í°´ ¼±Á¤ ¹× Ư¼º ºÐ¼®

Á¦Á¶

  • ÃÖÁ¾ »ý»êÇ°ÀÇ Ç°Áú¿¡ ¿µÇâÀ» ¹ÌÄ¡´Â ¿äÀÎ ¹ß°ß
  • °æÀï»çÀÇ ÀÔÂû¾× ¿¹Ãø
  • Á¦Ç°ÀÇ ¼ö¿ä ¿¹Ãø
  • ´ë¸®Á¡ ¿©½ÅÆò°¡ ¸ðÇü °³¹ß

À¯Åë

  • ¸ÅÀåÁø¿­ Àü·« ¼ö¸³
  • »óÇ° Ä«Å»·Î±× µðÀÚÀÎ
  • »óÇ° ±³Â÷ÆǸÅ

ÀÇ·á

  • ȯÀÚÀÇ Áúº´ Áø´ÜÀ̳ª Áúº´ÀÇ ¿¹ÈÄ ºÐ¼®
  • ȯÀÚÀÇ Æ¯¼º¿¡ µû¸¥ ÀǾàÇ°ÀÇ ºÎÀÛ¿ë ºÐ¼®

 

5. ÇÁ·ÎÁ§Æ®¸¦ À§ÇÑ °í·Á»çÇ×

  data mining Á¦Ç°À» ±¸ÀÔÇÏ¿© ±âÁ¸ÀÇ µ¥ÀÌÅ͸¦ ºÐ¼®Çϸé À¯¿ëÇÑ Á¤º¸°¡ ½ñ¾ÆÁ® ³ª¿Ã °ÍÀ̶ó´Â ȯ»óÀ» °¡Áö°í ¼²ºÒ¸® ÇÁ·ÎÁ§Æ®¸¦ ½ÃÀÛÇÏ¸é ½ÊÁßÆȱ¸ ³¶Æи¦ º»´Ù. ÀÌ°ÍÀº data miningÀ» ´ÜÁö ÇϳªÀÇ ±â¼ú(technology)·Î ÀνÄÇÏ°í, ±â¹ýÀ̳ª µµ±¸ÀÇ ¼±Åðú ±â¼úÀûÀÎ Áö¿ø µî¿¡¸¸ °ú´ÙÇÏ°Ô Ä¡ÁßÇÏ´Â °ÍÀÌ ÁÖ¿ä ¿øÀÎÀÌ´Ù. ¿©±â¿¡¼­´Â ±â¾÷ÀÇ ±Ô¸ð³ª ÇÁ·ÎÁ§Æ®ÀÇ Å©±â¿¡ °ü°è¾øÀÌ ¼º°øÀûÀ¸·Î data mining ½Ã½ºÅÛÀ» ±¸ÃàÇϱâ À§ÇØ ¹Ýµå½Ã °í·ÁÇØ¾ß ÇÏ´Â »çÇ×µéÀ» Á¡°ËÇØ º¸°Ú´Ù.

  (1) ¸ñÇ¥ ¹× È°¿ë¹æ¾È

   "µ¥ÀÌÅͷκÎÅÍ ¹«¾ùÀ» ¾òÀ» °ÍÀΰ¡?" ÀÌ Áú¹®¿¡ ´ëÇÑ ¸íÈ®ÇÑ ÇØ´äÀ» °®°í ÀÖ¾î¾ß ÇÑ´Ù. À̸¦ À§Çؼ­´Â ±â¾÷ÀÇ °æÀï·Â Á¦°í Ãø¸é¿¡¼­ »ç¾÷¸ñÇ¥¸¦ Á¦´ë·Î ÀÌÇØÇÏ°í, ÇØ´ç ¸ñÇ¥¸¦ ¼ºÃëÇϱâ À§ÇØ ¼ö¹ÝµÇ´Â ÁÖ¿ä ¼º°ø¿ä¼Ò(critical success factor)µéÀ» È®ÀÎÇØ¾ß ÇÑ´Ù. ¿¹¸¦ µé¾î ÀÚµ¿Â÷º¸Çè»çÀÇ »ç¾÷¸ñÇ¥ Áß Çϳª°¡ 'ƯÁ¤ »óÇ°ÀÇ ½ÃÀåÁ¡À¯À² À¯Áö'¶ó°í ÇÑ´Ù¸é ÁÖ¿ä ¼º°ø¿ä¼Ò·Î´Â °è¾à ¸¸±â Àü¿¡ ÇؾàÇÏ´Â °í°´À̳ª ¸¸±â ÈÄ Àç°è¾à ÇÏÁö ¾Ê´Â °í°´µéÀ» ´ë»óÀ¸·Î ÇÏ´Â 'ÀÌÅ»°í°´ ÃÖ¼ÒÈ­', ±×¸®°í »õ·Î ½ÅÂ÷¸¦ ±¸ÀÔÇÑ °í°´À̳ª Ÿ º¸Çè»ç °í°´À» ´ë»óÀ¸·Î ÇÏ´Â '½Å±Ô°í°´ À¯Ä¡' µîÀ» µé ¼ö ÀÖ´Ù. ±×·¯³ª ¸¸¾à »ç¾÷¸ñÇ¥°¡ ÀÌÀ±À» ±Ø´ëÈ­ÇÏ´Â °ÍÀ̶ó¸é, ÁÖ¿ä ¼º°ø¿ä¼Ò ÁßÀÇ Çϳª´Â ¸¶Âù°¡Áö·Î 'ÀÌÅ»°í°´ÀÇ ÃÖ¼ÒÈ­'ÀÏ ¼ö ÀÖÀ¸³ª, ¿©±â¿¡¼­ ÀÌÅ»°í°´ÀÇ Àǹ̴ ÇؾàÀ̳ª ¹Ì°è¾à °í°´ Áß¿¡¼­µµ °è¾à ±â°£ µ¿¾È »ç°í°æ·ÂÀÌ ¾ø°Å³ª °æ¹ÌÇÑ °í°´À¸·Î ÇÑÁ¤ÇØ¾ß ÇÑ´Ù. data mining ÇÁ·ÎÁ§Æ®¸¦ ¼öÇàÇÒ ¶§ ¸ñÇ¥°¡ ºÒºÐ¸íÇÏ°í ÁÖ¿ä ¼º°ø¿ä¼Ò°¡ ±¸Ã¼ÀûÀÌÁö ¸øÇÏ¸é ¿øõ µ¥ÀÌÅÍ(source data)ÀÇ ¼±Á¤¿¡ ¾î·Á¿òÀÌ µû¸£¸ç, µµÃâµÇ´Â Á¤º¸ÀÇ ½Å·Úµµ ¶ÇÇÑ ¶³¾îÁø´Ù. ÀÌÁ¦ »õ·Ó°í Èï¹ÌÀÖ´Â Á¤º¸¸¦ ¾ò¾ú´Ù°í ÇÏÀÚ. µÎ ¹ø° Áú¹®Àº "¾ÕÀ¸·Î À̵é Á¤º¸¸¦ ¾î¶»°Ô È°¿ëÇÒ °ÍÀΰ¡?"ÀÌ´Ù. data mining°ú °ü·ÃµÈ ´ëºÎºÐÀÇ ¿¬±¸³ª ÇÁ·ÎÁ§Æ®¸¦ »ìÆ캸¸é Á¤º¸¸¦ ¾òÀ» ¶§±îÁöÀÇ °èȹÀ̳ª ½ÇÇà°úÁ¤Àº ºñ±³Àû »ó¼¼Çϳª ±× ÀÌÈÄ°¡ ºÒºÐ¸íÇÑ °æ¿ì°¡ ¸¹´Ù. Áï Á¤º¸¸¦ ¾÷¹«¿¡ ¾î¶»°Ô È°¿ë(business action)ÇÒ °ÍÀΰ¡¿¡ ´ëÇÑ ¹æ¾ÈÀÌ ¹ÌÈíÇÏ´Ù´Â °ÍÀÌ´Ù. ÀÌ°ÍÀº »õ·Î¿î °Ç¹°À» ±Ù»çÇÏ°Ô °ÇÃàÇÏ¿© ³õ¾ÒÀ» »Ó ¿î¿µ°èȹµµ ¾øÀÌ ±×³É ¹æÄ¡ÇÏ°í ÀÖ´Â °æ¿ì¿Í ¸¶Âù°¡ÁöÀÌ´Ù. µû¶ó¼­ µµÃâÇÑ Á¤º¸¿¡ ´ëÇÑ ±¸Ã¼ÀûÀÌ°í Çö½Ç¼ºÀÌ ÀÖ´Â È°¿ë¹æ¾ÈÀ» ¸¶·ÃÇÏ¿©¾ß ÇÑ´Ù. À§ÀÇ ¿¹¿¡¼­ ¸¸¾à °ú°Å¿¡ ÀÌÅ»ÇÑ °í°´µéÀÇ Æ¯¼ºÀÌ ÆľǵǾú´Ù¸é, ³»´Þ¿¡ °è¾àÀÌ ¸¸·áµÇ´Â °í°´ Áß¿¡¼­ ÀÌÅ»°í°´µé°ú À¯»çÇÑ Æ¯Â¡À» Áö´Ñ °í°´µéÀ» Ưº° °ü¸®´ë»óÀ¸·Î »ï¾Æ ÀÛ°Ô´Â º¸´Ù Ä£ÀýÇÏ°í °ü½É¾î¸° ÀüÈ­¸¦ °É ¼ö ÀÖÀ¸¸ç, ³ª¾Æ°¡¼­´Â ºñ¿ëÀÌ Çã¶ôÇÏ´Â Çѵµ ³»¿¡¼­ °í°´ Ư¼º¿¡ ¸Â´Â °£´ÜÇÑ ¼±¹°À» ¹ß¼ÛÇÑ´ÙµçÁö º¸Çè¿ä±ÝÀ» Á¶Á¤ÇØ ÁÖ´Â °Í°ú °°Àº Àμ¾Æ¼ºê¸¦ Á¦°øÇÏ´Â Àü·«À» ±¸»óÇÒ ¼ö ÀÖ´Ù.

  (2) µ¥ÀÌÅÍÀÇ Ãæ½Çµµ

   "Garbage in garbage out!" Áï, ¾²·¹±â°¡ µé¾î°¡¸é ¾²·¹±â°¡ ³ª¿Â´Ù´Â ¸»ÀÌ´Ù. data miningÀ» ÅëÇÏ¿© ¾òÀº Á¤º¸ÀÇ ¿øõÀº ÀԷµǴ µ¥ÀÌÅÍÀ̱⠶§¹®¿¡ µµÃâµÇ´Â Á¤º¸ÀÇ ½Å·Úµµ´Â ¹Ù·Î ¿øõ µ¥ÀÌÅÍÀÇ Ç°Áú¿¡ ´Þ·ÁÀÖ´Ù°í Çصµ °ú¾ðÀÌ ¾Æ´Ï´Ù. µû¶ó¼­ data mining ÀÛ¾÷À» ¼öÇàÇϱâ Àü¿¡ ¹Ýµå½Ã Á¡°ËÇØ¾ß ÇÒ »çÇ×ÀÌ µ¥ÀÌÅÍÀÇ Ãæ½ÇµµÀÌ´Ù. Ãæ½Çµµ¶õ µ¥ÀÌÅ͸¦ ±¸¼ºÇÏ´Â ·¹ÄÚµå¿Í ¼Ó¼ºÀÇ ¼ö°¡ ÃæºÐÇÑ°¡¿¡ ´ëÇÑ ¾çÀû ôµµ¿Í ¼Ó¼ºÀÌ ÃëÇÑ °ªµéÀÌ Á¤È®ÇÑ°¡ ¶Ç´Â ºüÁø ¼Ó¼º °ªÀº ¾î´À Á¤µµÀΰ¡¿¡ ´ëÇÑ ÁúÀû ôµµ, ÀÌ µÎ °¡Áö¸¦ ÇÔ²² ÀǹÌÇÑ´Ù. µ¥ÀÌÅÍÀÇ Ãæ½Çµµ´Â data mining ÇÁ·ÎÁ§Æ®ÀÇ ¼ºÆи¦ Á¿ìÇÏ´Â °¡Àå Áß¿äÇÑ ¿ä¼Ò·Î¼­ ½ÇÁ¦ ÇÁ·ÎÁ§Æ®ÀÇ ´ëºÎºÐÀÌ ÀÌ°ÍÀ» ³ôÀ̴µ¥ ÇҾֵȴÙ.

  (3) ¹ý·ü¹®Á¦

   °³ÀÎÀÇ ÇÁ¶óÀ̹ö½Ã¸¦ º¸È£ÇÑ´Ù´Â °Í ¶ÇÇÑ Áß¿äÇÑ ¹®Á¦ÀÌ´Ù. ÇÁ¶û½º¿¡¼­´Â 2¸íÀÇ º¸Çè ´ë¸®ÀÎÀÌ °³ÀÎÀÇ µ¥ÀÌÅ͸¦ ºÒ¹ýÀ¸·Î »ç¿ëÇÏ¿© 10°³¿ùÀÇ Â¡¿ª°ú ¹ÌÈ­ 3000´Þ·¯ Á¤µµÀÇ ¹ú±ÝÀ» ¼±°í¹ÞÀº »ç·Ê°¡ ÀÖ´Ù. À̵éÀº ÇÁ¶û½ºÀÇ Àü·Âȸ»çÀÎ EDF(Electricite De France)·ÎºÎÅÍ »õ·Î¿î Àü¼±À» ¼³Ä¡ÇÑ »ç¶÷µéÀÇ ¸í´ÜÀ» È®º¸ÇÑ ÈÄ, °ü°èºÎó¿¡ À̸¦ ¾Ë¸®Áö ¾Ê°í ¸ñÇ¥¸¶ÄÉÆÿ¡ »ç¿ëÇÏ¿´´Ù. ±¹³»ÀÇ °æ¿ì¿¡µµ ¾ó¸¶ Àü ÇÑ µµ¼­ÆǸž÷ü°¡ ¸ð ´ëÇÐÀÇ ½ÅÀÔ»ý ¸í´ÜÀ» ÀÎÅͳÝÀ» ÅëÇØ È®º¸ÇÑ ÈÄ, ÀÏ´ëÀÏ ¸¶ÄÉÆÿ¡ È°¿ëÇÏ¿© ¹®Á¦°¡ ¹ß»ýÇϱ⵵ ÇÏ¿´´Ù. ½ÇÁ¦·Î ¸¹Àº ¼±Áø±¹°¡µéÀº ±â¾÷ÀÌ °³ÀÎÀÇ µ¥ÀÌÅ͸¦ ¼öÁý, Á¤¸® ¶Ç´Â ó¸®ÇÏ´Â °Í°ú °ü·ÃµÈ ÁöħÀ̳ª ¹ýÀ» ÁöÁ¤ÇÏ°í ÀÖµû. ¿ì¸®³ª¶óÀÇ °æ¿ìµµ À¯»ç¹ý·üÀÌ Á¦Á¤µÇ¾î Àִµ¥ ¿¹¸¦ µé¾î, ½Å¿ëÁ¤º¸ÀÇ ÀÌ¿ë ¹× º¸È£¿¡ °üÇÑ ¹ý·ü Á¦23Á¶ ¹× Á¦24Á¶¿¡ ÀÇÇÏ¸é ±â¾÷ÀÌ °³ÀÎÀÇ ½Å¿ëµ¥ÀÌÅ͸¦ »ç¿ëÇϱâ À§Çؼ­´Â °³ÀÎÀÇ µ¿ÀǸ¦ ¹Þµµ·Ï µÇ¾î ÀÖÀ¸¸ç, Á¦3ÀÚ¸¦ ÅëÇØ ¼öÁýÇÑ µ¥ÀÌÅ͸¦ »ç¿ëÇϱâ À§Çؼ­´Â ÇØ´ç ±â¾÷»Ó ¾Æ´Ï¶ó Á¦3ÀÚ ¶ÇÇÑ °³ÀÎÀÇ µ¿ÀǸ¦ ¹Þ¾Æ¾ß ÇÑ´Ù. ÀÌ°ÍÀº ¸¸¾à ÀüÀÚÁ¦Ç°À» Á¦Á¶ÇÏ°í ÆǸÅÇϴ ȸ»ç°¡ °¢ ´ë¸®Á¡À» ÅëÇØ ¼öÁýÇÑ °í°´ µ¥ÀÌÅ͸¦ ÀÌ¿ëÇÏ¿© ¸¶ÄÉÆà Ȱµ¿À» Àü°³ÇÏ·Á ÇÑ´Ù¸é, ÀüÀÚȸ»ç¿Í ´ë¸®Á¡ °øÈ÷ °³ÀÎÀÇ µ¿ÀǸ¦ ¾ò¾î¾ß¸¸ ÇÑ´Ù´Â °ÍÀ» ÀǹÌÇÑ´Ù. ±×·¯³ª °³ÀÎÀÇ µ¥ÀÌÅ͸¦ ¸ô·¡ ¼öÁýÇÏ°í À̸¦ ¹üÁË¿¡ »ç¿ëÇÏ´Â »ç°ÇÀÌ Áõ°¡ÇÔ¿¡ µû¶ó °³ÀÎÀÌ ÀÚ½ÅÀÇ µ¥ÀÌÅÍ¿¡ ´ëÇÑ °ø°³¸¦ ²¨¸®´Â °æÇâÀÌ ´Ã¾î³ª°í ÀÖÀ¸¸ç, ±¹³»ÀÇ °æ¿ì´Â ±× Á¤µµ°¡ ´õ ½ÉÇÑ »óȲÀÌ´Ù. µû¶ó¼­ ÇÕ¹ýÀûÀ¸·Î °³ÀÎÀÇ µ¥ÀÌÅ͸¦ »ç¿ëÇϰųª ¼öÁý ¶Ç´Â º¸°­ÇÏ´Â ¹æ¾ÈÀ» ¹Ýµå½Ã °­±¸ÇØ¾ß ÇÑ´Ù.

  (4) Àü¹® Àη Ȯº¸

   data miningÀº µ¥ÀÌÅͷκÎÅÍ ÀÚµ¿À¸·Î Á¤º¸¸¦ ÃßÃâÇϱ⠶§¹®¿¡ Àü¹®°¡ÀÇ Àü¹®Áö½ÄÀ̳ª °æÇèÀ» ´ëüÇÒ ¼ö ÀÖ´Ù. ¶ÇÇÑ ÀϹÝÁúÀdzª OLAP°ú´Â ´Þ¸® »ç¿ëÀÚ°¡ ¹Ì¸® °¡¼³À» ¼¼¿ì°Å³ª ÁöħÀ» Á¦°øÇÏÁö ¾Ê´Â´Ù. ÀÌ ¸»µéÀº »ç¿ëÀڵ鿡°Ô data miningÀº ¸¶Ä¡ À̾߱⠼ӿ¡ ³ª¿À´Â µµ±úºñ ¹æ¸ÁÀÌ¿Í °°Àº °ÍÀ̶ó´Â ȯ»óÀ» °®°Ô Çϱ⠽±´Ù. ±×·¯³ª data miningÀº ¿ÀÁ÷ ÁÖ¾îÁø µ¥ÀÌÅÍ¿¡¼­¸¸ Á¤º¸¸¦ ã±â ¶§¹®¿¡ "ÇÊ¿äÇÑ Á¤º¸¸¦ ¾ò±â À§Çؼ­´Â ¾î¶² µ¥ÀÌÅÍ, ƯÈ÷ ¾î¶°ÇÑ ¼Ó¼ºµé·Î ±¸¼ºµÈ µ¥ÀÌÅÍ°¡ ÇÊ¿äÇÏ´Ù."¿Í °°Àº Á¤º¸´Â ¾Ë·ÁÁÖÁö ¸øÇÑ´Ù. ¿¹¸¦ µé¾î, A»óÇ°À» ±¸¸ÅÇÒ ¸¸ÇÑ °í°´ÀÇ Æ¯¼ºÀ» ¾Ë¾Æ³»°í ±×·± Ư¼ºÀ» °¡Áø °í°´µé¸¸À» ´ë»óÀ¸·Î À̺¥Æ®¸¦ °³ÃÖÇÏ·Á ÇÑ´Ù°í ÇÏÀÚ. ¸¸¾à A»óÇ°À» ±¸¸ÅÇÒ °í°´µéÀÇ ½ÇÁ¦ Ư¼ºÀÌ '¿ù¼öÀÔÀÌ 200¸¸¿ø ÀÌ»ó'ÀÓ¿¡µµ ºÒ±¸ÇÏ°í data mining¿¡ ÀÌ¿ëµÈ µ¥ÀÌÅÍ¿¡ ¿ù¼öÀÔÀ̶ó´Â ¼Ó¼ºÀÌ ¾ø´Ù¸é, data miningÀº '¿©¼ºÀÌ¸ç °ÅÁÖÁö¿ªÀº ¼ÛÆı¸'¶ó´Â ´Ù¼Ò ¾û¶×ÇÑ Æ¯¼ºÀ» ã¾Æ³»¾î Á¦½ÃÇÒ ¼öµµ ÀÖ´Ù. ¶ÇÇÑ data miningÀ» ÅëÇØ ÀÏÂ÷ÀûÀ¸·Î ÃßÃâµÇ´Â Á¤º¸ÀÇ ¾çÀº »ó´çÈ÷ ¸¹À» ¼ö°¡ ÀÖ´Ù. ÀÌ Áß¿¡´Â data miningÀÇ Á¤ÀÇ¿¡¼­ ¾Ë ¼ö ÀÕµíÀÌ °ú°Å¿¡ ¾ËÁö ¸øÇß´ø °¡Ä¡ÀÖ´Â Á¤º¸µéµµ Á¸ÀçÇÏÁö¸¸, µ¥ÀÌÅÍ¿¡ ³»ÀçµÇ¾î ÀÖ´Â ¿À·ù°ª(incorrect value)À̳ª ƯÀÌ°ª(outlier) µîÀ¸·Î ÀÎÇØ Àǹ̰¡ ¾ø°Å³ª Ʋ¸° Á¤º¸µéµµ ´Ù¼ö Æ÷ÇԵǰï ÇÑ´Ù. ÀÌ¿Í °°Àº Á¤º¸¸¦ ¾Æ¹«·± ¿©°ú¾øÀÌ ±â¾÷°æ¿µ¿¡ ±×´ë·Î È°¿ëÇÑ´Ù¸é ±× °á°ú°¡ ±â¾÷¿¡ ¹ÌÄ¡´Â ¼Õ½ÇÀº ¾öû³¯ ¼ö°¡ ÀÖ´Ù. µû¶ó¼­ ÀûÀýÇÑ µ¥ÀÌÅÍÀÇ ¼±ÅÃÀ̳ª ÃßÃâµÇ´Â Á¤º¸ÀÇ ¿Ã¹Ù¸¥ Çؼ®À» À§ÇØ ¹Ýµå½Ã ¿ª·®ÀÖ´Â ¾÷¹« Àü¹®°¡³ª µ¥ÀÌÅÍ ºÐ¼®°¡ÀÇ µµ¿òÀ» ¹Þ¾Æ¾ß ÇÑ´Ù.

  (5) ÀûÀýÇÑ data mining µµ±¸

   data mining ÀÛ¾÷¿¡´Â ÀüÅëÀûÀÎ Åë°è, ÀÇ»ç°áÁ¤³ª¹«(decision tree), ½Å°æ¸Á(neural networks) µî ´Ù¾çÇÑ ±â¹ýµéÀÌ µ¶ÀÚÀûÀ¸·Î ȤÀº °áÇյǾî ÀÌ¿ëµÇ¸ç, ÃÖ±Ù µé¾î ÀÌ·¯ÇÑ ±â¹ýµéÀ» ±â¹ÝÀ¸·Î ÇÏ´Â »ç¿ëÈ­µÈ data mining µµ±¸µéÀÌ ¼ÒÇÁÆ®¿þ¾î³ª Çϵå¿þ¾î °ø±Þ¾÷ü(vendor)µéÀ» ÅëÇØ ´ë·®À¸·Î ¼Ò°³µÇ°í ÀÖ´Ù. ±× Áß¿¡´Â ¾ó¸¶Àü±îÁö¸¸ Çصµ ÃֽŠÁúÀÇ µµ±¸³ª OLAP µµ±¸¶ó°í ¼±ÀüµÇ¾î¿À´ø Á¦Ç°µéÀÌ ¼±Áø data mining µµ±¸·Î µÐ°©ÇØ ÀÖ´Â °æ¿ìµµ °£È¤ ¹ß°ßÇÒ ¼ö ÀÖ´Ù. data mining µµ±¸´Â SASÀÇ Enterprise Miner, SPSSÀÇ Clementine, ±×¸®°í IBMÀÇ Intelligent Miner µî°ú °°ÀÌ ¿©·¯ °¡Áö ±â¹ýµéÀ» Áö¿øÇÏ¿© data miningÀÇ ´Ù¾çÇÑ ÀÛ¾÷À» °¡´ÉÇÏ°Ô ÇÏ´Â ¹ü¿ëÁ¦Ç°±º¿¡¼­, Rulequest»çÀÇ C5.0À̳ª Neuro Dimension»çÀÇ NeuroSolutions µî°ú °°ÀÌ Æ¯º°È÷ ÇϳªÀÇ ±â¹ý¸¸À» Áö¿øÇÏ´Â Àü¿ëÁ¦Ç°±º±îÁö ´Ù¾çÇÏ´Ù. Á¦Ç°µé¿¡ ´ëÇÑ ¸®½ºÆ®¿Í ÀÚ¼¼ÇÑ ³»¿ëÀº ºÎ·ÏÀ» Âü°íÇϱ⠹ٶõ´Ù. ÀϹÝÀûÀ¸·Î data mining µµ±¸¸¦ ¼±ÅÃÇÒ ¶§´Â °¡°Ý°ú Áö¿øÇÏ´Â Çϵå¿þ¾î Ç÷§ÆûÀÌ ÀûÀýÇÑ°¡¸¦ Æò°¡ÇÏ´Â °Í ¿Ü¿¡µµ ´ÙÀ½ÀÇ »çÇ×µéÀ» Ç×»ó °í·ÁÇØ¾ß ÇÑ´Ù.