ÆíÁý : 2024.4.26 ±Ý 18:53
ÇÇÇÃ/Ä®·³
CRM 2 - µ¥ÀÌÅÍ ¸¶ÀÌ´×ÀÇ 4´ë ¹æ¹ý·Ðµ¥ÀÌÅÍ ¸¶ÀÌ´× ¸ðµ¨¸µ¿¡ ´ëÇÑ °³³äÀû ÀÌÇØ
Çã¸íȸ  |  stat420@korea.ac.kr
ÆùƮŰ¿ì±â ÆùÆ®ÁÙÀ̱â ÇÁ¸°Æ®Çϱ⠸ÞÀϺ¸³»±â ½Å°íÇϱâ
½ÂÀÎ 2007.07.18  17:06:02
Æ®À§ÅÍ ÆäÀ̽ººÏ ¹ÌÅõµ¥ÀÌ ¿äÁò ³×À̹ö ±¸±Û msn
   
 
  ¡ã Çã¸íȸ stat420@korea.ac.kr ¹Ì±¹ ½ºÅÄÆ÷µå´ëÇб³¿¡¼­ Åë°èÇÐ ¹Ú»çÇÐÀ§¸¦ ÃëµæÇÑ µÚ 1984³â ÀÌ·¡ °í·Á´ëÇб³¿¡¼­ Åë°èÇÐ ±³¼ö·Î ÀçÁ÷ ÁßÀÌ´Ù. ÃÖ±Ù¡¸µ¥ÀÌÅÍ ¸¶ÀÌ´×: ¸ðµ¨¸µ°ú »ç·Ê¡¹(SPSS ¾ÆÄ«µ¥¹Ì)¸¦ Ãâ°£Çß´Ù.  
 

¸¹Àº ±â¾÷µéÀÌ Çã¸íȸ µ¥ÀÌÅÍ ¸¶ÀÌ´×À¸·Î °æ¿µÁö½ÄÀ» °úÇÐÀûÀ¸·Î µµÃâÇØ ³»°í À̸¦ CRM¿¡ È°¿ëÇÏ°í ÀÖ´Ù. µ¥ÀÌÅÍ ¸¶À̴׿¡ ¾²ÀÌ´Â ¸ðµ¨¸µ ¹æ¹ýÀº ´Ù¾çÇÏÁö¸¸ ÀÌ Áß¿¡¼­ ½Å°æ¸Á(neural network), ³ª¹«Çü ºÐ·ù(tree-structured classification), K-Æò±Õ ±ºÁýÈ­(K-means clustering), ÀÚ±âÁ¶Á÷È­ Áöµµ(self-organizing map) µîÀÌ ´ëÇ¥ÀûÀÌ´Ù. ÀÏ¹Ý °æ¿µÀÚµéÀÌ ½±°Ô ÀÌÇØÇÒ ¼ö ÀÖµµ·Ï ÀÌµé ¸ðµ¨¸µ ¹æ¹ý·ÐÀ» °³³ä À§ÁÖ·Î ¼³¸íÇÏ°íÀÚ ÇÑ´Ù.

1. ½Å°æ¸Á ¸ðÇüÀº ¼±Çüȸ±Í ¸ðÇü°ú ¾î¶»°Ô ´Ù¸¥°¡?
¼±Çüȸ±Í ¸ðÇü(linear regression model)Àº 1°³ÀÇ ¸ñÇ¥º¯¼ö¸¦ ±Ô¸íÇϱâ À§ÇÏ¿© ´Ù¼öÀÇ ¼³¸íº¯¼ö¸¦ »ç¿ëÇ쵂 °ü°è½ÄÀ» ¼±ÇüÀ¸·Î ¼³Á¤ÇÑ´Ù. ¿¹·Î¼­ °³ÀμҵæÀÌ °ü½ÉÀ̶ó°í ÇÏÀÚ. ´ç¿¬È÷ °³ÀμҵæÀº °í°´°£ »ó´çÇÑ º¯À̸¦ º¸ÀÏ °ÍÀÌ´Ù. ¿Ö ¼ÒµæÀÌ ´Ù¸¥°¡? ¹«¾ù°ú ¿¬°üÀÌ Àִ°¡? ¼Òµæ°ú °ü·Ã ÀÖ´Â º¯¼öµéÀÌ ¹«¾ùÀÎÁö¸¦ ¾Ë°í ÀÖ°í °³º° °í°´¿¡ ´ëÇÏ¿© °ü·Ã º¯¼öµéÀÇ ÀÚ·á °ªÀ» ÃëÇÏ¿´´Ù¸é, ±â¾÷Àº °í°´ °³°³Àο¡°Ô °¡±¸ ¼ÒµæÀ» ÀÏÀÏÀÌ ¹¯Áö ¾Ê°íµµ ±×°ÍÀ» ¾Ë¾Æ³½ ¼ÀÀÌ µÈ´Ù.

°³Àμҵæ°ú °ü·Ã º¯¼öµé »çÀÌÀÇ °ü°è½ÄÀ» È°¿ëÇÑ´Ù¸é ¸»ÀÌ´Ù. °³ÀÎ ¼Òµæ¿¡ ´ëÇÑ ¼³¸íº¯¼ö°¡ ±³À°³â¼ö¿Í ³ªÀ̶ó¸é, ¼±Çüȸ±Í ¸ðÇüÀº ±³À°³â¼ö°¡ ±æ¼ö·Ï, ±×¸®°í ³ªÀÌ°¡ ¸¹À»¼ö·Ï ¼ÒµæÀÌ ¼±ÇüÀûÀ¸·Î Áõ°¡ÇÑ´Ù°í °¡Á¤ÇÑ´Ù. Áï 12³â ±³À°À» ¹ÞÀº »ç¶÷°ú 16³â ±³À°À» ¹ÞÀº »ç¶÷°£ ¼Òµæ Â÷ÀÌ°¡ ¿ù 40¸¸¿øÀ̶ó¸é 16³â ±³À°À» ¹ÞÀº »ç¶÷°ú 18³â ±³À°À» ¹ÞÀº »ç¶÷°£ÀÇ ¼Òµæ Â÷ÀÌ´Â ¿ù 20¸¸¿øÀÏ °ÍÀÌ´Ù. ³ªÀÌ¿¡ ´ëÇÏ¿©µµ ÀÌ¿Í °°´Ù.

±³À°³â¼ö°¡ °°Àº µÎ »ç¶÷ Áß ÇÑ »ç¶÷ÀÌ 30¼¼ÀÌ°í ´Ù¸¥ ÇÑ »ç¶÷ÀÌ 45¼¼Àε¥ ¼Òµæ Â÷ÀÌ°¡ ¿ù 100¸¸¿øÀ̶ó¸é (45¼¼ ÂÊÀÌ ¸¹À½), ±³À°³â¼ö°¡ °°Àº 45¼¼ÀÎ ÇÑ »ç¶÷°ú 60¼¼ÀÎ ´Ù¸¥ »ç¶÷ °£ ¿ù ¼Òµæ Â÷À̵µ ¿ù 100¸¸¿øÀÏ °ÍÀ̶ó°í °¡Á¤ÇÑ´Ù (60¼¼ ÂÊÀÌ ¸¹À½).

±×·±µ¥ ¿äÁò ¼¼»óÀº ÀÌ·¸°Ô Áú¼­Á¤¿¬ÇÏ°Ô ¿òÁ÷ÀÌÁö ¾Ê´Â´Ù. ƯÈ÷ ³ªÀÌ¿¡ À־ ±×·² °ÍÀÌ´Ù. 45¼¼ »ç¶÷ÀÌ 30¼¼ »ç¶÷¿¡ ºñÇØ ¿ù¼öÀÔÀÌ ¸¹À»Áö¶óµµ 60¼¼ÀÎ »ç¶÷Àº 45¼¼ »ç¶÷¿¡ ºñÇØ ¿ù¼öÀÔÀÌ ÀÛÀ» ¼ö ÀÖ°í ¸¹´õ¶óµµ ±×·¸°Ô ¿ù 100¸¸¿øÀ̳ª Â÷ÀÌ°¡ ³ªÁö´Â ¾ÊÀ» °ÍÀÌ´Ù. ÀÌ·± ºñ¼±ÇüÀû È¿°ú°¡ ÀÚ·á¿¡ ³»ÀçÇÏ¿© ÀÖ´Ù¸é ¼Òµæ¿¡ ´ëÇÑ ¼±Çüȸ±Í ¸ðÇüÀº Çê´Ù¸®Â¤´Â ¼ÀÀÌ µÈ´Ù. ÀڷḦ º¸´Â Ʋ(=¸ðÇü)ÀÌ °æÁ÷µÇ¾î ÀÖ¾î ÀÚ·á°¡ ¸í¹éÈ÷ ¸»ÇÏ´Â °ÍÀ» ºÐ¼®ÀÚ°¡ ¾Ë¾ÆµèÁö ¸øÇÏ´Â °á°ú°¡ µÈ´Ù.

½Å°æ¸Á ¸ðÇüÀÌ ¼±Çüȸ±Í ¸ðÇü¿¡ ºñÇØ ´Ù¸¥ ù ¹ø° Á¡Àº ½Å°æ¸ÁÀº ¼³¸íº¯¼öÀÇ ºñ¼±ÇüÀû È¿°ú¸¦ Æ÷ÂøÇس½´Ù´Â µ¥ ÀÖ´Ù. ³ªÀÌ°¡ ¼Òµæ¿¡ ÁÖ´Â È¿°ú°¡ óÀ½¿¡´Â Áõ°¡ÇÏ´Ù°¡ ÀÏÁ¤ ³ªÀ̸¦ Áö³ª¸é¼­ Á¤Ã¼ÇÏ´Â °æÇâÀÌ ÀÖ´Ù¸é ½Å°æ¸ÁÀº ±×°ÍÀ» ½º½º·Î ¾Ë¾Æ³½´Ù. ÀÌ°ÍÀº ¿ì¸®°¡ À½½Ä¿¡¼­ ´Ü ¸ÀÀ» ´À³¥ ¶§ À½½ÄÀÇ ´çµµ°¡ ³ôÀ»¼ö·Ï ´Ü ¸ÀÀÇ °­µµ°¡ Ä¿ÁöÁö¸¸ À½½ÄÀÇ ´çµµ°¡ ¾öû Å©´Ù°í Çؼ­ ±×¿¡ »óÀÀÇÏ´Â ´Ü ¸ÀÀ» ´À³¢Áö ¾ÊÀº °Í°ú °°Àº ÀÌÄ¡ÀÌ´Ù. ÀÌ¿Í °°ÀÌ µ¥ÀÌÅÍ ¸¶À̴׿¡¼­ »ç¿ëÇÏ´Â Àΰø ½Å°æ¸Á ¸ðÇüÀº »ý¹°Ã¼ÀÇ ½ÇÁ¦ ½Å°æ¸Á°ú °°Àº ÀÌÄ¡·Î ÀÛµ¿ÇÑ´Ù. ¿Ö? ÀÌ¿¡ ´ëÇÑ ´äÀº ½±Áö ¾Ê´Ù. ȯ¿øÀûÀÌÁö¸¸, Àΰø ½Å°æ¸ÁÀ» ½ÇÁ¦ ½Å°æ¸Á°ú À¯»çÇÏ°Ô ¸¸µé¾ú°í °¡±ÞÀû ´õ¿í À¯»çÇÏ°Ô µÇµµ·Ï °è¼Ó °³·®Çسª°¡±â ¶§¹®À̶ó°í ÀÌÇØÇÏ¸é µÇÁö ¾ÊÀ»±î ½Í´Ù. ÇöÀç±îÁö ³ª¿Â Àΰø½Å°æ¸Á Áß ´ëÇ¥ÀûÀÎ ´ÙÃþ ÆÛ¼ÁÆ®·Ð ¸ðÇüÀº ÀÔ·Â Ãþ°ú Ãâ·Â Ãþ »çÀÌ¿¡ Àº´Ð ÃþÀ» µÐ´Ù. ±×¸®°í ±× ¾È¿¡ ´º·±(½Å°æ¼¼Æ÷)À» ³Ö´Âµ¥ ´º·±Àº ÀԷ³ëµå·ÎºÎÅÍ ¹ÞÀº ½ÅÈ£(ÀÚ·á)µéÀ» Á¶ÇÕÇÏ¿© ÀûÀýÇÑ ¹ÝÀÀ(º¯È¯)À» »êÃâÇÑ µÚ Ãâ·Â³ëµå·Î º¸³» ÃÖÁ¾ Á¤º¸Ã³¸® ÇÏ´Â °úÁ¤À» °ÅÄ£´Ù. 

±×·¯¸é ½Å°æ¸Á ¸ðÇüÀº ¸¸´ÉÀΰ¡? ¼³¸í º¯¼öµéÀÇ ¸®½ºÆ®¸¦ ºÐ¼®ÀÚ°¡ Á¦½ÃÇÏ¿©¾ß ÇÑ´Ù´Â Á¡¿¡¼­ ½Å°æ¸ÁÀÇ Áö´É ¼öÁØÀº ¼±Çü ȸ±Í¿Í ¸¶Âù°¡ÁöÀÌ´Ù. ¼Òµæ°ú °ü·Ã ÀÖ´Â º¯¼ö¸¦ ½º½º·Î ¾Ë¾Æ³»Áö´Â ¾Ê´Â´Ù´Â ÀǹÌÀÌ´Ù. ±³À°³â¼ö¿Í ³ªÀÌ ¿Ü¿¡ ¹«¾ùÀÌ ¼Òµæ°ú °ü·Ã ÀÖ´Â º¯¼öÀÎÁö ±×·² °¡´É¼ºÀÌ ÀÖ´Â º¯¼öµéÀ» ºÐ¼®ÀÚ°¡ ¸ÕÀú ¸»ÇÏÁö ¾Ê´Â´Ù¸é ½Å°æ¸ÁÀº ´õ ÀÌ»óÀÇ ÀÛ¾÷Àº ÇÏÁö ¾Ê´Â´Ù. ´Ù½Ã ¸»ÇÏ¿©, ÇöÀç±îÁöÀÇ Àΰø ½Å°æ¸ÁÀº ¼öµ¿ÀûÀÎ ÀÛ¾÷ÀÚÀÏ »Ó ½º½º·Î »ý°¢ÇÏ°í ÇൿÇÏÁö ¸øÇÑ´Ù.

½Å°æ¸ÁÀÌ ¿ÀÈ÷·Á ¼±Çüȸ±Í ¸¸µµ ¸øÇÑ Ãø¸éµµ ÀÖ´Ù. ¿ì¸®°¡ ¿ì¸® ¸öÀÇ ½Å°æ°è¸¦ ¿î¿µÇÏ°í ÀÖÁö¸¸ µ¿ÀÛ ¿ø¸®¸¦ Àß ¸ð¸£°í ÀÖµíÀÌ, ºÐ¼®ÀÚ°¡ ½Å°æ¸Á ¸ðÇüÀ» ±¸ÃàÇÏ¿´´Ù ÇÏ´õ¶óµµ ³»ºÎ±îÁö »ô»ôÀÌ ÀÌÇØÇÏ´Â °ÍÀº ¸Å¿ì ¾î·Æ´Ù. ´ÜÁö ÀÌ·± °ªÀ» ½Å°æ¸Á ¸ðÇü¿¡ ³ÖÀ¸¸é ÀÌ·± °ªÀÌ ³ª¿À°í Àú·± °ªÀ» ³ÖÀ¸¸é Àú·± °ªÀÌ ³ª¿Â´Ù´Â °ÍÀ» ¿©·¯ ¹øÀÇ ½ÃÇàÀ» ÅëÇÏ¿© º¼ ¼ö ÀÖÀ» »ÓÀÌ´Ù. ÀÌ·¸µí ¸ðÇü ÀÚü¿¡ ´ëÇÑ ¼³¸íÀÌ ¾î·Æ±â ¶§¹®¿¡ ½ÇÁ¦ ±â¾÷ÀÇ BI È°¿ë½Ã ½Å°æ¸ÁÀ» ¾²Áö ¸øÇÏ´Â °æ¿ìµµ ÀÖ´Ù. ¿¹ÄÁ´ë ½Å¿ë¿¹Ãø ¸ðÇüÀ» ½Å°æ¸ÁÀ¸·Î ¸¸µç °æ¿ì ¿Ö °í°´ A´Â ÁÁÀº ½Å¿ëÀ¸·Î ¿¹ÃøµÇ´Âµ¥ ±× º¸´Ù ¸øÇÒ °Í ¾ø¾î º¸ÀÌ´Â °í°´ B´Â ³ª»Û ½Å¿ëÀ¸·Î ¿¹ÃøµÇ´ÂÁö¸¦ ½Å°æ¸ÁÀÌ ¾Ë·ÁÁÖÁö ¾Ê±â ¶§¹®ÀÌ´Ù.

2. ³ª¹«Çü ºÐ·ù ¸ðÇüÀº ¿£Æ®·ÎÇǸ¦ ¾î¶»°Ô °¨¼Ò½ÃÅ°³ª?

ÀÚ¿¬°úÇп¡¼­´Â ºÒÈ®½Ç¼ºÀ» ¿£Æ®·ÎÇÇ(Entropy)·Î °è·®È­ÇÑ´Ù. ¿£Æ®·ÎÇÇÀÇ Á¤ÀǸ¦ ¿¹¸¦ µé¾î »ìÆ캸±â·Î ÇÏÀÚ. »ç°Ç A, B, C, D Áß ¾î´À Çϳª°¡ ¹ß»ýÇϴµ¥ °¢°¢ È®·ü 1/4, 1/4, 1/4, 1/4·Î ¹ß»ýÇÑ´Ù¸é ¿£Æ®·ÎÇÇ´Â
-(1/4)log2(1/4)-(1/4)log2(1/4)-(1/4)log2(1/4)-(1/4)log2(1/4)=2.00ÀÌ´Ù.[¿©±â¼­´Â ¹Ø¼ö°¡ 2ÀÎ ·Î±×°¡ »ç¿ëµÇ¾ú´Âµ¥ ²À ±×·¡¾ß ÇÏ´Â °ÍÀº ¾Æ´Ï´Ù. ¾î´À °ªÀ» ¹Ø¼ö·Î ÇϵçÁö ¼öÄ¡ÀûÀ¸·Î´Â ´Ù¸¥ ¿£Æ®·ÎÇÇ °ªÀÌ ³ª¿ÀÁö¸¸ Àüü ¹æ¹ý·Ð¿¡´Â ¿µÇâÀ» ÁÖÁö ¾Ê´Â´Ù]. ÀÌ¿¡ ¹ÝÇÏ¿© 4°³ »ç°ÇÀÇ ¹ß»ý È®·üÀÌ 4/8, 2/8, 1/8, 1/8À̶ó¸é ¿£Æ®·ÎÇÇ´Â -(4/8)log2(4/8)-(2/8)log2(2/8)-(1/8)log2(1/8)-(1/8)log2(1/8)=1.75°¡ µÈ´Ù. µû¶ó¼­ ¸ÕÀú °æ¿ì¿¡ ºñÇÏ¿© ¿£Æ®·ÎÇÇ°¡ ÀÛ´Ù. ±×·¸´Ù¸é ³ªÁß °æ¿ìÀÇ ºÒÈ®½Ç¼ºÀÌ »ó´ëÀûÀ¸·Î ÀÛ´Ù´Â °ÍÀε¥ ÀÌ°ÍÀÌ ¸Â´Â ¸»ÀÎÁö °õ°õÀÌ »ý°¢Çغ¸ÀÚ. ¸ÕÀú °æ¿ì¿¡¼­´Â A, B, C, D Áß ¾î´À °ÍÀÌ ¹ß»ýÇÒÁö ÀüÇô ¾Ë ¼ö ¾ø´Ù. ±×·±µ¥µµ ¿¹ÃøÇØ¾ß ÇÑ´Ù°í Çؼ­ A¸¦ ÅÃÇÏ¿´´Ù°í ÇÏÀÚ. ±×·¯¸é ¿À·ù È®·üÀº 3/4ÀÌ´Ù. ³ªÁß °æ¿ì¿¡¼­´Â A, B, C, D Áß ¾î´À °ÍÀÌ ¹ß»ýÇÒÁö ¾Ë ¼ö ¾øÁö¸¸ A¿¡ ´ëÇÑ È®·üÀÌ °¡Àå ³ôÀ¸¹Ç·Î A·Î ¿¹ÃøÇÏ´Â °ÍÀÌ ÁÁÀ» °ÍÀÌ´Ù. ±×·¯¸é ¿À·ù È®·üÀº 4/8ÀÌ´Ù. ±×·¯¹Ç·Î ³ªÁß °æ¿ì°¡ ´õ °¡½ÃÀûÀÌ°í ´ú ºÒÈ®½ÇÇÑ °æ¿ì¶ó°í ÇÒ ¼ö ÀÖ´Ù.

³ª¹«Çü ºÐ·ù ¸ðÇüÀº ¸ñÇ¥ ¹üÁÖÀÇ ¿¹Ãø¿¡ À־ ¿£Æ®·ÎÇǸ¦ ÃÖ¼ÒÈ­ÇÏ´Â ¼³¸íº¯¼ö¸¦ ´Ü°èÀûÀ¸·Î ã¾Æ È°¿ëÇÑ´Ù. ¿¹ÄÁ´ë ÀÚµ¿Â÷ º¸Çè °¡ÀÔÀÚÀÇ À§Çè µî±Þ(A, B, C, D; °¢°¢ È®·ü 1/4) ¿¹ÃøÀÌ °ü½ÉÀÎ °æ¿ì ¹«¾ùÀ» ±âÁØÀ¸·Î ³ª´®À¸·Î½á ¿£Æ®·ÎÇÇ°¡ ÃÖ¼Ò°¡ µÇ´Â°¡¸¦ ã´Â´Ù. ³ªÀÌ°¡ 30´ë ÀÌÇÏ(ÀüüÀÇ 50%)Àΰ¡, ¾Æ´Ï¸é 40´ë ÀÌ»ó(50%)Àΰ¡·Î ³ª´©´Â °æ¿ì, 30´ë ÀÌÇÏ¿¡¼­´Â A, B, C, D µî±ÞÀÏ È®·üÀÌ 4/8, 2/8, 1/8, 1/8ÀÌ°í 40´ë À̻󿡼­´Â ±× È®·üµéÀÌ 0, 2/8, 3/8, 3/8ÀÌ°í ÇÏÀÚ. ±×·¯¸é ¿£Æ®·ÎÇÇ´Â ´ÙÀ½°ú °°ÀÌ »êÃâµÈ´Ù.

1) 30´ë ÀÌÇÏ (50%): 1.75 [¾Õ¿¡¼­ ÀÌ¹Ì °è»êµÇ¾úÀ½]
2) 40´ë ÀÌ»ó (50%): 1.03 [¾Õ¿¡¼­¿Í °°ÀÌ °è»êÇϵÇ, Olog20 = 0À¸·Î ÇÔ]

µû¶ó¼­ Æò±Õ ¿£Æ®·ÎÇÇ´Â 1.39 (=0.5*1.75 +0.5*1.03)°¡ µÈ´Ù. ±×·¯¹Ç·Î ¿£Æ®·ÎÇÇ´Â ³ªÀÌ´ë·Î ºÐ·ùÇϱâ ÀüÀÇ 2.00¿¡¼­ 0.71 (=2.00-1.39)¸¸Å­ °¨¼ÒÇÑ °ÍÀÌ´Ù. ÀÌ°ÍÀº ³ªÀÌ´ë·Î ³ª´©¾úÀ» ¶§ÀÇ °á°úÀ̹ǷΠ´Ù¸¥ °ÍÀ» ±âÁØÀ¸·Î ºÐ·ùÇÏ¿´À» ¶§ ´õ Å« ¿£Æ®·ÎÇÇÀÇ °¨¼Ò°¡ ÀÖ³ª »ìÆì, ±×·± ºÐ·ù°¡ ÀÖ´Ù¸é ±×°ÍÀ» ±âÁØÀ¸·Î ÇÑ´Ù´Â °ÍÀÌ ³ª¹«Çü ºÐ·ù ¸ðÇüÀÇ ±âº» ¾ÆÀ̵ð¾îÀÌ´Ù. ¿¹ÄÁ´ë ³ªÀÌ´ë, Èí¿¬ À¯¹«, ¿îÀü °æ·Â µîÀ¸·Î ºÐ·ùÇÏ¿© ¾ò´Â °á°úµéÀ» ¼­·Î ºñ±³ÇÏ¿© ÃÖ¼±ÀÇ °ÍÀ» ã´Â °ÍÀÌ´Ù. ÀÏ´Ü 1°³ÀÇ ºÐ·ù ±âÁØÀÌ È®Á¤µÇ¸é ±× ´ÙÀ½¿£ ¹«¾ùÀ¸·Î ³ª´©´Â °ÍÀÌ ÁÁÀº°¡¸¦ °è¼Ó Ž±¸ÇÏ¿© ÃÖÁ¾ ºÐ·ù ³ª¹«¸¦ ¾ò´Â´Ù.

³ª¹«Çü ºÐ·ù ¸ðÇüÀÇ ¹æ¹ý·ÐÀ¸·Î ´ëÇ¥ÀûÀÎ Äþ¶õ(Quilan, 1988)ÀÇ C4.5¿Í ÀÌ°ÍÀ» °³·®ÇÑ C5.0ÀÌ ÀÌÁ¦±îÁö ¼³¸íÇÑ ¿£Æ®·ÎÇǸ¦ »ç¿ëÇÏ°í ÀÖ°í ºê¶óÀ̸¸ µî(Breiman et al., 1984)ÀÇ CART(Classification and Regression Trees)´Â Áö´Ï Áö¼ö(Gini Index)¸¦ È°¿ëÇÏ´Â µ¥, Áö´Ï Áö¼ö´Â ¿£Æ®·ÎÇÇ¿Í °³³ä»ó À¯»çÇÏ´Ù.
³ª¹«Çü ºÐ·ù ¸ðÇüÀº °á°ú¸¦ ÀбⰡ ¾ÆÁÖ ½±±â ¶§¹®¿¡ [“If-Then”ÀÇ ¹Ýº¹ Çü½ÄÀ¸·Î µÇ¾î ÀÖÀ¸´Ï±î] µ¥ÀÌÅÍ ¸¶À̴׿¡ ÀÚÁÖ È°¿ëµÈ´Ù. ±×·¯³ª ¾î¶² ±âÁØ Á¡À» Áß½ÉÀ¸·Î ³ª´©¾îÁö¹Ç·Î ¼³¸íº¯¼ö °ªÀÇ ÀÛÀº Â÷ÀÌ¿¡¼­ ¿¹Ãø °á°ú»ó Å« Â÷ÀÌ°¡ ºú¾îÁö±âµµ ÇϹǷΠ¸ðÇüÀÌ ´Ù¼Ò ºÒ¾ÈÁ¤ÇÏ´Ù´Â ´ÜÁ¡ÀÌ ÀÖ´Ù. ±×·¯³ª ÃÖ±Ù¿¡´Â ¹è±ë(Bagging), ºÎ½ºÆÃ(Boosting) µî ´Ù¾çÇÑ º¸¿ÏÀû ¹æ¹ýÀÌ ³ª¿ÔÀ¸¹Ç·Î ¾ÕÀ¸·Î ´õ¿í ÀÚÁÖ È°¿ëµÉ °ÍÀÌ´Ù.

3. K-Æò±Õ ±ºÁýÈ­´Â ¾î¶² »ý°¢¿¡¼­ ³ª¿Ô³ª?

¾î¸± Àû µ¿³× °øÅÍ¿¡´Â ¸¹Àº µ¹µéÀÌ µß±Û°í ÀÖ¾ú´Ù. ÀÌ°ÍÀú°Í ¸ð¾Æ º¸¸é µ¹µéÀÌ Å©±â¿Í ÀçÁú¸é¿¡¼­ Á¦°¢°¢ÀÌ¿©¼­ ¸î °³ÀÇ ±×·ìÀ¸·Î ¾î·ÆÁö ¾Ê°Ô ³ª´­ ¼ö ÀÖ¾ú´Ù. °íµîÇб³ ¶§ ÇпìµéÀ» »ý°¢Çغ¸ÀÚ. ¾äÀüÇÑ ¸ð¹ü»ýºÎÅÍ È°µ¿ÀûÀÎ ¸®´õ, Áö»çÀû ±Ø±âÇü, ¸ù»ó°¡Çü, »ç°í¹¶Ä¡Çü µî ¿©·¯ ±×·ìÀÌ ÀÖ¾ú´Ù. Àΰ£À̶õ º»·¡ ÁýÇÕÀû ´ë»óÀ» ÀÌÇØÇÒ ¶§´Â ÀÌ¿Í °°ÀÌ ºÐ·ù¸¦ Áß°£°úÁ¤À¸·Î È°¿ëÇÏ´Â °æÇâÀÌ ÀÖ´Ù. ±×°ÍÀÌ BI¿¡¼­´Â °í°´¼¼ºÐÈ­·Î ³ªÅ¸³ª´Âµ¥ ÀÌ°ÍÀº µ¿³× °øÅÍÀÇ µ¹À» ºÐ·ùÇÏ´Â ¹®Á¦¿Í ´Ù¸£Áö ¾Ê´Ù.
K-Æò±Õ ±ºÁýÈ­(K-means clustering)¶õ ¸¹Àº ¼öÀÇ °³Ã¼µéÀ» ÁÖ¾îÁø ¼ö(=K)ÀÇ ±×·ìÀ¸·Î ºÐ·ùÇϱâ À§ÇÑ ¹æ¹ýÀÌ´Ù. ÀÌ°ÍÀÇ ¿ø¸®´Â ´ÙÀ½°ú °°ÀÌ ´Ü¼øÇÏ´Ù.

1) óÀ½¿¡´Â K°³ ±×·ì °¢°¢¿¡ 1°³¾¿ÀÇ °³Ã¼¸¦ ³Ö´Â´Ù. °¢ ±×·ì¿¡ °³Ã¼°¡ 1°³¾¿¸¸ ÀÖÀ¸¹Ç·Î ±×·ì Áß½ÉÀº ±×·ìº°·Î óÀ½ ¹è´çÇÑ °³Ã¼ ½º½º·Î°¡ µÈ´Ù.
2) ³²Àº ¸ðµç °³Ã¼ °¢°¢À» °¡Àå °¡±î¿î ±×·ì Áß½ÉÀ» ã¾Æ ±× ±×·ì¿¡ ¹è¼Ó½ÃŲ´Ù.
3) °¢ ±×·ì Áß½ÉÀ» »õ·Î °è»êÇÑ´Ù. ¿©±â¼­ ±×·ì Áß½ÉÀº °¢ ±×·ì¿¡ ¹è¼ÓµÈ ¸ðµç °³Ã¼µéÀÇ Æò±ÕÀÌ´Ù.
4) ¾ÕÀÇ ´Ü°è 2¿Í 3À» ÃæºÐÇÑ È¸¼ö ¹Ýº¹ÇÏ¿© ¼öÇàÇÑ´Ù. ÀÌ°ÍÀÌ ¸·´ëÇÑ °è»êÀû ºÎ´ãÀÌ µÉ °Í °°Áö¸¸ ½ÇÁ¦·Î´Â ±×·¸Áö ¾Ê´Ù. ½ÇÁ¦·Î´Â ´ë·« 10ȸ ³»¿ÜÀÇ ¹Ýº¹À¸·Î ÃæºÐÇϸç À¢¸¸ÇÑ ÀÚ·á¶ó¸é Ä¿ÇÇ ÇÑ ÀÜÀ» ¸¶½Ç ½Ã°£ À̳»¿¡ °è»êÀÌ ¿Ï·áµÈ´Ù.

K-Æò±Õ ±ºÁýÈ­¿¡¼­ ¹®Á¦´Â ±ºÁý ¼ö K¸¦ »çÀü¿¡ Á¤ÇÏ´Â ÀÏÀÌ´Ù. ºÐ¼®Àڷμ­´Â ÀÌ°ÍÀÌ °ïȤ½º·´Áö¸¸ ´ë·« »ó½ÄÀûÀÎ °ªÀ» ½ÃµµÇÑ µÚ ±× °á°ú°¡ Çؼ®°¡´ÉÇÏ°í ¸ÚÁö°Ô º¸À̸é äÅÃÇÏ°í ±×·¸Áö ¾ÊÀ¸¸é ±× ¼ö¸¦ ÁÙÀ̰ųª ´ÃÀÌ´Â ¹æ¹ýÀÌ ¹«³­ÇÏ´Ù.
ÃÖ±Ù¿¡´Â K¸¦ Á¤Çϱâ À§ÇÏ¿© ÀÚ·á ºÐÇÒ(data partitioning)À» È°¿ëÇÏ´Â ¹æ¹ýµµ ¿¬±¸µÇ¾ú´Ù(Çã¸íȸ µî, 2003). ÀÌ°ÍÀº ºÐ¼®ÀڷḦ 3°³ ¼¼Æ®(A, B, C)·Î ºÐÇÒÇÏ¿© A¿Í B·ÎºÎÅÍ °¢°¢ÀÇ K-Æò±Õ ±ºÁýÈ­ ±ÔÄ¢À» ¸¸µé°í ÀÌµé ±ÔÄ¢À» C¿¡ Áߺ¹ Àû¿ëÇÏ¿© ºÐ·ù °á°ú°¡ ¾ó¸¶³ª »óÈ£°£ ÀÏÄ¡Çϴ°¡¸¦ º¸´Â °ÍÀÌ´Ù. ÀÏÄ¡°è¼ö·Î´Â ·£µå(Rand, 1971)ÀÇ ÀÏÄ¡µµ ¶Ç´Â ¿£Æ®·ÎÇÇ µîÀ» ¾´´Ù.

4. ÀÚ±âÁ¶Á÷È­´Â ¾î¶»°Ô °¡´ÉÇÑ°¡?

1980³â´ë Áß¹Ý ÀÌÈÄ ÇÉ·£µåÀÇ Àü±â°øÇÐÀÚ ÄÚÈ£³Ù(Kohonen)¿¡ ÀÇÇÏ¿© °³¹ßµÈ ÀÚ±âÁ¶Á÷È­Áöµµ(Self-Organizing Map)´Â ´Ù¼öÀÇ ´ÙÂ÷¿ø °ø°£»ó °³Ã¼µéÀÌ ½º½º·Î ºñ½ÁÇÑ °ÍµéÀ» ã¾Æ ³¢¸®³¢¸® ÀúÂ÷¿ø °ø°£(2Â÷¿ø)¿¡ ÀÚ¸® Àâµµ·Ï ÇÏ´Â ¹æ¹ýÀ» ¸»ÇÑ´Ù. ¾î¶»°Ô ÀÌ°ÍÀÌ °¡´ÉÇÒ±î?

´ÙÀ½ »óȲÀ» »ý°¢Çغ¸ÀÚ. °í°´µéÀ» Å« ¿îµ¿Àå¿¡ ¼ÒÁýÇÏ¿© À¯»çÇÑ »ç¶÷µé³¢¸® ±Ùó¿¡ ÀÚ¸® Àâ°Ô ÇÏ´Â °ÍÀÌ ¸ñÀûÀ̶ó°í ÇÏÀÚ. ¾î¶»°Ô ÇÏ¸é µÉ±î?

1) óÀ½¿¡´Â °¢ À§Ä¡ÀÇ Æ¯¼ºÀ» ÀÓÀÇ·Î Á¤ÇÑ´Ù. 
2) ù »ç¶÷À» °¡Àå À¯»çÇÑ À§Ä¡ Ư¼ºÀ» ã¾Æ³» ±×°÷¿¡ ¼¼¿î´Ù. ±×¸®°í´Â ±× ÁÖº¯ÀÇ À§Ä¡ Ư¼ºÀ» ¸ðµÎ ¾÷µ¥ÀÌÆ® Çϴµ¥ ÀÌ ¶§ »õ·Î ±× ÁÖº¯¿¡ ¼¼¿öÁø »ç¶÷ÀÇ ¿µÇâÀ» ÀÏÁ¤ Å©±â °í·ÁÇÑ´Ù. ±× »ç¶÷ÀÌ ¼¼¿öÁø °÷¿¡¼­ °¡±î¿î À§Ä¡Á¡ÀÇ Æ¯¼ºÀº Å©°Ô ¾÷µ¥ÀÌÆ® µÇ°í ÀÏÁ¤ ¹Ý°æ ³»ÀÌÁö¸¸ ¸Õ À§Ä¡Á¡µéÀÇ Æ¯¼ºÀº ÀÛ°Ô ¾÷µ¥ÀÌÆ® µÈ´Ù. ÀÌ ÀÛ¾÷À» ÇÑ ¸í¾¿¿¡ ´ëÇÏ¿© ¹Ýº¹ Àû¿ëÇ쵂 Á¡Â÷ ÁÖº¯ ¹Ý°æÀÇ Å©±â¸¦ ÁÙÀÌ°í ¾÷µ¥ÀÌÆ® ÇÏ´Â Á¤µµµµ ÁÙÀδÙ. (µû¶ó¼­ óÀ½¿¡´Â ¹Ý°æÀÇ Å©±â°¡ Å©Áö¸¸ Á¡Â÷ ÁÙ¾îµç´Ù. ¾÷µ¥ÀÌÆ® Á¤µµµµ ¸¶Âù°¡ÁöÀÌ´Ù.)
3) ¾Õ ´Ü°èÀÇ °è»êÀ» ÃæºÐÇÑ È½¼ö ¹Ýº¹ÇÑ´Ù. ÀÌ¿¡ µû¶ó ÁÖº¯ ¹Ý°æÀº °è¼Ó ÁÙ°Ô µÇ¾î ¸Ç ³ªÁß¿¡´Â ¹Ù·Î ¿· À§Ä¡Á¡¸¸ °Ü¿ì Æ÷Ç﵃ Á¤µµ·Î ÀÛ¾ÆÁø´Ù. ¾÷µ¥ÀÌÆ® Á¤µµµµ óÀ½¿¡´Â Å©Áö¸¸ ³ªÁß¿¡´Â ¹«½ÃµÉ ¼ö ÀÖÀ» ¸¸Å­ ÀÛ¾ÆÁø´Ù. ±×·¯¹Ç·Î ÀÚ±âÁ¶Á÷È­ °úÁ¤¿¡¼­ óÀ½¿¡´Â »ç¶÷µéÀÇ À§Ä¡ º¯°æÀÌ ½ÉÇÏÁö¸¸ Á¡Â÷ ¾ÈÁ¤µÇ¾î °¡¸ç À¯»çÇÑ »ç¶÷µéÀº ±Ùó¿¡ ÀÚ¸® Àâ°Ô µÈ´Ù.

ÀÚ±âÁ¶Á÷È­Áöµµµµ °í°´ ¼¼ºÐÈ­¿¡ »ç¿ëµÉ ¼ö ÀÖ´Ù. ÀÌ Á¡¿¡¼­´Â K-Æò±Õ ±ºÁýÈ­¿Í ¸¶Âù°¡ÁöÀÌÁö¸¸ ÀÚ±âÁ¶Á÷È­Áöµµ´Â °í°´µéÀÇ À§Ä¡¸¦ ½Ã°¢ÀûÀ¸·Î º¸¿©Áֱ⠶§¹®¿¡ ÈξÀ À¯¿¬ÇÏ°Ô È°¿ëµÉ ¼ö ÀÖ´Ù. ¿©·¯ Åë°èÀü¹®°¡µéÀº ÀÚ±âÁ¶Á÷È­Áöµµ¸¦ K-Æò±Õ ±ºÁýÈ­ÀÇ È®ÀåÀ¸·Î º¸±âµµ ÇÏÁö¸¸ À̰ͺ¸´Ù´Â ÁÖ¼ººÐ/ÀÎÀںм®ÀÇ ºñ¼±ÇüÀû ¹öÀüÀ¸·Î ÀÌÇØÇÏ´Â °ÍÀÌ ´õ ¿Ç´Ù.

ÀÌ»óÀ¸·Î µ¥ÀÌÅÍ ¸¶ÀÌ´×ÀÇ 4´ë ¹æ¹ý·ÐÀÎ ½Å°æ¸Á, ³ª¹«Çü ºÐ·ù, K-Æò±Õ ±ºÁýÈ­, ÀÚ±âÁ¶Á÷È­Áöµµ µîÀ» »ìÆ캸¾Ò´Ù. ÀÌµé ¹æ¹ý·Ð ¿Ü¿¡ ¿¬°ü¼º ºÐ¼® ¹æ¹ýÀ¸·Î Apriori, GRI µîÀÇ ¾Ë°í¸®ÁòÀ» SPSS Ŭ·¹¸àŸÀÎ, SAS E-miner µî À¯¸í µ¥ÀÌÅÍ ¸¶ÀÌ´× ¼ÒÇÁÆ®¿þ¾îµéÀÌ Á¦°øÇÏ°í ÀÖ´Ù. ±×·¯³ª ÀÌµé ¹æ¹ý·ÐµéÀº ´Ù¼öÀÇ ÆĶó¹ÌÅ͵éÀÌ Á¦´ë·Î ¼³Á¤µÇ¾úÀ» ¶§ ÃÖ´ëÀÇ ¼º°ú¸¦ ³¾ ¼ö ÀÖÀ¸¹Ç·Î ¹«Á¶°Ç µû¶óÇϱâ½ÄÀÇ È°¿ëÀº À§ÇèÇÏ´Ù. Àü¹®°¡ÀÇ ÀÚ¹®À» ÇÊ¿ä·Î ÇÏ´Â ºÎºÐÀÌ´Ù.

ÇÊÀÚ ; Çã¸íȸ
¹Ì±¹ ½ºÅÄÆ÷µå´ëÇб³¿¡¼­ Åë°èÇÐ ¹Ú»çÇÐÀ§¸¦ ÃëµæÇÑ µÚ 1984³â ÀÌ·¡
°í·Á´ëÇб³¿¡¼­ Åë°èÇÐ ±³¼ö·Î ÀçÁ÷ ÁßÀÌ´Ù. ÃÖ±Ù¡¸µ¥ÀÌÅÍ ¸¶ÀÌ´×: ¸ðµ¨¸µ°ú »ç·Ê(SPSS ¾ÆÄ«µ¥¹Ì)¸¦ Ãâ°£Çß´Ù.

< ÀúÀÛ±ÇÀÚ © BI KOREA ¹«´ÜÀüÀç ¹× Àç¹èÆ÷±ÝÁö >
Çã¸íȸÀÇ ´Ù¸¥±â»ç º¸±â  
ÆùƮŰ¿ì±â ÆùÆ®ÁÙÀ̱â ÇÁ¸°Æ®Çϱ⠸ÞÀϺ¸³»±â ½Å°íÇϱâ
Æ®À§ÅÍ ÆäÀ̽ººÏ ¹ÌÅõµ¥ÀÌ ¿äÁò ³×À̹ö ±¸±Û msn µÚ·Î°¡±â À§·Î°¡±â
ÀÌ ±â»ç¿¡ ´ëÇÑ ´ñ±Û À̾߱â (0)
ÀÚµ¿µî·Ï¹æÁö¿ë Äڵ带 ÀÔ·ÂÇϼ¼¿ä!   
È®ÀÎ
- 200ÀÚ±îÁö ¾²½Ç ¼ö ÀÖ½À´Ï´Ù. (ÇöÀç 0 byte / ÃÖ´ë 400byte)
- ¿å¼³µî ÀνŰø°Ý¼º ±ÛÀº »èÁ¦ ÇÕ´Ï´Ù. [¿î¿µ¿øÄ¢]
ÀÌ ±â»ç¿¡ ´ëÇÑ ´ñ±Û À̾߱â (0)
1
±¹¹ÎÀºÇà ¡®AI°Å¹ö³Í½º ±â¼ú ÄÁ¼³Æá¯, »ï¼ºÀÌ ¸Ã¾Æ
2
<ÃÊÁ¡>ÄÚ½ºÄÞ ´ëÇ¥ ¼±ÀÓ ¹× Â÷¼¼´ë Àü¸ÁÀº
3
IBM, ÇϳªÄ³ÇÇÅ» ÀÌÁßÈ­¤ýÀçÇØ º¹±¸ ½ºÅ丮Áö ±¸Ãà
4
SK C&C, ¡®¾ÆÀÌÆÑÃ÷ SHE¡¯ Ãâ½Ã
5
SAP, Á¦Á¶ Çõ½ÅÀ» À§ÇÑ ¡®AI ±â¹Ý °ø±Þ¸Á¡¯ Çõ½Å °ø°³
6
µ¥ÀÌÅͺ긯½º, ¡°¿¬ 100% ÀÌ»ó ºñÁî´Ï½º ¼ºÀ塱
7
KT, ¡®¸®½ºÆݼ­ºí AI ¼¾ÅÍ¡¯ Á¶Á÷ ½Å¼³
8
¡°Àü ¼¼°è ±â¾÷ 63%, Á¦·Î Æ®·¯½ºÆ® Àü·« µµÀÔ¡±
9
KT, ¡®3´ë AI Àü·Â Àý°¨ ±â¼ú¡¯ °ø°³
10
Æû·¦, ½Å±Ô 3D ÇÁ¸°ÅÍ °ø°³
ȸ»ç¼Ò°³¤ý±â»çÁ¦º¸¤ý±¤°í¹®ÀǤýºÒÆí½Å°í¤ý°³ÀÎÁ¤º¸Ãë±Þ¹æħ¤ýû¼Ò³âº¸È£Á¤Ã¥¤ýÀ̸ÞÀϹ«´Ü¼öÁý°ÅºÎ
¼­¿ï½Ã ¿µµîÆ÷±¸ ¿©ÀÇ´ë¹æ·Î65±æ 13, 904(¿©Àǵµµ¿ À¯Ã¢ºôµù)| Tel: 02-785-5108 | Fax 02-785-5109
À̸ÞÀÏÁÖ¼Ò¹«´Ü¼öÁý°ÅºÎ | (ÁÖ)ºñ¾ÆÀÌÄÚ¸®¾Æ´å³Ý | ´ëÇ¥ÀÌ»ç : ±èµ¿±â | »ç¾÷ÀÚ µî·Ï¹øÈ£:107-87-99085 | °³ÀÎÁ¤º¸°ü¸®Ã¥ÀÓÀÚ : ±èµ¿±â
µî·Ï¹øÈ£ : ¼­¿ï ¾Æ01269 | µî·ÏÀÏÀÚ 2010.06.18, ½Å°íÀÏÀÚ 2008.10.22 | ¹ßÇàÀÎ:±èµ¿±â | ¹ßÇàÀÏÀÚ:2010.06.01 | ÆíÁýÀÎ : ±èµ¿±â
û¼Ò³âº¸È£Ã¥ÀÓÀÚ : ±èµ¿±â
Copyright © 2012 BI KOREA. All rights reserved. mail to webmaster@bikorea.net