ID3 Approach
Adaptive Pattern Recognition and Neural Networks : Yoh-Han Pao , Addison-Wesley, 1989, Page 85~93
General considerations ID3 ÀÇ º¹À⼺ ID3 ÀÇ ÀåÁ¡ ID3 ÀÇ ´ÜÁ¡
ÆÐÅÏÀνİú ºÐ·ù¿¡ ´ëÇÑ ID3 Á¢±ÙÀº ºñ¼öÄ¡ ¼Ó¼ºÀ̳ª º¯¼ö°ª (nonnumeric attributes or feature values) À» °¡Áö´Â ÆÐÅϵéÀ» ºÐ·ùÇϱâ À§ÇÑ È¿À²ÀûÀÎ ½Äº° Æ®¸® (discrimination tree) ¸¦ »ý¼ºÇϱâ À§ÇÑ °úÁ¤ÀÌ´Ù. ½Äº° Æ®¸®´Â ±ÔÄ¢µéÀ» ¸ð¾Æ³õÀº (a body of rules) ÇüÅ·μ Ç¥ÇöµÉ ¼ö Àֱ⠶§¹®¿¡, ID3 ´Â ±â°èÇнÀÀ̳ª ±ÔĢȹµæÀ» À§ÇÑ ±Í³³Ãß·ÐÀ¸·Î »ý°¢µÇ±âµµ ÇÑ´Ù.
ID3 ´Â ¾î¶² Á¶°Ç¿¡¼´Â ¸Å¿ì È¿À²ÀûÀÏ ¼ö ÀÖÁö¸¸, ±× È¿¿ë¼º ¹üÀ§¸¦ ³Ñ¾î¼¼ »ç¿ëµÇ¾î¼´Â ¾ÈµÈ´Ù. ID3 ´Â ¸¹Àº ¼öÀÇ ÆÐÅϵéÀÌ ÀÖ°í, °¢ ÆÐÅϵéÀÌ ±ä ±æÀÌÀÇ ºñ¼öÄ¡ º¯¼ö°ª (¼Ó¼º°ª) À¸·Î ±¸¼ºµÇ¾î ÀÖÀ» ¶§ À¯È¿ÇÏ°Ô »ç¿ëµÉ ¼ö ÀÖ´Ù. ÀÌ·¯ÇÑ ÆÐÅϵéÀÇ ÀϺÎÀÇ Å¬·¡½ºÀÇ Á¾·ù (class membership) ´Â ÁÖ¾îÁø´Ù. ±× ÀÛ¾÷Àº Ȳ´çÇÏ°Ô ¸¹Àº µ¥ÀÌÅ͸¦ °Ë»çÇϰí, º¯¼ö°ªµéÀÇ ÃÖ¼Ò Á¶ÇÕÀÌ Å¬·¡½ºÀÇ Á¾·ù¸¦ °áÁ¤Çϱ⿡ ÃæºÐÇÏ´Ù´Â °ÍÀ» ¹ß°ßÇÏ´Â °ÍÀÌ´Ù.
ID3 ¿¡¼´Â, ¹®ÀÚ·Î µÈ ¿¹µéÀÌ Á¤È®ÇÏ°Ô ºÐ·ùµÉ ¶§±îÁö º¯¼öµéÀÌ ¾î¶»°Ô ¼ø¼´ë·Î °Ë»çµÇ´Â Áö¸¦ °áÁ¤ÇÑ´Ù. ¿¹¸¦µé¸é, º¯¼öµéÀÇ ´ÜÁö ¾ÆÁÖ ÀÛÀº ºÎºÐ¸¸ÀÌ ºÐ·ù ¸ñÀûÀ» À§Çؼ »ç¿ëµÉ Çʿ䰡 ÀÖ´Ù´Â °ÍÀ» ¾Ë°Ô µÉ °ÍÀÌ´Ù. ¹®ÀÚ·Î µÈ ¿¹µé¿¡ ´ëÇØ ¾ò¾îÁø ÀÌ·¯ÇÑ °á°ú°¡, ¸¸ÀÏ ¿ø·¡ÀÇ µ¥ÀÌÅ͸¦ Æ÷ÇÔÇÏ´Â ÈξÀ ´õ Å« ÆÐÅϵéÀ» ´ëÇ¥ÇÑ´Ù¸é, ID3 ¸¦ »ç¿ëÇÔÀ¸·Î½á ¸Å¿ì Å« À̵æ (gain) ÀÌ ¾ò¾îÁö°Ô µÉ °ÍÀÌ´Ù. µ¡ºÙ¿©¼, ½Äº°Æ®¸®¸¦ ¹ß°ßÇÑ °á°ú·Î¼, Ŭ·¡½ºÀÇ Á¾·ù´Â º¯¼ö°ªµéÀÇ ¾î¶² Á¶È¿¡ ÀÇÁ¸ÇÑ´Ù´Â »ç½ÇÀº, °Ë»ç°¡ ÀÌ·ç¾îÁö´Â °úÁ¤À» °áÁ¤ÇÏ´Â ±âº» ¸ÞÄ«´ÏÁò¿¡ ´ëÇÑ ÅëÂû·ÂÀ» Á¦°øÇÏ°Ô µÉ °ÍÀÌ´Ù.
´ÙÀ½¿¡ Quinlan (1983) ÀÇ ¿¹·Î¼ ±× °úÁ¤À» ½ÇÁõÇϰí, ´õ ÀϹÝÀûÀÎ °úÁ¤À» Ç¥ÇöÇÒ °ÍÀÌ´Ù.
¿¹Á¦) ¹°¸®Àû Ư¼º¿¡ µû¶ó °³ÀεéÀ» ±¸ºÐÇÔ
ÆÐÅÏÀÇ ÁýÇÕÀ» ¶ó°í Çϰí, ½ÅÀå, ¸Ó¸®»ö±ò, ´«»ö±ò °°Àº º¯¼ö°¡ °¢°¢ {short, tall}, {dark,
red, blond}, {blue, brown} °°Àº º¯¼ö°ªÀ» °¡Áø´Ù. Ŭ·¡½ºÀÇ Á¾·ù´Â
¿Í
ÀÌ´Ù. À̶§
´Â ´ÙÀ½°ú °°´Ù.
tall, dark, blue : short, dark, blue : tall, blond, blue : |
tall, red, blue : tall, blond, brown : short, blond, blue : |
short, blond, brown : tall, dark, brown :
|
¿©±â¼ ´Â ¸ðµç °¡´ÉÇÑ º¯¼ö°ªÀÇ Á¶ÇÕÀ» ³ªÅ¸³»Áö ¾Ê´Â´Ù´Â °ÍÀ» ¾Ë °ÍÀÌ´Ù. Áï 12 °³ÀÇ
°¡´ÉÇÑ Á¶ÇÕÁß¿¡¼ 8 °³¸¸À» ³ªÅ¸³½ °ÍÀÌ´Ù. ID3 ¹æ¹ýÀÇ ¸ñÀûÀº
ÀÇ ¸ðµç ÆÐÅϵéÀ» ±¸ºÐÇϱ⿡ ÃæºÐÇÑ Å×½ºÆ®ÀÇ ¼ø¼¸¦ ã¾Æ³¾ ¼ö ÀÖ´Ù´Â °ÍÀÌ´Ù.
±×·¡¼
¿¡¼´Â ³ªÅ¸³ªÁö ¾ÊÁö¸¸ °°Àº ¹®Á¦³ª Çö»óÀ» ´ëÇ¥ÇÏ´Â ´Ù¸¥ ÆÐÅϵ鿡¼µµ À§¿Í
°°Àº °úÁ¤ÀÌ Àß ÀÀ¿ëµÉ °ÍÀÌ´Ù.
ID3 ´Â Á¤º¸ ÀÌ·ÐÀû Á¢±Ù (information-theoretic) Á¢±ÙÀ» »ç¿ëÇÑ´Ù. ±× °úÁ¤Àº Á¤º¸¿¡¼´Â °¡Àå Å« À̵æ (gain) À» ¾ò°í, ¿£Æ®·ÎÇÇ¿¡¼´Â °¡Àå Å« °¨¼Ò¸¦ ³ªÅ¸³»´Â º¯¼ö¸¦ °Ë»çÇÑ´Ù.
¿£Æ®·ÎÇÇ´Â ·Î¼ Á¤ÀǵǸç, °Å±â¼ È®·ü
´Â ¹ß»ýºóµµÀÇ ±âÃʷμ °áÁ¤µÈ´Ù.
Å×½ºÆ®ÀÇ ´Ù¾çÇÑ ´Ü°è¿¡¼ÀÇ ¿£Æ®·ÎÇǸ¦ Æò°¡ÇØ
º¸ÀÚ. ¸ÕÀú, ¾î¶°ÇÑ Á¤º¸µµ ¾ø´Â »óÅ¿¡¼, ÆÐÅÏÀÌ ¾î¶² Ŭ·¡½º¿¡ ¼ÓÇÏ´ÂÁö¸¦ ÃßÃøÇÏ·Á¸é,
Ŭ·¡½º ´Â 0.5 ÀÇ È®·ü, Ŭ·¡½º
´Â ¶È°°ÀÌ 0.5 ÀÇ È®·üÀÌ ºÎ¿©µÉ °ÍÀÌ´Ù. Áï »çÀü È®·ü·Î¼ °°Àº °ªÀ» ºÎ¿©Çϸç,
¾î¶² Á¤º¸·Î ¾øÀ» °æ¿ìÀÇ ¿£Æ®·ÎÇÇ´Â ´ÙÀ½°ú °°´Ù.
±×·¯³ª, ¸¸ÀÏ 5 °³´Â Ŭ·¡½º¿¡ ¼ÓÇÏ´Â ÆÐÅÏÀ̰í 3 °³´Â
Ŭ·¡½º¿¡ ¼ÓÇÏ´Â ÆÐÅÏÀ̶ó¸é ¿£Æ®·ÎÇÇ´Â ´ÙÀ½°ú °°´Ù.
´Þ¸®¸»Çϸé, Á¤º¸ ³»¿ë (information content)¿¡¼ 0.046 bit Áõ°¡ÇÏ¿´´Ù.
À̶§¿¡, ¾î¶² º¯¼ö°¡ Ŭ·¡½º Á¾·ù¸¦
±¸ºÐÇϴµ¥ °¡Àå È¿À²ÀûÀΰ¡ ÇÏ´Â Àǹ®ÀÌ »ý±ä´Ù. 3 °³ÀÇ º¯¼ö ½ÅÀå, ¸Ó¸®»ö±ò, ´«»ö±ò
À» ¸ðµÎ °í·ÁÇÏ¿©, °¢ º¯¼ö¸¦ Å×½ºÆ® ÇßÀ» ¶§ ¾ó¸¶¸¸ÇÑ Á¤º¸ À̵æÀÌ ÀÖ´ÂÁö¸¦ Æò°¡ÇÑ´Ù.
¸íÈ®ÇÏ°Ô ÀÇ ¾î¶² ºÎºÐÀ» ±¸ºÐÇÒ ¼ö ÀÖ¾î¼ È¿À²ÀûÀÎ °ÍÀ¸·Î ³ªÅ¸³ª´Â º¯¼ö¸¦ ã´Â°ÍÀÌ
¾Æ´Ï¶ó, ÀüüÀûÀ¸·Î Á¤º¸ ³»¿ë¿¡¼ ÃÖ´ë À̵æ (maximum gain) À» ã´Â´Ù´Â °ÍÀÌ Áß¿äÇÏ´Ù.
3 °³ÀÇ º¯¼ö °¢°¢¿¡ ´ëÇØ Å×½ºÆ®ÇÑ »óȲÀÌ ´ÙÀ½ ±×¸²¿¡ º¸ÀδÙ. ÀÌ ´Ü°è¿¡¼´Â ¸ðµç ÀڷᱸÁ¶°¡ 1 level decision tree ÀÌ´Ù.
|
|
entropy of "tall"
branch =0.917 bits |
entropy of "short"
branch =0.918 bits |
Entropy of system before testing
Entropy (I, "height")
Information gain by testing "height" is Entropy(I) - Entropy(I, "height") = 0.954 - 0.951 = 0.003 bits |
±×¸² 1. º¯¼ö "½ÅÀå" À» Å×½ºÆ®ÇÏ¿© ¾òÀº Á¤º¸ À̵æ
|
Entropy of system before testing
Entropy for "dark"
branch is zero, ie no further information required Entropy (I, "hair")
Information gained by testing on "hair" is Entropy(I) - Entropy(I, "hair") = 0.954 - 0.5 = 0.454 bits |
±×¸² 2. º¯¼ö "¸Ó¸®»ö±ò" À» Å×½ºÆ®ÇÏ¿© ¾òÀº Á¤º¸ À̵æ
|
Entropy of system before testing
Entropy for "blue"
branch Entropy for "brown"
branch = 0 Entropy (I, "eyes")
Information gained by testing on "eyes" is Entropy(I) - Entropy(I, "eyes") = 0.954 - 0.607 = 0.347 bits |
±×¸² 3. º¯¼ö "´«»ö±ò" À» Å×½ºÆ®ÇÏ¿© ¾òÀº Á¤º¸ À̵æ
±×¸² 1¿¡¼ ½ÅÀåÀ» Å×½ºÆ®ÇÒ ¶§ ¸ðÁý´ÜÀ» Ŭ·¡½º ±¸ºÐ¾øÀÌ ¼¯¾î¼ 2 Áý´ÜÀ¸·Î ³ª´Â´Ù. "tall" °¡ÁöÀÇ ¿£Æ®·ÎÇÇ´Â 0.917 À̰í "short" ´Â 0.918 ÀÌ´Ù. °¢ °¡ÁöÀÇ ¿£Æ®·ÎÇǷμ ½Ã½ºÅÛ (Àüü ¸ðÁý´Ü) ¿£Æ®·ÎÇǸ¦ ±¸Çϸé 0.951 ÀÌ´Ù. ´Þ¸®¸»Çϸé, ½ÅÀåÀ» Å×½ºÆ® ÇØ¼´Â ¸¹Àº Á¤º¸À̵æÀÌ ¾ò¾îÁöÁö´Â ¾Ê´Â´Ù. ¹Ý¸é¿¡ ±×¸² 2 ¿Í 3 ¿¡¼´Â ¸Ó¸®»ö±ò°ú ´«»ö±ò À» Å×½ºÆ®ÇÏ¿© 0.454 ¿Í 0.347 ÀÌ ±¸ÇØÁ³´Ù. µû¶ó¼ ID3 ¸ÞÄ«´ÏÁò¿¡¼´Â Á¤º¸³»¿ë¿¡¼ÀÇ À̵æÀÌ °¡Àå ÄDZ⠶§¹®¿¡ ¸Ó¸®»ö±òÀ» Å×½ºÆ® ÇØ¾ßÇÑ´Ù´Â °á·ÐÀÌ ³ª¿Â´Ù.
À¯»çÇϰÔ, decision tree ÀÇ µÎ ¹øÂ° level ¿¡¼´Â ´«»ö±òÀ» Å×½ºÆ®ÇÏ´Â °ÍÀÌ ´õ Å« Á¤º¸³»¿ë À̵æÀ» ¾ò´Â´Ù. ÀÌ·¯ÇÑ °á°ú°¡ 2 level tree ·Î¼ ´ÙÀ½ ±×¸²¿¡ Ç¥ÇöµÈ´Ù. µÎ ¹øÂ° level ¿¡¼ ¸¸ÀÏ ÇϳªÀÇ ³ëµå (subpopulation) ÀÌ»óÀ¸·Î È®ÀåµÇ¾î¾ß ÇÑ´Ù¸é, °°Àº º¯¼ö°¡ µ¿½Ã¿¡ ¸ðµç ³ëµå¿¡ »ç¿ëµÇ¾î, ½Ã½ºÅÛ¿¡¼ ±× º¯¼ö¸¦ Å×½ºÆ® ÇØ¼ Á¤º¸ À̵æÀ» ÃßÁ¤ÇÏ°Ô µÉ °ÍÀÌ´Ù.
|
±×¸² 4. ID3 two-level decision tree.
ÀϹÝÀûÀÎ °æ¿ì, °³ÀÇ ¹®ÀڷΠǥÇöµÈ ÆÐÅϵéÀÌ Å¬·¡½º
¿¡ ¼ÓÇÏ´Â ÆÐÅÏ ÁýÇÕÀ¸·Î ºÐÇҵȴÙ. Ŭ·¡½º
¿¡¼ÀÇ ¸ðÁý´ÜÀº
ÀÌ´Ù. °¢ ÆÐÅÏÀº
°³ÀÇ º¯¼ö¸¦ °¡Áö¸ç, °¢ º¯¼ö´Â
°³ÀÇ °ªµéÀ» °¡Áø´Ù. (¿©±â¼´Â ´Ü¼øÈ ½ÃÄѼ, ¸ðµç º¯¼öµéÀÌ
°³ÀÇ °ªµéÀ» °¡Áö´Â °ÍÀ¸·Î ÇÑ´Ù). È¿À²ÀûÀÎ decision tree ¸¦ »ý¼ºÇϱâ À§ÇÑ
ID3 ¹æ¹ýÀº ´ÙÀ½°ú °°Àº ´Ü°è¸¦ °ÅÄ£´Ù.
Step 1. ¿£Æ®·ÎÇÇÀÇ ÃʱⰪÀ» °è»êÇÑ´Ù. ÈÆ·Ã ÁýÇÕ¿¡¼
¸ðµç ÆÐÅϵ鿡 ´ëÇØ ¾î¶² Ŭ·¡½º¿¡ ¼ÓÇÏ´Â Áö Ç¥½ÃµÈ´Ù. ±×·¯¹Ç·Î °³ÀÇ ÆÐÅÏÀ¸·Î ±¸¼ºµÈ ½Ã½ºÅÛÀ» À§ÇÑ Ãʱ⠿£Æ®·ÎÇÇ´Â ´ÙÀ½°ú °°´Ù.
Step 2. decision tree ÀÇ root node °¡ µÉ º¯¼ö¸¦ ¼±ÅÃÇÑ´Ù.
a. °¢ º¯¼ö ¿¡ ´ëÇØ,
,
°³ÀÇ º¯¼ö°ªµéÀÇ °ª
¿¡ µû¶ó ¿ø·¡ÀÇ ¸ðÁý´ÜÀ» 1 level ¸ðÁý´ÜÀ¸·Î ºÐÇÒÇÑ´Ù.
°³ÀÇ °¡Áö¿¡¼
°³ÀÇ ÆÐÅϵéÀÌ ÀÖÁö¸¸, ÀÌ·¯ÇÑ ÆÐÅϵéÀÌ ¸ðµÎ °°Àº Ŭ·¡½ºÀÏ ÇÊ¿ä´Â ¾ø´Ù.
b. ÇϳªÀÇ °¡ÁöÀÇ ¸ðÁý´Ü , Ŭ·¡½º
¿¡ ¼ÓÇÏ´Â ÆÐÅÏÀÇ ¼ö
. °¢ °¡ÁöÀÇ ¿£Æ®·ÎÇǰ¡ °è»êµÈ´Ù.
º¯¼ö ¸¦ Å×½ºÆ® ÇÑÈÄ¿¡ ½Ã½ºÅÛ ¿£Æ®·ÎÇÇ´Â ´ÙÀ½°ú °°´Ù.
c. º¯¼ö ¸¦ Å×½ºÆ® ÇÑ °á°ú·Î¼ ¿£Æ®·ÎÇÇÀÇ °¨¼Ò´Â ´ÙÀ½°ú °°´Ù.
d. ¿£Æ®·ÎÇǰ¡ °¡Àå Å©°Ô °¨¼ÒÇÏ´Â º¯¼ö ¸¦ ¼±ÅÃÇÑ´Ù. (¸ðµç
¿¡ ´ëÇØ
ÀÏ ¶§)
e. º¯¼ö ´Â decision tree ÀÇ root °¡ µÇ°í 1 level Àº ±×¸² 5 ¿Í °°ÀÌ µÈ´Ù.
|
±×¸² 5. decision tree ÀÇ ±¸Á¶ : root ¿Í level-1 populations.
Step 3. decision tree ÀÇ
´ÙÀ½ level À» ¸¸µç´Ù. ¸ðµç °¡Áöµé¿¡ ´ëÇØ ³ª¸ÓÁö º¯¼ö »ó¿¡¼ Å×½ºÆ® ÇÏ¿©, Á¤º¸³»¿ë¿¡¼ ÃÖ´ëÀÇ À̵æÀ» ¾ò°Å³ª ¿£Æ®·ÎÇǰ¡ ÃÖ´ë
°¨¼ÒÇÏ´Â º¯¼ö¸¦ level-1 ³ëµå·Î¼ »ç¿ëÇÒ º¯¼ö·Î ¼±ÅÃÇÑ´Ù.
Step 4. Step 1¿¡¼ 3 ±îÁö ¹Ýº¹ÇÑ´Ù. ¸ðµç ÇÏÀ§ ¸ðÁý´Ü (subpopulation) ÀÌ ÇϳªÀÇ Å¬·¡½º·Î ÅëÀÏµÇ°í ½Ã½ºÅÛ ¿£Æ®·ÎÇǰ¡ 0 ÀÌ µÉ ¶§±îÁö À§ÀÇ °úÁ¤À» ¹Ýº¹ÇÑ´Ù.
|
±×¸² 6. decision tree on basis of steepest descent in entropy.
ID3 ¹æ¹ý¿¡¼ ±âº»ÀûÀÎ ÀÛ¾÷Àº °¢ °¡Áö¿¡ ´ëÇØ
¿£Æ®·ÎÇǸ¦ °è»êÇÏ´Â °ÍÀÌ´Ù. ¿©±â¼´Â °³ÀÇ º¯¼ö °¢°¢ÀÌ
°³ÀÇ °ªÀ» °¡Áö´Â °ÍÀ¸·Î °¡Á¤ÇؿԴÙ. ±×¶§¿¡, decision tree ÀÇ root ¿¡¼,
°¢ º¯¼ö
¿¡ ´ëÇØ
¹øÀÇ ±×·± °è»êÀ» ÇÏ°Ô µÈ´Ù. ´ÙÀ½ ·¹º§¿¡¼´Â
°³ÀÇ ³ëµå °¢°¢ÀÌ
°³ÀÇ °¡Áö¸¦ °¡Áö¹Ç·Î,
°³ÀÇ º¯¼ö °¢°¢ÀÌ
¹øÀÇ °è»êÀ» ÇÏ°Ô µÈ´Ù.
±×·¯³ª, Æ®¸®ÀÇ ·¹º§ÀÌ Áõ°¡Çϸé¼, ¿©·¯°³ÀÇ °¡ÁöµéÀÌ
ÇϳªÀÇ Å¬·¡½º·Î µÇ¾î°¡¸é¼, °è»êÀÇ ºÎ´ãÀº °¨¼ÒÇÏ°Ô µÉ °ÍÀÌ´Ù. ÃßÁ¤ÇÏ¿© º¸¸é,
ÀÇ Æ®¸®´Â
ÀÇ ¿ÏÀüÈ÷ È®ÀåµÈ decision tree Á¤µµÀÇ º¹À⼺À» º¸ÀÌ´Â °ÍÀ¸·Î ÃßÁ¤µÈ´Ù. ±×·¯¹Ç·Î,
°è»êÀÇ ºÎ´ãÀº ¾à
¸¸Å Áõ°¡ÇÑ´Ù. Áï ±×°ÍÀº decision tree ÀÇ ±íÀÌ¿¡ ºñ±³ÇÏ¿© Áö¼öÀûÀ¸·Î
(exponentially) Áõ°¡ÇÏÁö¸¸, º¯¼öÀÇ ¼ö¿Í °¢ º¯¼ö°ªÀÇ ¼ö¿Í ºñ±³ÇÏ¿© º¸¸é ´ÙÇ×½ÄÀûÀ¸·Î
(polynomially) Áõ°¡ÇÑ´Ù. ±× ¾ç
Àº ¹®Á¦¿¡ µû¶ó ´Ù¸£´Ù (problem-dependent).
ID3 °úÁ¤ÀÇ ÁÖ¿äÇÑ ÀÕÁ¡Àº ÀÚµ¿ÈÇϱⰡ ½±´Ù´Â °ÍÀÏ °ÍÀÌ´Ù. °æÇèÀûÀ¸·Î, ID3 ´Â º¯¼öµéÀÇ Á¶ÇÕÀÌ ¾î¶² Ŭ·¡½º¿¡ ¼ÓÇÏ´Â Áö¸¦ °áÁ¤Çϱ⿡ ÃæºÐÇÏ´Ù´Â °ÍÀ» ¹ß°ßÇϴµ¥ µµ¿òÀÌ µÉ ¼ö ÀÖ´Ù´Â °ÍÀ» ¾Ë ¼ö ÀÖ´Ù.
Quinlan Àº °è»ê ºÎ´ãÀ» ´Ù¼Ò ´Ù¸£°Ô ¼¼úÇÑ´Ù. ±×´Â ´ÙÀ½°ú °°Àº ¿¹¸¦ µé¾ú´Ù. (Quinlan 1983, p. 464)
ID3 ´Â ¸¹Àº ´ë»óÀ» ´Ù·ç±â À§ÇØ Æ¯º°È÷ °í¾ÈµÈ °ÍÀ̸ç, »ç½Ç ¹®Á¦ÀÇ ¾î·Á¿ò°ú ÇÔ²² °è»ê ½Ã°£ÀÌ ¼±ÇüÀûÀ¸·Î Áõ°¡ÇÏ´Â °ÍÀº ´ÙÀ½°ú °°Àº °Í ¶§¹®ÀÌ´Ù.
°è»êÀÇ ¿ä±¸¿¡ ´ëÇÑ ±×¿Í ¿ì¸®µéÀÇ ¼¼úÀº ±Ùº»ÀûÀ¸·Î´Â °°´Ù.
ID3 ¹æ¹ýÀÇ ÁÖ¿äÇÑ ´ÜÁ¡Àº Àüü Æ®¸®¸¦ À籸ÃàÇÏÁö ¾Ê°í´Â decision tree ¸¦ ½±°Ô ¾÷µ¥ÀÌÆ® ÇÒ ¼ö ¾ø´Ù´Â °ÍÀÌ´Ù. Áï »õ·Î¿î ÆÐÅÏÀÌ ºÎÁ¤È®ÇÏ°Ô ºÐ·ùµÇ¾úÀ» ¶§, Æ®¸®¸¦ ¼öÁ¤ÇÏ¿© »õ·Î¿î ÆÐÅÏÀ» ÀûÀÀ½Ãų ¼ö ÀÖ¾î¾ß ÇÑ´Ù. ÀÌ·¯ÇÑ ¼öÁ¤À» patchwork ·Î¼ ¼öÇàÇÒ¼ö Àִµ¥, ±× °æ¿ì¿¡´Â ¾î¶² Áß¿äÇÑ °³³äµéÀ» °¡Àå È¿À²ÀûÀÌ°í ´ëÇ¥ÀûÀ¸·Î ¼öÇàÇÑ´Ù´Â Æ®¸®ÀÇ ¿ªÇÒÀ» Á¡Â÷·Î »ó½ÇÇÏ°Ô µÈ´Ù. ±×·¸Áö ¾ÊÀ¸¸é »õ Æ®¸®¸¦ ¸¸µé±â À§ÇØ Ã³À½ºÎÅÍ ´Ù½Ã ½ÃÀÛÇÒ ¼ö ÀÖ´Ù. ÈÄÀÚÀÇ °æ¿ì¿¡, ¹Ù¶÷Á÷ÇÏÁö ¾ÊÀº ¹æ¹ýÀÌÁö¸¸ Á¢Çß´ø ¸ðµç ÆÐÅϵéÀ» ¸Þ¸ð¸®¿¡ À¯ÁöÇÒ Çʿ䰡 ÀÖ´Ù.
¶ÇÇÑ, ID3 ´Â ÀϹÝÈ¿Í Æ¯È (generalization and specialization) ¶ó´Â ÁÖÁ¦·Î ½±°Ô Á¢±ÙÇÏÁö ¾Ê´Â´Ù. ÀÌ·¯ÇÑ ¾àÁ¡Àº ¶ÇÇÑ ID3 Æ®¸®°¡ ¼öÁ¤ÇϱⰡ ½±Áö ¾Ê´Ù´Â »ç½Ç ¶§¹®ÀÌ´Ù.