Speech  Recognition

 

Àΰ£°ú ±â°è°¡ À½¼ºÀ¸·Î ´ëÈ­ÇÑ´Ù´Â °ÍÀº ÀηùÀÇ ²ÞÀ¸·Î, ¿À·¡ ÀüºÎÅÍ ¿¬±¸µÇ¾î ¿Â ÁÖÁ¦ÀÌ´Ù. À½¼º (Speech) À¸·Î ±â°è¿Í ´ëÈ­ÇÒ ¶§ÀÇ ÀåÁ¡Àº,  Ã¹Â°·Î ¼÷·ÃÀ» ¿äÇÏÁö ¾Ê´Â´Ù. Àΰ£¿¡°Ô °¡Àå ¼Õ½¬¿î ÀԷ¼ö´ÜÀ̱⠶§¹®¿¡, ÀÚÆÇ¿¡ ÀÔ·ÂÇÏ´Â °æ¿ì¿Í °°Àº ÈÆ·ÃÀ» ¿äÇÏÁö ¾Ê´Â´Ù. µÎ ¹ø°·Î °í¼ÓÀÔ·ÂÀÌ °¡´ÉÇÏ´Ù. ÀÚÆÇÀ¸·Î ÀÔ·ÂÇÏ´Â °Í¿¡ ºñÇØ 2~6 ¹èÀÇ ¼Óµµ·Î ÀÔ·ÂÇÒ ¼ö ÀÖ´Ù. ¼Â°·Î ¼Õ¹ßÀÌ ±¸¼ÓµÇÁö ¾Ê´Â´Ù. ¼ÕÀÌ ´Ù¸¥ ÀÏÀ» ÇÏ°í À־ ÀÚÀ¯·ÎÀÌ ÀÔ·ÂÇÒ ¼ö ÀÖ´Ù. ¶ÇÇÑ °É¾î°¡¸é¼­ ÀÔ·ÂÇÒ ¼öµµ ÀÖ´Ù.

definition   term   history     lab    site    book   demo   paper

À½¼º ÀÎ½Ä (Speech Recognition) Àº ÄÄÇ»ÅÍ°¡ À½ÇâÇÐÀû ½ÅÈ£ (acoustic speech signal) ¸¦ ÅؽºÆ®·Î mapping ½ÃÅ°´Â °úÁ¤ÀÌ´Ù. Áï ÀϹÝÀûÀ¸·Î ¸¶ÀÌÅ©³ª ÀüÈ­¸¦ ÅëÇÏ¿© ¾ò¾îÁø À½ÇâÇÐÀû ½ÅÈ£¸¦ ´Ü¾î³ª ´Ü¾î ÁýÇÕ ¶Ç´Â ¹®ÀåÀ¸·Î º¯È¯ÇÏ´Â °úÁ¤À» ¸»ÇÑ´Ù. ÀÎ½ÄµÈ °á°ú´Â ¸í·ÉÀ̳ª Á¦¾î, µ¥ÀÌÅÍ ÀÔ·Â, ¹®¼­ Áغñ µîÀÇ ÀÀ¿ë ºÐ¾ß¿¡¼­ ÃÖÁ¾ °á°ú·Î »ç¿ëµÉ ¼ö ÀÖÀ¸¸ç, À½¼ºÀÌÇØ¿Í °°Àº ºÐ¾ß¿¡´Â ¾ð¾î 󸮰úÁ¤ÀÇ ÀÔ·ÂÀ¸·Î »ç¿ëµÉ ¼ö ÀÖ´Ù.

¹Ý´ë·Î À½¼ºÇÕ¼º (Speech Systhesis) ÇÁ·Î±×·¥Àº ¹®¼­¸¦ ÀÔ·ÂÇÏ¿© (written input) ÀÚµ¿ÀûÀ¸·Î »ý¼ºµÇ´Â ÇÕ¼º À½¼ºÀ¸·Î º¯È¯ÇÏ¿© Ãâ·ÂÇÏ´Â(spoken output) °ÍÀÌ´Ù. ±×·¡¼­ À½¼ºÇÕ¼ºÀº °¡²û "Text-to-Speech" conversion (TTS) ·Î ºÒ¸®¿öÁø´Ù.

À½¼ºÀÌÇØ (Speech Understanding) ´Â ÄÄÇ»ÅÍ°¡ À½Çâ À½¼º ½ÅÈ£(acoustic speech signal)¸¦ µè°í¼­ À½¼ºÀÇ ÀÇ¹Ì (abstract meaning) ·Î mapping ½ÃÅ°´Â °úÁ¤ÀÌ´Ù. ´ÜÁö ÇѸ¶µð ÇѸ¶µð¸¦ Á¤È®È÷ ÀνÄÇÏ´Â °Í¸¸ÀÌ ¾Æ´Ï¶ó, ¹ßÀ½µÇ´Â ¹®Àå ÀüüÀÇ Àǹ̸¦ ÀÌÇØÇÏ·Á´Â ½Ãµµ¸¦ À½¼ºÀÌÇضó ºÎ¸¥´Ù.

À½¼º ÀνÄÀº ÀϹÝÀûÀ¸·Î ¸¶ÀÌÅ©³ª ÀüÈ­¸¦ ÅëÇÏ¿© ¾ò¾îÁø À½ÇâÇÐÀû ½ÅÈ£¸¦ ´Ü¾î³ª ´Ü¾î ÁýÇÕ ¶Ç´Â ¹®ÀåÀ¸·Î º¯È¯ÇÏ´Â °úÁ¤À» ¸»ÇÑ´Ù. ÀÎ½ÄµÈ °á°ú´Â ¸í·ÉÀ̳ª Á¦¾î, µ¥ÀÌÅÍ ÀÔ·Â, ¹®¼­ Áغñ µîÀÇ ÀÀ¿ë ºÐ¾ß¿¡¼­ ÃÖÁ¾ °á°ú·Î »ç¿ëµÉ ¼ö ÀÖÀ¸¸ç, À½¼º ÀÌÇØ¿Í °°Àº ºÐ¾ß¿¡´Â ¾ð¾î 󸮰úÁ¤ÀÇ ÀÔ·ÂÀ¸·Î »ç¿ëµÉ ¼ö ÀÖ´Ù. ±× °á°ú À½¼ºÀνıâ¼úÀº Àΰ£°ú ÄÄÇ»ÅÍ °£ÀÇ ÀÚ¿¬½º·¯¿î ÀÇ»ç¼ÒÅëÀ» °¡´ÉÄÉ Çϸç Àΰ£¿¡°Ô º¸´Ù ¹ÐÂø½ÃÅ´À¸·Î½á Àΰ£ÀÇ »ýÈ°À» º¸´Ù dz¿ä·Ó°Ô ¸¸µå´Âµ¥ ÇʼöÀûÀÎ ÃÖ÷´Ü ±â¼úÀÌ´Ù. À½¼ºÀνÄÀº Å©°Ô »ç¿ëÀÚ¿¡ µû¶ó È­ÀÚÁ¾¼Ó¹æ½Ä (Speaker Dependent System), È­ÀÚµ¶¸³¹æ½Ä (Speaker Independent System), È­ÀÚÀûÀÀ¹æ½Ä (Speaker Adaptive System) À¸·Î ºÐ·ùµÇ°í, ¹ßÀ½¹æ½Ä¿¡ µû¶ó °í¸³´Ü¾îÀνÄ, Çٽɾî ÀνÄ, ¿¬°á´Ü¾îÀνÄ, ¿¬¼ÓÀ½¼ºÀνÄ, ´ëÈ­À½¼ºÀνÄÀ¸·Î ³ª´µ°í, ÀνĴë»ó ¾îÈÖ¼ö¿¡ µû¶ó ¼Ò¿ë·®, Áß¿ë·®, ´ë¿ë·® Àνıâ¼ú·Î ºÐ·ùµÈ´Ù. ¶Ç ´Ü¾î´ÜÀ§·Î ÀÎ½Ä ÇÏ´Â ´Ü¾îÀνıâ¼ú, À½¼Ò´ÜÀ§·Î ÀνÄÇÏ´Â °¡º¯¾î Àνıâ¼ú·Î ³ª´­ ¼ö ÀÖ´Ù. À½¼ºÀνıâ¼úÀº À½¼º¸í·É ÄÄÇ»ÅÍ´Â ¹°·Ð ¹«ÀÎÀüÈ­¹øÈ£ ¾È³», À½¼º¸í·É ÁÖ¹®Çü ºñµð¿À, °¢Á¾ À½¼º¾È³» ½Ã½ºÅÛ, °¡ÀüÁ¦Ç°À» ºñ·ÔÇØ ÀÚµ¿Â÷ Ç×¹ýÀåÄ¡ (Car Navigation System), Ȩ¿ÀÅä¸ÞÀ̼Ç, À½¼º´ÙÀÌ¾ó¸µ µî À̿뿵¿ªÀÌ ¹«ÇÑÇÏ´Ù.

±× µ¿¾È °ø»ó°úÇÐ ¿µÈ­¿¡¼­³ª º¼ ¼ö ÀÖ¾ú´ø À½¼ºÀÎ½Ä ±â¼ú°³¹ßÀÌ ÃÖ±Ù È°¹ßÇØÁö°í ÀÖ´Ù..... ¾ÕÀ¸·Î À½¼ºÀÎ½Ä °ü·Ã ±â¼úÀÌ À̵¿Åë½Å ±â±â´Â ¹°·Ð TV·³ÃÀå°í¸¦ ºñ·ÔÇÑ °¡Á¤¿ë ÀüÀÚÁ¦Ç°°ú ·Îº¿ µî¿¡µµ Á¢¸ñÇÏ¸é ¿ì¸®µéÀÌ »ì¾Æ°¡´Â ÀÏ»ó»ýÈ°¿¡ Çõ¸íÀûÀÎ º¯È­¸¦ ¸ô°í ¿Ã °ÍÀ¸·Î Àü¸ÁÇÏ°í ÀÖ´Ù.....

video :

µö ·¯´× ±â¹ÝÀÇ À½¼ºÀÎ½Ä ±â¼ú : SKtechx Tacademy : 2017/06/18 ... µö ·¯´× (Deep Learning)

 

(Àü¹®°¡ ÅäÅ© ¸±·¹ÀÌ) ¾ð¾î¿Í À½¼ºÀÎ½Ä ¹× ÀÚµ¿Å뿪 ±â¼ú µ¿Çâ : ¼ÖÆ®·è½º : ETRI ¾ð¾î󸮿¬±¸½Ç ±è¿µ±æ ¹Ú»ç, 2015/11/11