
À½¼ºÀÎ½Ä AI ½ºÅ¸Æ®¾÷ ¸®ÅÏÁ¦·Î´Â Áö³ 4¿ù À½¼º Åëȳ»¿ëÀ» ¸Þ½ÅÀúó·³ ¹®ÀÚ·Î º¸¿©ÁÖ´Â ¾ÖÇø®ÄÉÀ̼Ç(¾Û) ¡®ºñÅä(VITO)¡¯(»çÁø)¸¦ Ãâ½ÃÇß´Ù. ¡®Voice In Text Out¡¯ÀÇ ¾àÀÚÀÎ ºñÅä¿¡´Â À½¼ºÀ» ¹®ÀÚ·Î ¹Ù²ãÁÖ´Â STT(Speech To Text) ±â¼ú°ú ¸ñ¼Ò¸®¸¦ ±¸ºÐÇÏ´Â ÈÀÚ ºÐ¸® ±â¼úÀÌ Àû¿ëµÆ´Ù. ºñÅä´Â ¿ÀǺ£Å¸ ¼ºñ½º Ãâ½Ã 50ÀÏ ¸¸¿¡ ´©Àû ´Ù¿î·Îµå 5¸¸°ÇÀ» µ¹ÆÄÇß´Ù.
¾ÛÀ» ÄÑ´Ï ÀúÀåµÅÀÖ´ø À½¼º ÅëÈ ³ìÀ½ ÆÄÀÏÀÌ ¸Þ½ÅÀú ´ëÈâó·³ ±¸¼ºµÈ ȸ鿡 ÅØ½ºÆ®·Î ³ªÅ¸³µ´Ù. ÇÑ ½Ã°£¿¡ ´ÞÇÏ´Â Åëȵµ ½ºÅ©·ÑÀ» ³»·Á¼ Àдµ¥ 5ºÐÀ̸é ÃæºÐÇß´Ù. °Ë»ö ±â´É±îÁö Àû¿ëµÅ ¿À·¡Àü Åëȳ»¿ë Áß ±â¾ïÀÌ Àß ³ªÁö ¾Ê´Â ºÎºÐÀº Ű¿öµå·Î ã¾Æº¼ ¼ö ÀÖ´Ù. ´ëÈâ ¸»Ç³¼±À» ´©¸£¸é ÇØ´ç ºÎºÐ À½¼ºÀ» µéÀ» ¼öµµ ÀÖ´Ù. ÇöÀç ¹«·á»ç¿ëÀÚ¿¡°Ô´Â ÃÖ´ë 100ÅëÀÇ ÅëÈ º¯È¯ ¼ºñ½º°¡ Á¦°øµÈ´Ù. ¿ù 4900~9900¿ø ¼öÁØÀÇ Á¤±â°áÁ¦ ¼ºñ½º¿¡ °¡ÀÔÇϸé ÃÖ´ë 1000~1¸¸ ÅëȱîÁö ¹®ÀÚȰ¡ °¡´ÉÇÏ´Ù. ¸®ÅÏÁ¦·Î´Â ¿ÃÇØ ºñÅäÀÇ Áö¿ø ¾ð¾î¸¦ Áß±¹¾î·Î È®´ëÇϰí, ³»³â¿¡´Â ÀϺ»¾î ¹öÀüµµ ³»³õÀ» Àü¸ÁÀÌ´Ù.

³×À̹ö´Â Ŭ·Î¹Ù AI ±â¼úÀ» Ȱ¿ëÇÑ µ¿¿µ»ó ÀÚµ¿ ÀÚ¸· »ý¼º ±â´É(»çÁø)À» ÃÖ±Ù ¼±º¸¿´´Ù. ¸ð¹ÙÀÏ ¶óÀÌºê ½ºÆ®¸®¹Ö ¼ºñ½ºÀÎ ¡®ÇÁ¸®Áò ¶óÀÌºê ½ºÆ©µð¿À(PRISM Live Studio)¸¦ ÅëÇØ¼´Ù. µ¿¿µ»ó Àå¸é°ú ³»¿ë¿¡ ¾î¿ï¸®´Â ÀÚ¸· ÅÛÇø´ ±â´Éµµ ÇÔ²² Á¦°øÇÑ´Ù. »ç¿ëÀÚ°¡ ½ºÆ©µð¿À¿¡¼ µ¿¿µ»óÀ» ÆíÁýÇÒ ¶§ À½¼ºÀÎ½Ä ¿£ÁøÀÎ NEST(Neural End-to-end Speech Transcriber)°¡ ¿Àµð¿À¸¦ ºÐ¼®ÇØ ÀÚµ¿À¸·Î ÅØ½ºÆ®¸¦ ÀÚ¸·À¸·Î º¯È¯ÇØÁØ´Ù. NEST´Â º¹ÀâÇÑ À½¼ºÀ» Á¤È®ÇÏ°Ô ÀνÄÇϰí ÅØ½ºÆ®·Î º¯È¯ÇÒ ¼ö ÀÖµµ·Ï ³×À̹ö°¡ ÀÚü °³¹ßÇÑ ±â¼úÀÌ´Ù.
ÀÚµ¿ÀÚ¸· »ý¼º ±â´ÉÀ» »ç¿ëÇÏ¸é µ¿¿µ»ó ÀÚ¸· ÀÛ¾÷ÀÇ ÆíÁý ½Ã°£À» ȹ±âÀûÀ¸·Î ´ÜÃàÇÒ ¼ö ÀÖ°í, Á¤È®µµµµ ³ôÀÏ ¼ö ÀÖÀ» °ÍÀ¸·Î ±â´ëµÈ´Ù. ´Ù¼öÀÇ ÀÚ¸· ÆùÆ®¿Í ÅØ½ºÆ®¸¦ Á¦°øÇÏ´Â ÅÛÇø´ ±â´ÉÀ» ÅëÇØ ´Ùä·Î¿î µðÀÚÀÎÀÇ ÀÚ¸·À» ¸¸µé ¼öµµ ÀÖ´Ù.
³×À̹ö °ü°èÀÚ´Â ¡°ÇÁ¸®Áò ¶óÀÌºê ½ºÆ©µð¿À´Â ºñ´ë¸é Æ®·»µå·Î ±¹³»¿Ü µ¿¿µ»ó ¶óÀÌºê ¼ö¿ä°¡ ¸¹¾ÆÁö°í ÀÖ´Ù¡±¸ç ¡°1ÀÏ 1¸¸2000°ÇÀÇ ¶óÀÌºê ¹æ¼ÛÀÌ ÁøÇàµÇ°í Àִµ¥ ÀÌ´Â Áö³ 2¿ù ´ëºñ 4¹è ÀÌ»ó Áõ°¡ÇÑ ¼öÄ¡¡±¶ó°í ¹àÇû´Ù.
±è¼ºÈÆ ±âÀÚ hunhun@kmib.co.kr
GoodNews paper ¨Ï ±¹¹ÎÀϺ¸(www.kmib.co.kr), ¹«´ÜÀüÀç, ¼öÁý, Àç¹èÆ÷ ¹× AIÇнÀ ÀÌ¿ë ±ÝÁö
2087