亚大邀阳明交通大学陈信宏教授谈声控经济

亚大邀阳明交通大学陈信宏教授谈声控经济

2021-05-11

陈教授强调,台湾需自行研发语音辨识,才能客制化在地需求,力求台湾在声控经济浪潮中佔有一片天地。

阳明交通大学陈信宏教授莅临亚洲大学演讲「漫谈─声控经济」。
图说:阳明交通大学陈信宏教授莅临亚洲大学演讲「漫谈─声控经济」。

亚洲大学阳明交通大学电机系讲座教授、交大前代理校长陈信宏,5月10日受亚洲大学(Asia University, Taiwan)校长蔡进发邀请,莅临亚大演讲「漫谈—声控经济」,和亚大一级主管分享人机对话的议题,陈教授分享过去及现在语音辨识系统的进展,并强调台湾需要自行研发语音辨识,才能客制化在地的需求,掌握台湾的声控经济。

亚大校长蔡进发表示,目前热门的AI与自然语言处理有紧密关系,陈信宏讲座教授在语音辨识方面是专家,台湾很多公部门的直播会议,倚赖陈教授团队所开发的语音辨识系统,达到即时语音转文字,如中央疫情流行指挥中心的记者会、立法院质询、总统大选辩论会、行政院会后记者会等。陈教授为美国德州理工大学电机博士,曾多次获得国科会杰出研究奖、教育部杰出教师奖、中国工程师学会杰出工程教授奖、中国电机工程学会杰出电机工程教授奖等,曾任国科会工程处电信学门召集人、电信/网通国家型科技计画执行长、国立交通大学物联网智慧系统研究中心主任等。

亚大校长蔡进发致词欢迎陈信宏教授。
图说:亚大校长蔡进发致词欢迎陈信宏教授。

陈教授演讲一开始时分享,语音是最自然的人机接口媒介,使用语音和电脑沟通是人类一直在追求的目标,就在今年4月,微软以 197 亿美元收购语音辨识巨头 Nuance,语音系统已从赋能技术(enabling technology)走向声控产业。2010年前的传统语音技术,运用短小的语音及文字数据库开发语音辨认系统,发展出如电话总机、语音查询、机场导览、餐厅点餐等;2010年后,走向AI 语音技术新时代,运用大数据、深度神经网络(Deep Neural Network, DNN)发展出如Siri、Alexa等的语音助理。

陈教授指出,人机对话主要透过语音辨识、文字理解及语音合成三个步骤,语音辨识的训练语料至少需要数千小时,像Google这类高科技企业拥有海量的大数据,训练语料远远超过学术界,且免费提供中文自动语音辨识,这代表台湾就不用发展自己的系统吗?陈教授说,很常会被挑战这类的问题,但他认为台湾市场小,本土语言只能靠自己做,在地团队才能及时支援如增加字汇、训练辨识当地口音等工作,和中央疫情流行指挥中心的合作就是个成功的例子,首创直拨时的即时字幕,正确率达90~94%,运用6000小时本土语料训练,外加指挥中心专用语言模型、词库(如普筛、疫调、磐石舰),客制化专属语音辨识,大幅降低听打人员打字的时间,提升效能,是政府与学校合作的典范。

陈教授强调,语音处理技术已进入AI 时代,未来仍需要本土的团队发展自有的语音处理技术,本土语言如台语、客语、原住民语,需在地自行研发,努力朝国际化及本土化两大目标发展,未来在医疗照护、机器人、语音助理、语言学习、VR、虚拟社群等应用,尚待大力发展,力求台湾在声控经济浪潮中佔有一片天地。

亚大校长蔡进发(右)致赠礼物给陈信宏教授。
图说:亚大校长蔡进发(右)致赠礼物给陈信宏教授。
陈信宏教授分享声控经济。
图说:陈信宏教授分享声控经济。
 
亚大校长蔡进发(前排左二)、陈信宏教授(前排左)与亚大副校长柯慧 贞(前排左三)、曾宪雄(前排左四),及亚大一级主管合影。
图说:亚大校长蔡进发(前排左二)、陈信宏教授(前排左)与亚大副校长柯慧 贞(前排左三)、曾宪雄(前排左四),及亚大一级主管合影。
 

编辑