鲁棒语音识别

  • 提出“Very deep CNN”、“Multi-task joint learning”模型框架
  • 于2015和2016年在国际通用的抗噪语音识别测试集Aurora4集合上连续取得国际最低错误率,此记录至今未被打破,代表了抗噪声学建模研究的国际领先水平
  • Yanmin Qian, Mengxiao Bi, Tian Tan and Kai Yu. Very Deep Convolutional Neural Networks for Noise Robust Speech Recognition. IEEE/ACM Transactions on Audio, Speech and Language Processing, vol. 24
  • Yanmin Qian, Maofan Yin, Yongbin You and Kai Yu. Multi-Task Joint-Learning of Deep Neural Networks for Robust Speech Recognition. IEEE Automatic Speech Recognition and Understanding Workshop (ASRU), Scottsdale, Arizona, USA, 2015: 310-316.

解码搜索技术

  • 提出音素同步解码算法
  • 获得3到5倍的加速比提升,是自2002年以来,学术界取得的最大的搜索速度提升,也是语音识别发展历史上最显著的几次解码搜索速度提升之一
  • Zhehuai Chen, Wei Deng, Tao Xu and Kai Yu. Phone Synchronous Decoding with CTC Lattice. 17th Annual Conference of the International Speech Communication Association (InterSpeech), San Francisco, America, 2016: 1923-1927.

语义理解

  • 提出“聚焦”模型框架
  • 结果与结果与国际著名研究机构研究成果在通用测试集上进行对比,性能指标是已发表算法中的最高结果,达到国际领先水平
  • Su Zhu and Kai Yu. Encoder-decoder with Focus-mechanism for Sequence Labelling Based Spoken Language Understanding. IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), New Orleans, USA, 2017: 5675-5679.

对话状态跟踪

  • 提出“循环多项式网络”
  • 和国际最前沿的若干典型算法相比较,RPN在DSTC-3的JointGoal任务上取得了迄今为止的国际上已发表的最高精度记录,代表了极度数据稀疏情况下对话状态跟踪算法的国际领先水平
  • Kai Sun, Qizhe Xie and Kai Yu. Recurrent Polynomial Network for Dialogue State Tracking. Dialogue & Discourse, vol. 7, no. 3, 65-88, 2016.

大规模连续语音识别系统

  • 搭建中英文多路大规模解码系统
  • 在美国国家标准局、美国国防部标准评测、BBC多风格广播语音识别评测均获得冠军,代表了大规模语音识别系统的国际领先水平

端到端口语对话系统

  • 设计并实现认知型对话系统
  • 获得首届对话系统国际挑战赛可控测试冠军,代表了端到端口语对话系统的国际领先水平
  • BlackAW, Burger S, Conkie A, et al. Spoken dialog challenge 2010: Comparison of live and control test results. Proceedings of the SIGDIAL 2011 Conference. Association for Computational Linguistics, 2011: 2-7

国际级产业化成果

  • 思必驰先后获得联想之星、启迪、阿里等多方知名VC数亿元投资,并先后获得剑桥大学商业计划奖、剑桥大学Downing基金、英国政府研发基金、国家电子发展基金、重点科技支撑计划以及各类领军企业基金。在苏州、北京、上海、深圳设立公司,是国内未上市的最大的人工智能创业公司之一
  • 思必驰与上海交通大学合作建立智能人机交互联合实验室,进行科研成果的产业转化,X-LANCE实验室的研究成果支持思必驰成为国际知名的人工智能的创业公司
  • 思必驰公司的AIOS操作系统,提供智能设备人机自然口语交互的全套解决方案,累计注册智能终端1800万,终端访问超过200亿次,覆盖用户量过亿
  • 思必驰入选2016高盛全球人工智能报告《AI, Machine Learning and Data Fuel the Future of Productivity》“Key AI Players”,中国仅5家入选,包括百度、阿里、腾讯及思必驰在内的两家人工智能创业公司
  • 思必驰入选2017年国际权威IT咨询机构Gartner的“Cool Vendors for AI”,中国仅3家人工智能公司入选