人工智能这一概念,早在1956年达特茅斯会议上便已首次提出。经历60余年,从感知智能走向认知智能,人工智能迅猛发展,赋能千行百业。

11月18日, 2022科大讯飞全球1024开发者节盛大开幕,引领人工智能生态向新而行。大会现场,科大讯飞消费者事业群总裁于继栋发表《人机协同 数字新生》主题演讲,分享讯飞开发者生态进展,展望人机协同新未来。

科大讯飞消费者事业群总裁 于继栋


韧性增长 讯飞生态蓬勃发展

面对纷繁复杂的全球经济环境,各行各业充斥着不确定性,如何应对这一变局,寻求下一步发展的动力来源?

人工智能产业的蓬勃生命力、讯飞开放平台的稳健增长,让我们看见人工智能的巨大潜能,相信中国科技广阔的未来。

自2017年以来,讯飞开放平台开发者数与AI服务年度调用总量,呈现持续稳步上升趋势。 2022年,开发者数达到370万,AI服务在线调用年增长率达到36%。

快速增长的背后,是AI已经高度融入人们的日常生活和工作,于继栋在现场分享到。

在社交场景,近一年输入法语音调用量同比增长45%,已超过平台AI调用增速。其中,Z世代群体对语音输入更为偏爱,女性使用语音的比例是男性的1.4倍。语音输入已成为日常交流中人机交互的重要方式。

在家庭场景,电视助手语音调用量过去3年间,增长了515%。在用户分析中看到,全年龄段用户都已形成语音交互的习惯,其中低于14岁的少年儿童群体和高于60岁的中老年群体比成年用户更偏爱语音交互。

在出行场景,车载语音调用量获得到了翻番的增长。在过去一年全国出口的200万辆汽车中,预制讯飞多语种语音交互系统的车辆已超71%。合作车企在科大讯飞的助力下,已将13个语种推广到全球20个国家。

在学习场景,过去一年教育相关的AI调用呈现出902%的增长。在双减政策的推动下,AI帮助学生减负。讯飞及生态伙伴推出学习机、翻译笔、口算宝、早教机等一系列智能硬件有效陪伴了少年儿童的学习成长。

在办公场景,AI办公硬件服务调用持续快速增长。以办公本、会议耳机、翻译机为代表的办公硬件,为用户省时增效。在录音笔的应用中,平均每天为每个用户节省1.32小时。AI在办公领域的广泛应用,已为工作效率的提升发挥巨大作用。

在阅读场景,一些大型新闻类、阅读类APP的应用,让语音合成服务的调用量有了明显增长。在AI的加持下,用声音陪伴的阅读体验,正在改变用户的阅读习惯,提升阅读粘性。

众多AI服务调用量的增长,让我们看到AI应用的价值在不断深入。基于此,讯飞将更多的AI能力开放给开发者,让AI持续传递。


全新讯飞开放平台

全方面赋能人机协同场景

随着社交、家庭、出行、学习、办公、阅读等越来越多AI场景的广泛应用,人工智能在人机交互阶段已经走进千行百业,并持续发光发热。当下,人工智能与生活结合更好的时代就是人机协同的时代。

如何进入人机协同时代?于继栋分享了对物理世界、数字世界、元宇宙三大场景人机协同应用的思考。在物理世界,实体机器人可以拓展人的能力边界;在数字世界,数字工作助手,将助力工作提效;在元宇宙,虚拟人成为人的交互载体。

实体机器人从室内到户外,帮助人们从事工业焊接、果实采摘、高空作业等高精度、高强度、高风险的工作。虚拟数字人打破实体的限制,在媒体、金融、办公等领域广泛应用,打造数字生产力。

为满足人机交互的时代需求,讯飞开放平台进行了全新升级。在感知智能、认知智能、运动智能强大的技术底座之上,围绕能力云、交互云、模型云、资产平台、超自动化、机器人超脑,以API、低代码、软硬件一体和解决方案的方式,面向实体机器人和数字机器人建设N种场景化机器人。

全新的讯飞开放平台,通过原有组件升级、新组件发布,为开发者提供更优秀的服务能力,更广阔的应用场景。

能力云AIHUB,是在2018年发布的基础上进行升级和扩展,已开放513项AI能力并不断引入生态合作伙伴最优秀的能力,打造AI能力图谱。面向网络不稳定、信息安全敏感的环境,全新升级了全系离线版本,加深行业应用。值得一提的是,在大会现场刚刚发布的SMART-TTS多风格多情感语音合成技术,已在讯飞开放平台、讯飞有声APP同步上新,让开发者可以更早的体验到拥有10种场景、11种情感的语音合成。

交互云AIUI+,通过远近场多模语音增强,突破同向人声干扰难题,解决人机交互最后一公里问题。通过多模态技术,对人脸、唇形进行跟踪定位,实现主动交互、说话人保持、噪声抑制。在同向人声干扰下,语音识别准确率已由60.2%提升到86.8%。

模型云AILAB,面向细分模型定制场景,提供小样本训练平台,主要解决三类问题。面向格式多样场景,支持任意自定义格式单据识别;针对数据稀缺场景,实现5张图片训练出OCR定制模型、半小时音频生成商用发言人;遇到价格敏感场景,“0”成本提供多样唤醒词。

资产平台AIRES,联合生态,共建数字资产,让机器人交互形象生动有内容。目前平台已提供210个多语种技能、342个虚拟人形象、6000万首正版音乐、1200万小时有声内容,并开放数字藏品平台——星昼,为开发者提供丰富的内容资源。

超自动化AIRPA,用数字机器人激活人效潜能,助力企业数字化转型。由AI+RPA构建的数字机器人是讯飞面向企业场景打造的协作新模式,提供了数字机器人统一工作台、柔性人机协同、智能化员工助手等应用。

除以上组件升级焕新以外,讯飞还发布了机器人超脑平台AIBOT,让机器人在交互大脑的基础上,快速构建运动能力。


机器人超脑平台发布

让AI的赋能无处不在

“降低开发者使用门槛,快速实现超脑能力与实体机器人的结合,为实体机器人真正的智能化带来直接动力与贡献!”于继栋在发布机器人超脑平台AIBOT时如是说。

融入多模交互、深度理解、运动控制、硬件模组等核心能力的机器人超脑平台,为实体机器人提供高性能的算力支撑、高效率的地图导航以及高精度的定位功能,打造软硬一体的智能化机器人。

而这一项技术已经有了实际的应用案例。

能说会跑的狗

来自宇数科技的四足机器狗在讯飞机器人超脑平台的加持下,已实现自适应的地形能力、全局定位搜索能力、地图快速构建能力、更精细的运动控制能力。在这四大能力全面提升后,机器狗能跑会跳,能看会说,可应用于户外巡逻、工业巡检等多元化场景。

超强助手机械臂

基于讯飞机器人超脑平台,珞石科技为柔性机械臂增加了语音交互、深度视觉以及运动控制能力,再加上算法的改造,让机械臂操作更智能、工业质检更高效、定位更实时,可以有效的适应各种应用。在工业质检、商业服务、远程超声、柔性生产等场景,柔性机械臂都可实现与人类更高效的工作配合。


开发者灯塔计划

让每个创新者享受AI乐趣

独木不成林 生态才永恒。依托越来越多优秀的人工智能应用的开放,讯飞开放平台期待让每个创新者享受AI的乐趣。

日常生活和企业工作中,很难要求每个人都懂程序开发。通过RPA、低代码等技术构建工作场景下的新型智能应用,讯飞开放平台为懂业务、想创新的伙伴提供服务,将更多智能化的体验带进千家万户。会上,于继栋发布了“开发者灯塔计划”,秉持“共生、共创、共享、多样繁荣”的理念,打造更丰富、便捷的AI服务,让AI科学家、设计师、企业管理人员与内容生产者等,都能享受AI的乐趣与价值,共创繁荣的AI新生态。

“希望与各位开发者携手共创,迈入人机协同新时代”,在大会最后,于继栋发出倡议。讯飞开放平台将继续秉持共建人工智能产业的初心,用生态定义未来,共筑数字经济新发展。