国电电力宁夏新能源开发有限公司一间办公室的大屏上,显示着发电量、巡检信息、设备运行状况等各种数据。“打开某风电场的运行数据”,随着工作人员用声音发出指令,大屏页面迅速切换至风场的相关数据页面,风场实时运行状态一目了然。
对于这里工作人员来说,用语音控制大屏已是再熟悉不过的事。当有领导来参观时,工作人员还可以提前将需要讲解的文字转换为语音,让大屏自动进行语音讲解,并同步展示相关内容画面。
这些“神奇”效果的实现,离不开讯飞智能语音智控解决方案的应用。
讯飞智能语音智控解决方案,助力能源行业数字化
当前,数字产业正在成为经济转型升级的新引擎。作为关乎国计民生的重要行业,电力领域的数字化革新也在如火如荼地进行中。
传统的能源企业基础设施普遍庞大而复杂,以国电电力宁夏新能源为例,公司下辖石板泉、牛首山等多个风场和众多风机。为更好地掌握作业数据、实现可视化管理、实时数据洞察等功能,有效提高指挥调度、风险预警、生产经营等效率,安装和使用可视化数字大屏成为许多能源企业的选择。
可视化数字化大屏的使用,保障了能源企业的安全生产,帮助决策者从微观到宏观地掌握了企业的运行状态。然而在使用过程中,出现了一些新的问题:
由于数据层级众多,在搜索需要的数据时,过程繁杂;
当有客户/领导参观时,除了讲解员,还需有一位工作人员协助操控页面,浪费人力;
预警信息推送时容易忽略......
如何能高效地对大屏进行操作?深耕语音技术二十多年,深入了解用户面临的痛点和使用场景,科大讯飞推出了智能语音智控解决方案。
智能语音智控解决方案可实现语音查询信息、语音切换页面、语音控制设备、语音智能播报和问答咨询的效果,用于会议解说、应用系统演示、展览解说、监控调阅、定时提醒或告警播报等场景。
应用系统演示:通过投影、数字大屏、智能电视等显示设备进行软件系统演示时,作为讲解员的助手,配合讲解员同步切换到指定界面,点击指定按钮等。
展览解说:适用于产品展示区、展馆等地,语音控制播放指定音/视频文件,支持本地及远程音/视频播放;解说员/录音讲解PPT时,配合自动翻页、跳转到指定内容页;支持与用户闲聊、知识问答。
监控调阅:语音控制调阅摄像头实时监控画面。
定时提醒或告警播报:定时语音播报天气、会议等内容提醒,天气、业务系统指标等主动预警播报。
多模态语音交互技术,破解应用难题
在展厅讲解或人声嘈杂的情况下,语音识别准确率相对较低,经常出现“答非所问”的情况。
为了给客户更好地使用体验,方案中应用了讯飞多模态语音交互技术,能有效降低环境噪音的干扰,提高语音识别准确率,保障用户的对话交互体验。融入机器视觉,多模态语音交互技术还可以在多人同时说话的嘈杂场景中,将其他人声和环境噪声进行过滤,准确地把目标说话人的声音分离出来进行识别。
根据客户实际需求,语音智控还可利用机器人、数字人结合实现人机交互和自助演示。
目前此方案已在多个能源企业使用,帮助企业节省人力,降低信息错过率,让讲解过程更为智能化、自动化。2021年,应用了讯飞智能语音智控解决方案的国家能源集团新能源智能发电平台,通过中国电力企业联合会组织的鉴定,被鉴定专家组认为整体达到国际先进水平,并在国家能源集团第三届科技大会上获得一等奖。
多场景覆盖,助力系统智慧升级
除能源行业之外,在指挥调度中心、多功能展厅等场景也能看到此方案的应用案例。
在天津滨海新区中新天津生态城的智能化展示大厅,针对中新管委会希望“将语音技术融入智慧展厅建设”的需求,科大讯飞通过语音识别和语音理解技术实现智能语音调度,实时采集操作人员的语音并转化为文本,然后将文本传至语义理解引擎,再将预先设置的调度内容与识别文本进行匹配。匹配完成后,反馈标准的格式化文本结构传输给相关应用系统。应用系统获取到该文本结构之后,再通过程序解析,实现内容的分发与执行,完成整个调度操作。
此外,利用语音合成技术可以将需要讲解的内容转化为语音,并且可以支持多语种多方言的播报,解决了人工在特定场景下需要进行外语讲解的难题。
持续源头技术创新。未来,讯飞将通过更多AI技术为能源等行业数字化转型贡献力量。
想要了解语音智控更多内容https://www.aifuwus.com/onstage/cmdpreview?id=3850
还没有评论,赶快抢占沙发~!