网易数帆发布对话式BI产品 试图抓住垂类大模型的机会
2023-08-11 09:07:18来源:界面新闻
8月10日,网易数帆发布了AIGC技术方向的对话式BI(商业智能)产品有数ChatBI,相较于目前正在流行的对话式产品,有数ChatBI主要想强调的属性在于“数据的可信”。
【资料图】
网易数帆大数据产品线总经理余利华表示,数字化时代,多个经营环节需要用数据支撑决策已经成为常态,企业数据分析需求量大幅度上升。
以网易数帆某客户为例,其月均数据分析需求量超过了200,策划、运营、用户体验、QA等不同岗位都提出了用数的需求,其中运营相关的临时或紧急的需求占比很高。但由于数据分析流程的专业性和分析人才的稀缺性,传统数据分析显得耗时而低效。
AI产品尽管可以帮助提升效率,其答案的可信度却很成问题。网易数帆方面表示,类ChatGPT产品并不能带来完全准确的回答,主要原因在于两点,首先,类ChatGPT产品更擅长处理自然语言文本数据相关任务,并非专门为数据分析而设计;其次,通用大模型可能存在捏造事实,也即“AI幻觉”,在BI领域可能是捏造字段,这在数据分析中可能成为致命问题。
于是,在数据分析领域对抗“AI幻觉”出现的可能性,成为有数ChatBI团队的首要任务之一。
余利华表示,“AI幻觉”的产生是由于训练数据不足、文本与表示之间的编解码错误等因素,于是团队打造可信的ChatBI需要在需求理解、过程验证、用户干预和产品运营四个方面着手。
具体而言,网易数帆需要借助大模型的语言理解能力,先进行用户的需求分析,并帮助BI初级使用者通过需求分析内容判断系统的取数步骤是否正确;过程验证指的是借助基于大模型的NL2SQL能力实现复核,余利华介绍,为了提升NL2SQL能力,网易数帆有针对性地定制生成和优化了超过30万不同类型的问法和SQL,目前调优出的NL2SQL领域模型,效果已达到GPT-3.5的水平;用户干预即将数据模型和查询条件结构化,用户可切换数据模型或者查询条件;产品运营方面则构建了运营反馈机制,用户可反馈数据准确性,管理员通过运营知识库、标记及优化badcase提升数据可靠性。
在实际应用中,以大型连锁超市的销售部门场景为例,产品人员输入“我想看今年上半年华北地区每个月的利润”,有数ChatBI可给出相应结果,并用自然语言描述了查询的逻辑与步骤。掌握SQL的专业人员可以点击“更多”按钮查看对应的SQL。如果逻辑有误,例如用户想看“订单日期”在上半年的数据,但是AI筛选的是“发货日期”,用户可点击“修改查询条件”进行对校正。
从产品发展的角度看来,网易数帆当下对于通用大模型和垂直行业大模型到底更偏向哪一方?
网易副总裁、网易杭州研究院执行院长、网易数帆总经理汪源对界面新闻等媒体表示,“原则上来讲,我们现在的实际情况是既做通用的大模型,也做垂直的大模型,这两者之间是支撑的关系,(但)最终的出口是做垂类的模型,而且是应用在我们所最关注的两个领域,一个是软件开发、一个是数据分析。”
他表示,为了做好垂类模型,团队本身需要一个“公共底座”,也就是网易“玉言”模型。目前,该模型由网易的核心实验室和行研的人工智能团队两个团队为主,后期会加入更多集团其他团队共同打造网易集团的大模型底座。
关键词:




海外需求增长持续拉动我国纺织服装产品出口
南宁铁路公安“寻包达人”两年收到旅客锦旗116面
齐齐哈尔市龙江县警方破获一涉案200余万元的“帮信”案件
北京市新增本土确诊病例7例、无症状感染者2例
浙江东阳警方通报:剧组因拍摄致猫死亡等事实不成立
天津大学留学生志愿者:同天津人民一起守护共同的家园
永远意气风发!平均年龄62岁的教授合唱团重阳节唱响
我国首颗太阳探测科学技术试验卫星“羲和号”成功发射
人社部副部长李忠:加强对中小微企业的服务 营造鼓励创新氛围
中国驻俄使馆与新疆维吾尔自治区政府共同举办“新疆是个











