网易数帆发布对话式BI产品试图抓住垂类大模型的机会

2023-08-11 09:07:18来源：界面新闻

8月10日，网易数帆发布了AIGC技术方向的对话式BI（商业智能）产品有数ChatBI，相较于目前正在流行的对话式产品，有数ChatBI主要想强调的属性在于“数据的可信”。

【资料图】

网易数帆大数据产品线总经理余利华表示，数字化时代，多个经营环节需要用数据支撑决策已经成为常态，企业数据分析需求量大幅度上升。

以网易数帆某客户为例，其月均数据分析需求量超过了200，策划、运营、用户体验、QA等不同岗位都提出了用数的需求，其中运营相关的临时或紧急的需求占比很高。但由于数据分析流程的专业性和分析人才的稀缺性，传统数据分析显得耗时而低效。

AI产品尽管可以帮助提升效率，其答案的可信度却很成问题。网易数帆方面表示，类ChatGPT产品并不能带来完全准确的回答，主要原因在于两点，首先，类ChatGPT产品更擅长处理自然语言文本数据相关任务，并非专门为数据分析而设计；其次，通用大模型可能存在捏造事实，也即“AI幻觉”，在BI领域可能是捏造字段，这在数据分析中可能成为致命问题。

于是，在数据分析领域对抗“AI幻觉”出现的可能性，成为有数ChatBI团队的首要任务之一。

余利华表示，“AI幻觉”的产生是由于训练数据不足、文本与表示之间的编解码错误等因素，于是团队打造可信的ChatBI需要在需求理解、过程验证、用户干预和产品运营四个方面着手。

具体而言，网易数帆需要借助大模型的语言理解能力，先进行用户的需求分析，并帮助BI初级使用者通过需求分析内容判断系统的取数步骤是否正确；过程验证指的是借助基于大模型的NL2SQL能力实现复核，余利华介绍，为了提升NL2SQL能力，网易数帆有针对性地定制生成和优化了超过30万不同类型的问法和SQL，目前调优出的NL2SQL领域模型，效果已达到GPT-3.5的水平；用户干预即将数据模型和查询条件结构化，用户可切换数据模型或者查询条件；产品运营方面则构建了运营反馈机制，用户可反馈数据准确性，管理员通过运营知识库、标记及优化badcase提升数据可靠性。

在实际应用中，以大型连锁超市的销售部门场景为例，产品人员输入“我想看今年上半年华北地区每个月的利润”，有数ChatBI可给出相应结果，并用自然语言描述了查询的逻辑与步骤。掌握SQL的专业人员可以点击“更多”按钮查看对应的SQL。如果逻辑有误，例如用户想看“订单日期”在上半年的数据，但是AI筛选的是“发货日期”，用户可点击“修改查询条件”进行对校正。

从产品发展的角度看来，网易数帆当下对于通用大模型和垂直行业大模型到底更偏向哪一方？

网易副总裁、网易杭州研究院执行院长、网易数帆总经理汪源对界面新闻等媒体表示，“原则上来讲，我们现在的实际情况是既做通用的大模型，也做垂直的大模型，这两者之间是支撑的关系，（但）最终的出口是做垂类的模型，而且是应用在我们所最关注的两个领域，一个是软件开发、一个是数据分析。”

他表示，为了做好垂类模型，团队本身需要一个“公共底座”，也就是网易“玉言”模型。目前，该模型由网易的核心实验室和行研的人工智能团队两个团队为主，后期会加入更多集团其他团队共同打造网易集团的大模型底座。

关键词：