8月10日,网易数帆发布了AIGC技术方向的对话式BI(商业智能)产品有数ChatBI,相较于目前正在流行的对话式产品,有数ChatBI主要想强调的属性在于“数据的可信”。
(相关资料图)
网易数帆大数据产品线总经理余利华表示,数字化时代,多个经营环节需要用数据支撑决策已经成为常态,企业数据分析需求量大幅度上升。
以网易数帆某客户为例,其月均数据分析需求量超过了200,策划、运营、用户体验、QA等不同岗位都提出了用数的需求,其中运营相关的临时或紧急的需求占比很高。但由于数据分析流程的专业性和分析人才的稀缺性,传统数据分析显得耗时而低效。
AI产品尽管可以帮助提升效率,其答案的可信度却很成问题。网易数帆方面表示,类ChatGPT产品并不能带来完全准确的回答,主要原因在于两点,首先,类ChatGPT产品更擅长处理自然语言文本数据相关任务,并非专门为数据分析而设计;其次,通用大模型可能存在捏造事实,也即“AI幻觉”,在BI领域可能是捏造字段,这在数据分析中可能成为致命问题。
于是,在数据分析领域对抗“AI幻觉”出现的可能性,成为有数ChatBI团队的首要任务之一。
余利华表示,“AI幻觉”的产生是由于训练数据不足、文本与表示之间的编解码错误等因素,于是团队打造可信的ChatBI需要在需求理解、过程验证、用户干预和产品运营四个方面着手。
具体而言,网易数帆需要借助大模型的语言理解能力,先进行用户的需求分析,并帮助BI初级使用者通过需求分析内容判断系统的取数步骤是否正确;过程验证指的是借助基于大模型的NL2SQL能力实现复核,余利华介绍,为了提升NL2SQL能力,网易数帆有针对性地定制生成和优化了超过30万不同类型的问法和SQL,目前调优出的NL2SQL领域模型,效果已达到GPT-3.5的水平;用户干预即将数据模型和查询条件结构化,用户可切换数据模型或者查询条件;产品运营方面则构建了运营反馈机制,用户可反馈数据准确性,管理员通过运营知识库、标记及优化badcase提升数据可靠性。
在实际应用中,以大型连锁超市的销售部门场景为例,产品人员输入“我想看今年上半年华北地区每个月的利润”,有数ChatBI可给出相应结果,并用自然语言描述了查询的逻辑与步骤。掌握SQL的专业人员可以点击“更多”按钮查看对应的SQL。如果逻辑有误,例如用户想看“订单日期”在上半年的数据,但是AI筛选的是“发货日期”,用户可点击“修改查询条件”进行对校正。
从产品发展的角度看来,网易数帆当下对于通用大模型和垂直行业大模型到底更偏向哪一方?
网易副总裁、网易杭州研究院执行院长、网易数帆总经理汪源对界面新闻等媒体表示,“原则上来讲,我们现在的实际情况是既做通用的大模型,也做垂直的大模型,这两者之间是支撑的关系,(但)最终的出口是做垂类的模型,而且是应用在我们所最关注的两个领域,一个是软件开发、一个是数据分析。”
他表示,为了做好垂类模型,团队本身需要一个“公共底座”,也就是网易“玉言”模型。目前,该模型由网易的核心实验室和行研的人工智能团队两个团队为主,后期会加入更多集团其他团队共同打造网易集团的大模型底座。