开始筹备 DataFunCon 线下大会后,我们整理了很多数据智能相关的内容点,这些点子像星星一样散落在天空,对于数据从业者来说都值得听。


(相关资料图)

但是,会场有限,内容太多,怎么办?还是要聚焦主题。

所以, 确定大会主题就成了第一件事 。

我们去采访了一些数据智能从业者,他们给出来的答案很直接。

Q: 你会出于什么目的参加行业大会?

A: 去参加行业大会,就是想看看行业有什么新东西。

——好, 大模型、AIGC、云原生大数据、信创等,当之无愧的热点和趋势,都安排上 。

Q: 除此之外,还有其他原因吗?

A: 我们也想看看自己在做的事情,别人是怎么做的。

——好, 指标体系、数据治理、推荐等,受众覆盖面广的内容,听的人也多,也被安排上 。

Q: 你觉得参加行业大会最大的收获是什么?

A: 最新的理论,看看论文也能了解,所以最稀缺的经验,还是了解一个技术架构的具体实现,碰到过的坑,不然还不如在家看论文。

——安排! 全部都要分享实践 !

这就是 DataFunCon 的主题:数据智能创新与实践 的由来。

我们既要讲行业的创新,也要讲具体模块的创新,同时,还要这些创新都讲实践。

对,这就是一个“既要……又要……还要”的大会。我们倾尽了DataFun所有的资源,只为给你展现一个创新与实践的大会。

大会的主题确定后,下一步就要筛选选题,做分论坛的设置。

这个时候我们还不知道,我们将要面对的,是20位专家评审的意见,以及整整9版一遍又一遍的讨论、修改、打磨。

前面3版,DataFun内容组确定了,要展示给用户的内容主线,即4大体系。

后面6版,经过对每一位专家评审的访谈,综合大家的意见后,我们确定了,具体给用户提供的内容板块,即16个分论坛。

本文先讲四大体系的由来。

这个行业创新的内容太多了,怎么组织内容,组织哪些内容,是个难点。我们最后决定,按照数据从生产到应用的流程体系来组织,因为数据的每个环节都很重要,也都有大量的从业者希望交流经验。所以 会议的体系化就变得很重要,这样可以不漏掉任何环节 。

数据经过采集、处理、存储等生产流程,成为企业的数据资源。基于业务需求和管理需求进行标准化、体系化治理,从而提升数据消费时的效能和价值,使数据进一步成为企业的资产组成。算法能力面向更复杂、高维数据的数据分析和预测方法,从模型架构、学习范式到训练目标,本身具有非常庞杂的生态和层次结构。而从推荐、风控到AIGC等智能应用,在特征、模型、业务逻辑等层次上都形成了专门化的模块阵列,支撑着日新月异的业务需求。

因此, 我们把数据智能拆分成生产、消费、能力、应用四个阶段,对应到DataFunCon的四大体系,即:数据架构、数据效能、算法能力、智能应用。

--

01

四大体系之数据架构

数据架构指的是采集何种数据以及在一个数据系统或组织内如何存储、管理、计算数据。 侧重于数据生产过程 ,包括数据采集、存储、计算。

这个生成过程使用的工具以及环境包括:

数据环境 :比如云原生等; 数据采集工具 ; 数据存储工具 :比如数据库、湖仓一体等; 数据计算工具 :比如Olap等;

数据架构是一切数据行为的基础,只有流畅的数据架构,才能保证数据正常、及时、稳定的生产。

--

02

四大体系之数据效能

数据效能指对数据消费过程的优化,提升数据消费的效率和能力。 侧重于数据消费过程。

数据消费过程中:

需要提升对 数据管理的能力 ,所以要进行指标体系建设、数据资产管理。 需要提升 数据被使用的能力 ,数据要对比才有意义,所以AB实验是数据使用的重大能力,是一个公司数据驱动的标志之一。 提升 数据交付的能力 :所以要有DataOps和MLOps。

如果说数据架构提供了数据流动的管道,数据效能工具则为管道设置了一道道质量和规范门控,并不断优化管道结构,让数据得其所用。

--

03

四大体系之算法能力

算法能力是数据使用的能力。集算法创新之力,筑算法赋能之基。创新的首要前提,就是要有足够多的理论储备,同时对算法本身有着非常深入的理解,包括其优缺点、适用场景等。

AI算法的组成具有多个层次,包括:

数据结构 :比如知识图谱等; 模型架构 :比如图神经网络、Transformer等; 学习范式 :比如预训练、对比学习、强化学习等; AI基础任务 :比如因果推断、可解释性等; AI技术 :比如自然语言处理、计算机视觉等;

在不同的阶段,通过优化数据质量、模型表达能力、模型效率、任务目标、场景结构等要素,实现最高效的智能预测,此即算法能力。AI算法可以最大化地挖掘高维异构数据中的复杂非线性关系,这是传统数学方法和计算机科学都难以做到的。

--

04

四大体系之智能应用

智能应用是数据使用的价值。人工智能算法从出现时,就伴随着落地场景薄弱的质疑声,但是随着AI产业从基础研究和技术研发走向成熟,应用场景也在迅速扩大。

相对传统的领域 :包括风控、推荐等,有着成熟的应用场景,算法层面也不断推陈出新;

新兴领域 :包括数字人、AIGC等,随着生成算法、大模型、多模态等AI技术的持续创新和发展成熟,也被应用于多种场景,不断为企业带来业务创新与经济效益;

针对业务需求,基于AI算法构建包括特征层、模型层、业务层等层次的技术架构,挖掘数据价值,为业务赋能,此即智能应用。智能应用最大的吸引力在于,我们还无法预计它的边界在哪里。

线下大会策划录

这个线下大会策划录系列,记录下我们策划会议的过程,我们始终是希望以用户为中心,关心用户成长。数据是冷的,但是 DataFun 是有温度的。 DataFun 的愿景是“成就百万数据智能开发者,助力万家企业数智化” ,我们是真的认真在做帮助行业成长的事情。

希望屏幕前的小伙伴,不要错过这场数据的盛宴。

大会门票获取

本次大会将设置 四大体系 ,即数据架构篇、数据效能篇、算法创新篇、智能应用篇。在本次大会中,你将领略到数据智能技术实践最前沿的景观。

会议特色:

1. 扎根实践

一线实践专家的工程经验输出,案例详实,粒度细致,方法论精辟。

2. 切中痛点

论坛和议题方向基于行业理解架构,切中行业关注点。

3. 紧跟前沿

精选每个方向的代表性机构和专家,分享顶尖实践经验和创新探索思路,从行业实践延伸至学术研究,促进双方交流和互相启发。

会议信息 :

⏰时间 :7月21日-22日

️ 地点 :北京·悠唐皇冠假日酒店

主办单位 :DataFun社区

大会门票获取:点击下方链接