AI时代,从“数据可视化”到“数据可视听化”

AI时代,从“数据可视化”到“数据可视听化”

刚讲完《数据可视化》这门课程,在现有教材的框架体系下,授课过程比较循规蹈矩,除了引入DeepSeek提高数据可视化的编程效率之外,其他仍是在传统知识框架内。其实AI时代,数据可视化有很多崭新的玩法,由于技术的新颖、时间不够充分和自己储备不足,很多领域尚未涉猎。因此,在这里做些总结和思考,主要聚焦在ToB和ToC领域的数据可视化产品、AI对数据可视化的增强以及从“数据可视化”到“数据可视听化”的

刚讲完《数据可视化》这门课程,在现有教材的框架体系下,授课过程比较循规蹈矩,除了引入DeepSeek提高数据可视化的编程效率之外,其他仍是在传统知识框架内。其实AI时代,数据可视化有很多崭新的玩法,由于技术的新颖、时间不够充分和自己储备不足,很多领域尚未涉猎。因此,在这里做些总结和思考,主要聚焦在ToB和ToC领域的数据可视化产品、AI对数据可视化的增强以及从“数据可视化”到“数据可视听化”的一些互联网新玩法等。

一 数据可视化的意义和概念

(一)意义

作为一名学生,我们希望做出漂亮的图表来充实课设和毕业论文,想把枯燥的教材文本、复杂的理论知识变成思维导图,变成视频,去提高学习的效率和增加学习形式的多样性。

作为教师,我们想把刻板、抽象的文本理论变成有意思的图片和教学视频,用来吸引学生的注意力,让课堂更生动,从而提升教学效果。

作为职场人士,我们想把工作成果,把单调的数字和汇报文本,变成漂亮的报表、图表、PPT等,让自己的汇报更出彩,作为自己升职加薪的筹码。

作为自媒体,我们想把漂亮的文案,做成漂亮的图片,做成吸引人的音视频,从而获取流量,进而实现商业变现。

(二)概念

基于这个意义,我们来谈谈数据可视化的概念。

传统意义上,数据可视化,通常是指用编程语言或商业bi工具来实现各种图表,从而将数据变得好看,将信息传递变得更有效率。编程语言通常是Python、R、Echarts、D3等,商业bi工具通常是FineBI、PowerBI、Tableau等。

在这个概念范畴下,我们需要学习大量的专业知识,花大量的时间来做数据可视化,这注定是一小部分专业人士的专业游戏,并非一个普罗大众的应用场景。另外,因为其专业性,意味着这项工作有门槛、有成本,因此“数据可视化”往往发生在B端,只有企业才会养这么一群专业的人士,去做专业的可视化图表,因此应用范畴是相对狭窄的。

在ai时代下,所有的逻辑都改变了,ai在解构专业性这个能力上,从来没有让人失望,比如用自然语言(或规范化的提示词)来进行编程和绘图。利用ai,非专业人士可以在最短的时间内,踏入专业领域的门槛。这个现象,在“数据可视化”这个专业领域上同样适用。

回到开头讲的数据可视化的意义,因为ai降低了门槛,提高了效率,也就大大提升了很多应用场景的可行性,学生、老师、职场人士、自媒体等各种角色都可以找到数据可视化的应用场景,因此数据可视化不再局限于B端,大量的C端用户,也可以参与到这个游戏进来,为自己服务,用数据可视化来取悦自己,来提升表达的效率。

在ai杠杆的助力下,我将数据可视化做了个定义:将抽象数据通过图形、音视频等视觉元素直观呈现,以帮助人们理解、分析和沟通信息的过程。这个过程可以发生在B端,也可以发生C端,最终的交付成果可以是图形、图表,也可以是音频、视频,这正是标题所谓的:AI时代,从“数据可视化”到“数据可视听化”。

(三)ToB和ToC的数据可视化

 我们通常把数据可视化的成果称之为“仪表盘”或“驾驶舱”,因为如果把企业这种庞大的组织比喻成飞机或汽车,正如仪表盘将关键驾驶信息集中展示一样,数据仪表盘可以将企业的核心业务指标(如营收、转化率)聚合在一个界面。此时,企业的高管们则拥有了在仪表盘面前运筹帷幄、沙场点兵的仪式感,这便是ToB层面的数据可视化。当然大部分的数据仪表盘都是面子工程,是高管们的权力游戏,企业一旦要节流,建议先砍掉这部分开支,这是后话。

如果我们只把数据可视化聚焦在ToB层面,则显得过于狭隘和无趣。在互联网背景下,C端拥有更庞大的群体,拥有更广阔的想象力和创造力空间。比如,在数据可视化的细分领域——文本数据可视化,当我们阅读一本书、一篇论文、一篇技术文章,为了取悦自己,为了提高知识的转化效率,我们对这些文本数据进行可视化,因此有了架构图、流程图、思维导图、视觉笔记等。当文本数据可视化之后,取悦自己的同时,取悦了更多有同样需求的用户,这便产生了流量,产生了自媒体,同时诞生了各种各样的服务于C端用户的可视化产品。尤其在AI的加持下,在文生图、文生音视频的多模态能力的支撑下,将会有大量的提高文本数据可视化生产效率的工具出现。

以下几张思维导图是传统时代下,B端和C端一些数据可视化工具,以及在AI增强后的一些新做法和新工具,本文也将一一介绍这些工具:


二 传统模式的数据可视化

(一)传统技术栈(或工具)

工欲善其事,必先利其器,数据可视化的实现工具繁多,由于数据可视化的主体不同、定位不同、难度不同,大体可以分为几类:

  • 入门级工具:Excel。

  • 编程语言:Echarts、D3、Python、R等。这类工具的受众是程序员,掌握编程语言,就是持有屠龙刀倚天剑,顶尖的高手可以用编程语言把数据可视化做成艺术品,比如下文提到的鸢尾花丛书中的《可视之美》。

  • 商业数据可视化平台:Tableau、PowerBi、FineBI等。这类平台的定位是“强大好用、人人可用的大数据分析工具”,基本上做到零代码,在平台上拖拉拽图表组件即可,使用者可以把精力关注在商业分析上。


值得一提的是,最近看到数据可视化领域的一本书《可视之美》,作者用Python把数据可视化做得跟艺术品一样,更难能可贵的是,作者在GitHub上开源了“鸢尾花书”学习资源,截至2024年5月,已经分享5000多页PDF、5000多幅矢量图、约3000个代码文件。开源地址详见下文的附录。

图片来自《可视之美》开源库

(二)图表

选用合适的图表工具,表达数据的含义,这是数据可视化的基本功。根据数据之间的比较、联系、分布和构成关系,粗陋的分成如下图几类:

图片来自《数据可视化基础与实践》

(三)ToC的数据可视化

以上关于工具和图表的介绍主要是针对ToB领域,作为个人而言,我们通常不会用excel或Python做一个柱状图,来分析自己的学习时间、读书时长或刷短视频的时间分布,这多少显得有点滑稽。C端的工具逻辑完全不一样,这里列举在ai时代来临之前,我们常见的几种文本可视化工具:

1.思维导图。提炼关键词,用树状分支结构整理逻辑关系,这是一种侧重逻辑分层的视觉表达方式,可谓国民级应用,无须赘述。

2.视觉笔记。通过手绘、图标和版式设计将信息图像化,帮助强化记忆和激发创意,更强调视觉表达。但是门槛也比较高,期待这方面的ai产品,将大大降低视觉笔记创作的门槛。极客时间有一门关于视觉笔记的课程,详见附录部分。

图片来自极客时间

3.Markdown的图表语法

     作为技术人员,还可以使用 Mermaid 语法来画图,这是是一种基于 Markdown的轻量级图表描述语言,可以直接嵌入到 Markdown 文档中,通过渲染引擎自动生成流程图、时序图、甘特图等。其优点在于像写代码一样画图,易于版本控制。DeepSeek和ChatGTP就是使用该语法来制图,如下图让DeepSeek画数据可视化的流程图时,使用了Mermaid代码,因此我们可以在与ai的信息流中直接显示图表:

三 AI时代下的数据可视化

(一)编程能力的增强

1.单项数据可视化任务:使用DeepSeek R1。对于一些零散的数据可视化任务,比如PPT里需要一张气泡图,论文里需要散点图矩阵来表达数据的关系,此时我们将数据投喂给DeepSeek,再提供图表模板代码(比如 https://echarts.apache.org/examples/zh/index.html),然后通过自然语言跟DeepSeek对话,他可以很快生成我们提供的数据所对应的可视化图表。

2.工程化的项目:使用cursor、Trae等。当数据可视化任务不是零敲细打的任务,而是系统化的软件工程时,比如基于Spring+VUE+Echarts的技术栈来实现可视化仪表盘,这种场景下,通用大模型就显得力不从心了,此时,AI Coding工具浓墨登场。AI Coding,作为大模型最能体现生产力的应用场景,作为衡量模型能力的关键标准,是兵家必争之地,因此这个赛道其卷无比,同样,AI Coding也将改变所有程序员的开发范式,每个技术从业者都将主动或被动的卷入其中。

(二)图形化能力的增强

数据可视化旨在借助于图形化手段,清晰有效地传达与沟通信息。因此图形是可视化的基本载体,这正好也是ai所擅长,自然语言+图形的结合滋生了大量有意思的产品,这里列举几个:

1.Napkin AI 

这是一款专为商业故事讲述而设计的AI视觉工具,核心功能是将文本转化为各种视觉内容,如信息图、图表、流程图等,从而帮助用户更快速、更有效地创建视觉素材和分享想法。 写论文、写公众号、做PPT需要制图时,有了这款文本可视化的ai利器,效率大大提升,这就是ai带来的高效生产力。

Clipboard---2024-09-12-11.15.30

 2.NotebookLM

这是一款Google的AI笔记应用。假如有这样的应用场景:我们要阅读多篇复杂的论文、期刊或者电子书籍,同时还想学习相关主题的视频,希望提高获取知识的效率。基于NotebookLM,我们可以把所有的笔记、论文、视频传给他,他能快速生成摘要、文献综述,快速生成思维导图,并且还能生成通俗易懂的对话型的播客。解读复杂文本,快速生成思维导图,这属于文本可视化的增强,生成播客,则是数据视听化的一种体现。

NotebookLM根据论文生成思维导图

NotebookLM生成播客

3.Recraft绘本插画

Recraft能通过自然语言描述自动生成风格化儿童插画,极大降低绘本创作门槛,意味着文本可视化这件事情,可以直接出绘本了,这将大大激发普通人的创作欲望。以下六宫格是我让ChatGPT提供6张图片的文本,为小朋友讲清楚什么是数据可视化,文本框架如下:

  • 图1:数字精灵登场。“米米的房间里,跑进了一群调皮的数字精灵!”

  • 图2:米米犯迷糊。“它们在说什么?米米一点也听不懂!”

  • 图3:魔法猫登场。“忽然,一只会魔法的小猫来了!”

  • 图4:魔法变变变!“小猫一挥棒,数字们排好了队!”

  • 图5:米米恍然大悟。“原来它们在告诉我我最爱吃什么!”

  • 图6:快乐学习时间。“小猫说:这就叫——数据可视化!”


然后将每张图片的文本输入给Recraft,很快生成如下六宫格的绘本:

当然,ai应用的普遍特点是从0到1非常爽,包括这里的绘本,编程领域的demo、高保真设计图等,而一旦要调整细节,一旦要让ai精确的调整局部区域,则是举步维艰。当然,这才是ai应用元年,所有的应用都在这一年井喷和爆发,未来还有很多优化和想象的空间。

(三)用自然语言进行数据可视化

1.字节火山引擎的Data Agent。字节在AI领域创造不少好产品,比如这个定义为新一代企业级 AI 数据专家的Data Agent,把企业沉淀的数据资产投喂给他,然后用自然语言提问,他能像数据分析师一样,帮我们做数据分析、数据可视化,生成数据分析报告,甚至生成营销策略。

Image

2.阿里DavaV数据可视化平台。同样的思路,DavaV支持文生看板、文生地图和文生图表等。这类平台将自然语言应用在数据分析和数据可视化领域,在生成可视化仪表盘方面可以大大提升效率。当然,与Data Agent一样,这类平台还应解决如何保障企业数据资产的数据安全问题。

图片

(四)传统可视化平台工具的ai增强

AI时代,这些老牌的商业数据BI平台也不甘人后,powerBI的copilot让用户可以通过自然语言提问来完成数据分析任务,并生成报告和可视化的功能。Tableau的ai则为用户提供了生成数据故事、数据解释和预测功能等。

四 从“数据可视化”到“数据可视听化”

关于“数据可视听化”,将其拆分成听觉和视觉两个角度,前者代表作是文生播客,后者则是文生视频。播客方面,关注下扣子空间和NotebookLM,视频方面,则列举最近比较火的《假如书籍会说话》。

(一)播客:扣子空间、NotebookLM。

这类产品将冗长的文本(论文、书籍等),以通俗易懂的对话形式的播客,让学习变得更高效,更有吸引力,如下图为扣子空间提供的将PDF内容转为播客的示例:

播客链接如下:

https://space.coze.cn/share/7514388382693359631?share_id=7514388382693507087&secret=9jYtHu8S&from=home_case_list

(二)文生视频的案例:假如书籍会说话。

最近非常火爆的解读书籍爆款短视频《假如书籍会说话》,这是一个非常典型的文本数据可视听化的案例,该博主通过两个角色对话的方式解读一本书的短视频形式,单个视频最高20多万的点赞,截至目前,有48个的作品,获得35万+的粉丝和85w+点赞。这个idea有意思的点在于:

  • 这是ai时代的产物。ai可以快速解构书籍,生成对话文本,ai可以做视频,ai可以做字幕,这些能力通常由多个智能体提供。而组合智能体形成新的产品,这个行为则由人来完成,

  • 视频高度结构化,但不影响观看体验。视频其实类似于播客的视频版,视频里有两个角色,主持人负责提问,书籍作为答疑者,每个作品的解构基本一致,这种一致性保证了视频的产出,毕竟人类的书籍浩如烟海,博主可以长期输出,灵感永不枯竭。

  • 这是文本可视化的高级应用。高质量的文本(来自于书籍)+AI杠杆=源源不断的高流量的短视频作品。


网上有很多拆解这些作品制作技巧的文章,有兴趣的同学可以看下附录的产品链接。

(三)文生学习视频:videotutor、秘塔

videotutor这个产品的slogan是“万物皆可问,知识一目了然”。用这款产品,我们提的任何问题,他都可以生成一段教学视频。类似的产品还有秘塔的“今天学点啥”。作为教育从业者,我会持续关注这类ai教育产品。

使用videotutor生成数据可视化的讲解视频

官方提供的物理题讲解例子

五 总结

AI时代,很多产品的逻辑都彻底颠覆了,包括数据可视化。这篇文章借题发挥,从小小的“数据可视化”领域入手,将这个概念的范畴扩大到“数据可视听化”,以及从传统的“B端”的领域,扩大到“C”端领域。毕竟,我们经常提及大模型的多模态能力:文本、视觉和听觉等,当涉及到跨模态生成,比如文本转换成视觉和听觉时,其实就是“数据可视听化”的范畴。正是由于ai的杠杆,大大降低了这个领域的门槛,使其变得普罗大众。

文章里介绍了很多“数据可视听化”的ai工具,由于水平有限、认知有限,这只是众多 ai 工具和 ai 新玩法中的沧海一栗。作为ai应用的元年,或者说ai智能体的元年,一切都刚刚起步,回想移动互联网时代的第一版微信(2011年1月发布),到今天庞然大物的微信,14年间经历过多少版本迭代。而显然,ai应用还尚未出现类似的超级应用,一切才刚刚开始。

当然,文章所讲的一些ai工具,很多还停留在“讲故事”的阶段,当我们真正把这些产品用在工作、学习时,还存在很多不尽如人意的地方,也需要学习很多与ai对话的技巧。但还是那句话,今年只是ai应用元年,未来还有很多想象空间。因此,作为普通人,每个人应该具备作品意识,唯有创作,无论是写作、做短视频、做图片、做播客、做app,只有去创作,才能打造ai发挥的舞台,而唯有用ai,才能跟上时代的这波浪潮。

附:产品链接

  • 《可视之美》

    https://github.com/Visualize-ML/

    https://gitee.com/higkoo/Book2_Beauty-of-Data-Visualization

  • 视觉笔记的课程:

    https://time.geekbang.org/column/intro/100050701

  • 扣子空间:https://space.coze.cn/

  • 谷歌的notebooklm:https://notebooklm.google.com/

  • 绘本制作:https://www.recraft.ai/

  • 文本视觉工具:https://www.napkin.ai/

  • 阿里datav:https://datav.aliyun.com/portal

  • 火山引擎的DataAgent:

    https://www.volcengine.com/product/DataAgent

  • 教学视频生成工具:videotutor:https://videotutor.io/

  • 秘塔今天学点啥:https://metaso.cn/study

  • 微信小视频:《假如书籍会说话》

  • Coze一键制作爆款短视频“假如书籍会说话”(扣子工作流拆解)

首页 发现
看过 我的