04 — 数据与算法

数据与算法

你每天都在用的思维方式,只是不知道它叫算法

什么是数据

数据就是信息的记录方式。菜市场的价格牌是数据,你手机里的通讯录是数据,银行流水单也是数据。任何被写下来、存起来的信息,都是数据。

💡
生活类比
想象你在菜市场,每个摊位上的价格牌就是一条数据。把所有摊位的价格牌收集起来,就变成了一个数据集——你可以比价、找最便宜的摊位。
📝
文字
你的名字、聊天消息
🔢
数字
价格、分数、温度
📸
图片
自拍、截图、海报
🎵
声音
语音消息、音乐

数据怎么存

就像整理房间一样,数据也需要一个存放的方式。结构化数据就像 Excel 表格,整整齐齐,每列都有明确含义;非结构化数据就像你手机相册里的照片,没有固定格式但内容丰富。

🗄️
三种存法
Excel 表格 — 行列分明,适合存规整的数据(比如全班成绩)
文件柜 — 按类别塞文件夹,什么都能放(照片、文档、视频)
图书馆索引卡 — 一张卡片记录关键信息,帮你快速找到原始资料
👉 点击表格中的单元格来编辑内容,试试修改数据
1
2
3
名字水果数量
小明 苹果 3
小红 香蕉 5

什么是数据库

数据库就像图书馆的电子检索系统。图书馆有几百万本书,你不可能一本一本翻——输入关键词,系统帮你秒级定位。数据库对数据做的事完全一样。

什么是算法

算法就是做事的步骤——就像做菜的菜谱。步骤明确、顺序清晰、谁照着做结果都一样。你每天早起的流程(闹钟响 → 起床 → 刷牙 → 出门)就是一个算法。

🍳
菜谱就是算法
「西红柿炒蛋」的做法就是一个算法:打蛋 → 切西红柿 → 热油 → 炒蛋 → 放西红柿 → 调味 → 出锅。每一步都明确,顺序不能乱。

🫖 泡茶算法 — 排出正确顺序

👉 上下拖拽步骤卡片,排出泡茶的正确顺序
1
2
3

排序算法可视化

你在网购时按价格排序,手机按时间排列照片——这些背后都是排序算法。冒泡排序是最直观的一种:像水里的气泡一样,大的数字一个一个「浮」到后面。

👉 点击「开始排序」,观察柱子如何两两比较、交换位置
1
2
3
速度 5x
点击按钮开始排序

AI 与数据的关系

AI 就是从大量数据中找规律的算法。它不是凭空变聪明的,而是看了海量的例子之后,学会了「举一反三」。

🐱
看猫学猫
给 AI 看了一万张猫的照片之后,它就学会了认猫——尖耳朵、胡须、毛茸茸。这和小孩学认东西一个道理,只是 AI 的学习速度快得多。
📦
收集数据 — 大量的照片、文字、声音
🔍
找到规律 — 算法从数据中自动发现特征
🧠
形成模型 — 把规律总结成一套判断标准
做出预测 — 看到新数据时,能做出判断

数据是原料,算法是配方,AI 是厨师

三者缺一不可,但核心永远是数据的质量