Featured image of post 整理AI产品,初探内在特质

整理AI产品,初探内在特质

自我介绍

一名AI 探路人,相信AI可以给你带来一坛酒——辛辣,但解恨。

AI 是个筐,我用它装酒?

记得22年底:ChatGPT 火爆国内外时,觉得有必要玩一下。废了半天劲注册帐号、开通国外信用卡,结果问它工作中的问题:有时很惊艳,有时看它睁眼说瞎话(同事说那会经常听到我对gpt说“are you sure”这句话)。当时用下来,觉得用它生成一些结构化的文档还挺方便的,慢慢地就把它当作一个工作助手。

一年前,利用AI 文生图、文生视频火起来。群里出现教大家注册相关平台帐号,倒卖帐号,制作创意视频的案例。

半年多前,AI 编程工具火起来。一小时上手开发个网站、做个游戏。

今年过年前,DeepSeek 问世,感慨终于有自己的大语言模型了。我自己也折腾了在PC上用游戏显卡本地运行DeepSeek-r1的方案: 体验了带推理能力的大模型和之前的不同。

最近,MCP RAG Agent 一堆概念又火出圈,逐渐向着更细致的行业和工作场景延伸。

不难发现AI 圈有两个趋势:

  1. AI 的这个“大筐”里装的东西越来越多;
  2. AI 的发展和应用在向着工作场景加速,不再是刚开始那个“are you sure?” 的助手了。

那下一步,AI 是不是就会取代你我的岗位了?AI的边界在哪里? 所以,近期打算输出一些 自己在AI道路上的内容。献丑了 ^^||

今天是第一篇: 整理AI产品,初探内在特质

市面上这么多AI 产品,能不能分个类?

最早,我自己对于 AI分类是非常模糊的,感觉就像老师布置了个作业:要大家“把所有的豆子进行分类”。

内心OS: 我豆子都认不全,咋分类——要么 按颜色分?要么按味道分?要么按形状分?——圆的一类,扁口的一类。

但以后的AI产品肯定会诞生 各种形态的:说不准哪天再出来个“三角形”的,到时继续建新的类目?所以,只凭外观性状去分类肯定是不行的,按照术语说这叫没法穷尽——

这里找AI 介绍下分类原则:

  1. 同一标准原则 分类时必须采用同一标准(维度、角度),不能混用多个标准。 例如:以“颜色”分类水果时,只能按颜色分组,不能同时按大小、产地混合分类。

  2. 相互排斥原则 各类别之间互不重叠,每个事物只能归入一个类别。 例如:以“性别”分类人群,男性和女性互不重叠。

  3. 完全穷尽原则 分类应覆盖所有被分类对象,没有遗漏。 例如:以“季节”分类,一年四季(春夏秋冬)应涵盖全年。

  4. 层次分明原则 分类应有清晰的层次结构,上下级关系明确。 例如:动物→哺乳动物→犬科动物→狗。

  5. 同类相从原则 同一类别中的事物应具有本质相同或相似的属性。 例如:以“使用场合”分类鞋子,运动鞋、皮鞋、拖鞋各归一类。

  6. 单一归属原则 一个对象在同一分类体系下只能归属于一个类别(与相互排斥原则类似)。

  7. 具体明确原则 分类标准和类别定义应具体、明确、易于理解和操作。

如果从 AI 产品诞生的维度看,不外乎以下四个方面: AI 分析并实现用户意图的能力;用户需要调试AI的深度;用户给AI提供多少已有数据; 用户的预期。不同的AI 产品在这四个维度上,会有侧重的能力和应用场景。

AI 能力
调试AI复杂度
数据源
用户预期 AI 的优势 产品案例
- - - - 辅助查找问题&信息 AI chat,AI 知识问答
- - 普通人 也体会到之前有的工作,可能就是一句话的事情 文生图,文生视频,文生广告设计,使用OLLAMA 本地集成大语言模型
进一步考虑把AI 引入到工作中去,去处理那些难度不高 但重复性高的工作 AI 合同评估; AI 文档处理(概括 or 扩容);AI 邮件发送
⭐⭐ - 切入商业环境,做有SOP路径的工作流平台。承担一个完整工作流的工作 企业AI 知识库,AI 客服机器人
⭐⭐ ⭐⭐⭐ ⭐⭐ ⭐⭐ 进一步进入商业环境,做多个路径的工作流。承担一个岗位面临多个工作流的工作。 AI 医生,AI HR, AI 老师,AI 律师
⭐⭐⭐ ⭐⭐⭐ ⭐⭐ ⭐⭐ 供某个行业使用的大模型,往往在通用模型基础上针对性训练。 医疗通用大模型;芯片设计通用模型;教育通用模型
⭐⭐⭐ ⭐⭐⭐ ⭐⭐⭐ ⭐⭐⭐ 各大公司 研发大模型,希望在自己商业体系中 覆盖行业&客户的需求。 千问 gpt deepseak 豆包

这么多AI 产品有没有递进关系?

考虑到AI产品和组件会快速发展下去,其中基座肯定是LLM大模型,但是组件之间又是平行的关系——没有必选的组件,而是根据使用场景把它集成进来。所以,我是打算从为用户提供价值的角度来分个层级,层级和层级之间是递进的关系。

比如:用户是希望整合现成的接口,那AI 就负责上下文记忆、整理和遵循现有工具处理这些数据就好了。 这种应用场景案例有:先需求生文字,文生图片和视频,然后调用工具把文字和视频对齐,就生成一条短视频啦。

然后,用户觉得只对接现有的接口还不够,希望利用AI的专家推理能力,结合用户自己的知识库,整合成符合特定行业需求的高级助手。这种场景的案例有:cursor claude 等编程工具,用户把自己的需求和项目框架讲清楚,这些工具可以基于已训练出来的代码能力,生成相应功能的代码 交付用户使用。

还是上面这种场景,用户需要更高的确定性:尽可能降低相同输入却不同输出的不一致性。就需要使用可定制的工作流平台——去明细每一个步骤做什么、输入什么、输出什么。这种场景案例,肯定就是基于coze dify 这种工作流平台诞生的应用了。如:HR 助手,合同助手等针对特定岗位的助手应用。

最后,少数头部玩家,肯定不满足于少数几个岗位的助手类应用,他们需要的是覆盖行业甚至更通用范式的大模型,例如 跨医疗领域大模型,它可以高效&准确的处理 整个行业中的高价值环节。

所以,从以上用户需求角度分析的话,分这么四个层级:

阶段 成本 通用性 确定性
自然语言识别和功能集成能力 ⭐⭐⭐ -
特定领域推理能力 ⭐⭐
受控制的调试&对接能力 ⭐⭐ ⭐⭐
基于行业的通用识别&推理能力 ⭐⭐⭐ ⭐⭐⭐ ⭐⭐⭐

如果从工作场景的角度出发,我更看好第三层级,因为这里AI的使用在成本和质量方面取得了较好的平衡

AI这么厉害,有没有它做不了的?

  1. 它目前还只存在于数字空间,不能送外卖,也不能捏个脚。

    目前只在特定场景下,AI 和人类进行数字交互是没问题的。平时购物时,就可以感受到各大电商平台的客服 回答那些高频问题时是很准的。

    而其他领域,有待AI 进一步升级、进化 。可以想像未来某一天,AI 宠物 可以存储宠物数据平台生成的定制化宠物性格,并实时处理外接的反馈和动作。

  2. 违反社会伦理、道德、法律的事情做不了。例如:下面这个问题——

  3. 还有一种是无法结构化的事情:它能猜你想要的,例如基于人类某时刻的感受和情感做一幅画,但生成的内容质量不可控。

好啦,先说这么多。下期打算先从coze 入手,展示场景一中个人助手的小案例。

Licensed under CC BY-NC-SA 4.0