Skip to content

Latest commit

 

History

History
45 lines (33 loc) · 4.45 KB

notes.md

File metadata and controls

45 lines (33 loc) · 4.45 KB

algo teams and orgs

What is happening now?

  • 大大降低研发面向某个任务的模型的时间,通过LLM/ChatGPT的能力,可快速将任务效果做到70/80分。
  • 第一阶段:工作将聚焦到业务流程、算法流程的能力上,更加花时间再任务定义、价值分析、数据分析、数据准备、相关工具开发。 这个阶段,算法容易和产技有踩脚,但如果这个算法人员能做得比较好,职业上可以发展到AI产品负责人,从而获得更高的职位。
  • 第二阶段:从80到90分。然而,80分的算法能力无法交付业务,需要做算法突破。算法突破包括以数据为中心的技术、以模型为中心的技术、以架构为中心的工作。
    • 以数据为中心,需要研发如数据清洗、增强、主动学习、AIF等技术,让模型学到深水区。
    • 以模型为中心,需要围绕模型本身能力提升,去做如损失函数、模型内部信息传递架构、知识融合、训练机制等工作。
    • 以架构为中心,需要围绕学习范式进行研究,如需要数据驱动、还是知识驱动的方法,是大模型做多任务、还是大小模型协同、还是RAG的的方法,有没有条件做agent的架构,等等。 当然,这个阶段,需要对业务有更深刻的理解,需要深入看数据case、业务case,去支撑以上研究获得真正的业务效果提升。因此,这个阶段做得多的人,可以成为领域稀缺的资深技术专家,在很多企业发展中后期非常需要。

大模型研究人员的几个阶段

  • 第一阶段:懂运转的机理,有踩过大规模预训练的坑。
  • 第二阶段:做过实际落地的项目,特别是老链路升级到大模型的项目,有与各个职能团队撕过的经历。
  • 第三阶段:充分考虑过投入产出比,有主导/发起过大模型项目,其他职能团队开始抱你大腿,一起拿到结果。
  • 第四阶段:有对某垂直领域用大模型做变革经历,改变了这个领域的生产关系。

新人工智能时代

认知协作革命。千百年前,人类的知识存储在物理载体上;从30年前开始,互联网成为人类存储知识的主流介质;现在,人类的知识体系被构建在GPT(生成式预训练模型)、通义千问等大模型中。随着人工智能大模型应用的普及,传统的关键词检索将转变为自然语言人机交互新模式,这是对人类知识存储、检索和使用方式的一次重构。新的人机交互也将带来协作革命,人工智能大模型驱动的人工智能体会逐步深度嵌入各类组织的需求定义、应用开发、运维管理和资源调度等环节。以钉钉为例,未来预计将有1000万个人工智能助理在钉钉上产生,一场组织的智能化革命正在开启。

Refs

外部厂商的模型越来越能解决业务问题,我们还要做么

第一:理想情况

我们必须拥抱这样的变化,快速正确接入外部能力,工程和算法架构上必须有这样的适配能力。这个适配能力包括 1)业务流抽象。即可适配不同层级的AI API。有些高级API可以直接给结果,有些原子API需要我们进行包装。 2)数据抽象。不同层级API,我们需要对业务数据面向任务进行包装,去适配。 以上两点的设计,不要重蹈覆辙,及出现大量的碎片。 3)微调能力。a)如果使用无好的效果,则需要去深度调整,主要指算法部分。b)成本。基于开源模型进行平替。 4)业务创新能力。搭建员工AI workspace,和社区。

第二:实际情况 1)目前开箱即用的AI,仍然无法保障在业务中使用的准确性和不出现幻觉。 2)特别在更新较多的业务场景,不断对箱即用的AI进行修补,带来了新的复杂度,生产力并没有提升。

结论: 设计新的架构,充分用好通用开箱即用的AI,构建业务数据及生产壁垒,合理设计通用开箱即用的AI与领域内专业AI的协同架构;把创新纳入考核;把个人效率变成组织效率。 处在某个业务或是行业的算法,定位没有发生改变,只是我们算法设计的思路变了,具体工作包括:1)用开箱即用的AI进行业务原型开发或调优;2)设计两个AI的负责范围;3)构建数据;4)迭代AI;5)抽象业务成多个细分问题,从1)开始。